MAGAZIN
Die Autoren: Der folgende Beitrag entstand in Zuge einer Vortragsreihe zum Thema „Hochauflösende Audio-Formate“ von Lothar Kerestedjian, Geschäftsführer des Download-Portals HighResAudio.com sowie Matthias Stirner, technischer Redakteuer bei HighResAudio.com. Der Text wurde avguide.ch freundlicherweise zur Publikation zur Verfügung gestellt.
 

Musikstücke auf HighResAudio.com werden nicht wie auf herkömmlichen Download-Portalen als MP3, AAC oder WMA, sondern ausschliesslich in hochauflösenden Formaten angeboten. Zum Repertoire von HighResAudio.com gehören die Formate FLAC, ALAC, DXD und DSD. Jedes dieser Formate ist in der Lage, Klang hochauflösend und ohne Verluste wiederzugeben. Sie ermöglichen Ihnen dadurch im eigenen Wohnzimmer, am PC oder im Fahrzeug eine Klangqualität, die ansonsten professionellen Studios vorbehalten ist.

Im Folgenden stellen wir Ihnen einige hochauflösende Audio-Formate vor und erklären deren grundsätzliche Funktionsweise.

Da von den durch HighResAudio.com unterstützten Formaten FLAC das bekannteste und am besten unterstützte ist, besprechen wir das Format im Detail und gehen im Anschluss kurz auf ALAC, DXD und DSD ein. Wir erklären Ihnen die grundsätzliche Funktionsweise eines digitalen Audioformats, die Bedeutung hoher Auflösung bei Audioformaten und dessen Auswirkungen auf die Klangqualität.

Zu guter Letzt erläutern wir, warum unabhängig von Ihrem Audio-Equipment ein Format wie FLAC, ALAC, DXD und DSD geläufigeren Formaten wie MP3 grundsätzlich vorgezogen werden sollte.

Musikstücke auf HighResAudio.com werden nicht wie auf herkömmlichen Download-Portalen als MP3, AAC oder WMA, sondern ausschliesslich in hochauflösenden Formaten angeboten. Zum Repertoire von HighResAudio.com gehören die Formate FLAC, ALAC, DXD und DSD. Jedes dieser Formate ist in der Lage, Klang hochauflösend und ohne Verluste wiederzugeben. Sie ermöglichen Ihnen dadurch im eigenen Wohnzimmer, am PC oder im Fahrzeug eine Klangqualität, die ansonsten professionellen Studios vorbehalten ist.

Im Folgenden stellen wir Ihnen einige hochauflösende Audio-Formate vor und erklären deren grundsätzliche Funktionsweise.

Da von den durch HighResAudio.com unterstützten Formaten FLAC das bekannteste und am besten unterstützte ist, besprechen wir das Format im Detail und gehen im Anschluss kurz auf ALAC, DXD und DSD ein. Wir erklären Ihnen die grundsätzliche Funktionsweise eines digitalen Audioformats, die Bedeutung hoher Auflösung bei Audioformaten und dessen Auswirkungen auf die Klangqualität.

Zu guter Letzt erläutern wir, warum unabhängig von Ihrem Audio-Equipment ein Format wie FLAC, ALAC, DXD und DSD geläufigeren Formaten wie MP3 grundsätzlich vorgezogen werden sollte.

Das Audioformat FLAC

Free Lossless Audio Codec oder kurz, FLAC ist das gebräuchlichste Format für verlustfreie und hochauflösende Audiodateien. Der Codec ist frei verfügbar und die Nutzung nicht durch Patente eingeschränkt.Free Lossless Audio Codec oder kurz, FLAC ist das gebräuchlichste Format für verlustfreie und hochauflösende Audiodateien. Der Codec ist frei verfügbar und die Nutzung nicht durch Patente eingeschränkt.

Die Audioformate ALAC, DSD, DXD

Wie berets erwähnt, kann das menschliche Gehör Schall nur im Bereich zwischen 16 Hz bis maximal 20 kHz verarbeiten.

Wir haben auch erwähnt, dass aufgrund des Nyquist-Shannon-Theorems in einem digitalen Audiosignal mindestens das doppelte der maximal wiederzugebenden Frequenz gespeichert werden muss, also in diesem Fall 40 kHz. Sie werden sich nun fragen: Warum brauche ich Auflösungen oberhalb 40 kHz, wenn doch MP3 und die Audio-CD bereits eine mehr als ausreichende Auflösung bieten?

Das Problem liegt im Detail: Schallwellen in der Natur, auch solche, die durch Musikinstrumente erzeugt werden, halten sich nicht an die vom menschlichen Gehör vorgegebenen Beschränkungen und erreichen auch höhere Frequenzen als 20 kHz. Mit anderen Worten enthält Musik auch Bestandteile, die Sie nicht hören können, welche aber durch Mikrofone aufgezeichnet werden können.

Nun braucht es Sie zwar eigentlich nicht zu stören, dass nicht hörbare Bestandteile in einer Musikdatei nicht vorhanden sind, jedoch müssen die höherfrequenten Bestandteile bei der Umwandlung in das jeweilige Audioformat entfernt werden.  Die Aufnahme muss mittels eines Tiefpassfilters nachbearbeitet werden, da andernfalls Reste dieser Bestandteile innerhalb der Aufnahme verbleiben und den Hörgenuss stören. 

Die Vorteile von hochauflösendem Audio

Digitalisierung von analogen Audiosignalen

Der Unterschied bei der Quantisierung von analogen Audiosignale mit hoher und niedriger Bit-Tiefe. Unten sind es lediglich 3-Bit.Der Unterschied bei der Quantisierung von analogen Audiosignale mit hoher und niedriger Bit-Tiefe. Unten sind es lediglich 3-Bit.

Die Audioformate ALAC, DSD, DXD

Unterschiedliche Auflösungen

Quelle: http://en.wikipedia.org/wiki/File:PCM-vs-DSD.svgQuelle: http://en.wikipedia.org/wiki/File:PCM-vs-DSD.svg
Quelle: http://en.wikipedia.org/wiki/File:PCM-vs-DSD.svgQuelle: http://en.wikipedia.org/wiki/File:PCM-vs-DSD.svg

Unterschiedliche Auflösungen

Der Unterschied bei der Quantisierung von analogen Audiosignale mit hoher und niedriger Bit-Tiefe. Unten sind es lediglich 3-Bit.Der Unterschied bei der Quantisierung von analogen Audiosignale mit hoher und niedriger Bit-Tiefe. Unten sind es lediglich 3-Bit.
Quelle: http://en.wikipedia.org/wiki/File:PCM-vs-DSD.svgQuelle: http://en.wikipedia.org/wiki/File:PCM-vs-DSD.svg
Free Lossless Audio Codec oder kurz, FLAC ist das gebräuchlichste Format für verlustfreie und hochauflösende Audiodateien. Der Codec ist frei verfügbar und die Nutzung nicht durch Patente eingeschränkt.Free Lossless Audio Codec oder kurz, FLAC ist das gebräuchlichste Format für verlustfreie und hochauflösende Audiodateien. Der Codec ist frei verfügbar und die Nutzung nicht durch Patente eingeschränkt.

Bei DSD wird das Audiosignal zwar auch digital abgetastet, aber es werden nicht die gemessenen Spannungen selbst, sondern deren Änderungen gespeichert. DSD basiert auf der Delta-Sigma-Modulation. Mathematisch ausgedrückt entsprechen die PCM-Samples den eigentlichen Funktionswerten, die DSD-Samples den jeweiligen Ableitungswerten bzw. der Änderung am jeweiligen Punkt.

Auch hier kommen die Dimensionen der Zeit, der Präzision und der Räumlichkeit zum Tragen. Die SA-CD setzt dabei auf eine Präzision von nur 1 Bit, aber arbeitet mit 2'822'400 Samples pro Sekunde. Letztendlich wird dadurch eine sehr genaue Rekonstruktion des ursprünglichen Signalverlaufs ermöglicht. Eine schematische Darstellung der DSD-Technik zeigt die Abbildung oben. Es wird vermutet, dass DSD herkömmlichen, auf PCM basierenden Formaten grundsätzlich überlegen ist, jedoch liessen sich entsprechende Vermutungen bislang nicht belegen.

Quelle: http://en.wikipedia.org/wiki/File:PCM-vs-DSD.svgQuelle: http://en.wikipedia.org/wiki/File:PCM-vs-DSD.svg

Die meisten Audioformate speichern das digitale Signal nicht unkomprimiert im PCM oder DSD-Format, sondern setzen auf verlustfreie und verlustbehaftete Techniken der Datenkompression zur Reduktion der Datenmenge.

Die gängigen Formate MP3, AAC und WMA nutzen ein sogenanntes psychoakustisches Modell, um nicht hörbare Bestandteile eines Audiosignals zu entfernen. Ein sehr gutes psychoakustisches Modell ermöglicht so Einsparungen um den Faktor 20. Die entsprechenden Verluste in der Wiedergabequalität sind zwar vorhanden, können oft aber nur von geschulten Hörern im direkten Vergleich zum Original erkannt werden. Bei der verlustbehafteten Kompression mittels des psychoakustischen Modells und dem Einsatz entsprechender Audioformate bleiben jedoch zwei Dinge zu bedenken:

  1. Nicht jedes psychoakustische Modell verrichtet gute Arbeit. Viele MP3-Coder, die heute noch im Einsatz sind, setzen auf veraltete Modelle aus der Anfangszeit der Forschung und erreichen so grundsätzlich nur schlechte Wiedergabequalität
  2. Die Preise für Datenspeicher sind seit der Entwicklung von MP3, WMA und AAC stark gesunken. War MP3 früher angesichts begrenzten Speicherplatzes die einzige Option, so haben Sie heute die Wahl. Setzen Sie weiterhin auf verlustbehaftete Formate so tauschen Sie eventuell Hörgenuss gegen Speicherplatz ein.


Die Audioformate FLAC, ALAC und DXD nutzen verlustfreie Kompressionstechniken. Diese führen zu keinen (zusätzlichen) Verlusten in der Wiedergabequalität, da sie nur die digitale Repräsentation der Daten verändern. Mittels verlustfreier Kompressionstechniken sind Einsparungen um den Faktor 2 im Vergleich zur unkomprimierten Grösse der komprimierten Audiodaten möglich.

Im nächsten Kapitel erklären wir Ihnen die Vorteile hochauflösenden Audios für Sie, den Endkunden und Hörer.

Die Vorteile von hochauflösendem Audio

Wie berets erwähnt, kann das menschliche Gehör Schall nur im Bereich zwischen 16 Hz bis maximal 20 kHz verarbeiten.

Wir haben auch erwähnt, dass aufgrund des Nyquist-Shannon-Theorems in einem digitalen Audiosignal mindestens das doppelte der maximal wiederzugebenden Frequenz gespeichert werden muss, also in diesem Fall 40 kHz. Sie werden sich nun fragen: Warum brauche ich Auflösungen oberhalb 40 kHz, wenn doch MP3 und die Audio-CD bereits eine mehr als ausreichende Auflösung bieten?

Das Problem liegt im Detail: Schallwellen in der Natur, auch solche, die durch Musikinstrumente erzeugt werden, halten sich nicht an die vom menschlichen Gehör vorgegebenen Beschränkungen und erreichen auch höhere Frequenzen als 20 kHz. Mit anderen Worten enthält Musik auch Bestandteile, die Sie nicht hören können, welche aber durch Mikrofone aufgezeichnet werden können.

Nun braucht es Sie zwar eigentlich nicht zu stören, dass nicht hörbare Bestandteile in einer Musikdatei nicht vorhanden sind, jedoch müssen die höherfrequenten Bestandteile bei der Umwandlung in das jeweilige Audioformat entfernt werden.  Die Aufnahme muss mittels eines Tiefpassfilters nachbearbeitet werden, da andernfalls Reste dieser Bestandteile innerhalb der Aufnahme verbleiben und den Hörgenuss stören. 

Die zwei folgenden zwei Abbildungen illustrieren unterschiedliche Auflösungen. Die gezeigten Abbildungen wurden aufwändig erstellt durch das Pinguin Ingenieurbüro (www.masterpinguin.de) unter Leitung von Dipl.-Ing. Ralf Kessler. Zum Einsatz kam dabei PGAMM, ein Pinguin Audio Spektrometer.

Die horizontale Achse repräsentiert die Zeit, die vertikale Achse die Frequenz. Desto mehr ein bestimmter Bereich zur Farbe Rot tendiert, desto dominanter, also lauter sind die entsprechenden Frequenzanteile des Audiosignals an der jeweiligen Stelle.

highresaudio.comhighresaudio.com
Diese Abbildung zeigt die Aufnahme in Ihrem vollen Frequenzumfang. Sie wurde anhand einer Aufzeichnung mit 96 kHz / 24 Bit erzeugt. Bei einer solchen Aufnahme können Sie sich sicher sein, dass Ihnen nichts entgeht - der volle Hörgenuss ist garantiert.Diese Abbildung zeigt die Aufnahme in Ihrem vollen Frequenzumfang. Sie wurde anhand einer Aufzeichnung mit 96 kHz / 24 Bit erzeugt. Bei einer solchen Aufnahme können Sie sich sicher sein, dass Ihnen nichts entgeht - der volle Hörgenuss ist garantiert.

Lesen Sie auch das Interview mit Lothar Kerestedjian zum Thema High Resolution Downloads

Mehr zu den Vorzügen von DSD im Detail erfahren Sie im avguide.ch Grundlagenartikel zu DSD- Direct Stream Digital.