Multimedia-Gateway für mobile Clients

Audio

Zur Digitalisierung eines analogen Audiosignals wird dieses mit einer bestimmten Samplingrate abgetastet und die so erhaltenen Werte abgespeichert. Bei der Pulse Code Modulation (PCM) wird jeder Abtastwert quantisiert und als Integer abgespeichert, wobei eine sehr große Anzahl Bits entsteht. Um den benötigten Speicherplatz zu verringern, werden bei der Differential Pulse Code Modulation (DPCM) nur die Differenzen aufeinander folgender Abtastwerte abgespeichert, was zur deutlichen Reduktion der Bitanzahl bei gleicher Qualität gegenüber der PCM führt. Bei der Adaptive DPCM (ADPCM) wird zusätzlich die Signalcharakteristik in den Abtastvorgang mit einbezogen, was zu einer höheren Qualität bei gleicher Speicherplatzanforderung gegenüber der DPCM führt.
Diese Art der Speicherung ist jedoch zu ineffektiv und das Audiosignal sollte komprimiert werden. Hierzu gibt es verschiedene Ansätze, von denen an dieser Stelle einige häufige kurz vorgestellt werden.

MPEG-Audio

Neben Videokompression hat die Moving Pictures Expert Group auch Standards zur Audiokompression entwickelt. MPEG-1-Audio spezifiziert drei verschiedene Layer der Audiocodierung, die sich in ihrer Komplexität und erreichbaren Kompression voneinander unterscheiden. Layer I ist die einfachste Kompression und Layer III (MP3) die komplizierteste. Die einzelnen Layer sind abwärtskompatibel, so dass ein Layer-III-Decoder auch Layer I und II Audiosignale decodieren kann. Der Standard unterstützt die Codierung von Mono- und Stereosignalen sowie von zwei unabhängigen Kanälen, die z.B. unterschiedliche Sprachen enthalten können.
Zur Kompression der Audiosignale wird versucht, Teile des Audiosignals, die für das menschliche Gehör nicht hörbar sind, zu entfernen. Wenn es z.B. in einem Audiosignal eine dominierende Frequenz gibt, so können andere, leisere Frequenzen vom menschlichen Gehör nicht wahrgenommen werden und sind somit redundant. Um diese redundanten Frequenzen herauszufiltern, wird das Signal zunächst in 32 verschiedene Frequenzbänder zerlegt, die anhand eines sog. psycho-akustischen Modells bewertet werden. Für jedes Frequenzband wird anhand eines Schwellwertes entschieden, ob dieser Teil des Signals für den Menschen hörbar ist oder nicht. Liegt die Lautstärke eines Frequenzbands unterhalb des Schwellwertes, so wird dieses nicht codiert. Andernfalls wird das zugehörige Signal quantisiert, so dass die gewünschte Bitrate erreicht wird und anschließend in den endgültigen Bitstrom codiert.
Der MPEG-2-Standard enthält einige Verbesserungen gegenüber MPEG-1-Audio, wobei aber sehr auf die Kompatibilität der Formate geachtet wurde. MPEG-2-Audio ist auf- und abwärtskompatibel zu MPEG-1-Audio, da die Struktur des Bitstroms übernommen wurde. Die Verbesserung umfassen die Unterstützung geringerer Samplingraten (neben 48, 44,1 und 32 kHz auch 16, 22,05 und 24 kHz) für eine bessere Qualität bei geringen Datenraten sowie die Unterstützung von bis zu fünf Kanälen. Zusätzlich hat die MPEG einen Standard für Advanced Audio Coding (AAC) entwickelt, der eine bessere Unterstützung für fünf Kanäle bietet, wie sie z.B. in heutigen Kinofilmen genutzt werden. Auch die Qualität des codierten Audiosignals wurde gegenüber dem vorherigen Standard verbessert, indem Verbesserungen am Frequenzband-Filter, der Quantisierung sowie der Bitstromcodierung vorgenommen wurden. Beim Zerlegen des Signals in verschiedene Frequenzbänder wurden bekannte Schwächen von MP3 entfernt, die Granularität der Quantisierung wurde verfeinert und durch statistische Vorausbestimmung verbessert. Der Bitstrom wird bei AAC mittels Huffmancodierung codiert, was zu einer effizienteren Nutzung der verfügbaren Datenrate führt. AAC ist durch die Änderungen jedoch nicht mehr kompatibel zu MPEG-1-Audio.
Jens Zechlin
19.12.2002