Wie funktioniert die MP3-Kompression? | LedgerNote

Aktualisiert: Feb 15, 2021 – Q & A

Wie funktioniert die MP3-Kompression? Das ist eine häufige Frage, die eine schnelle Antwort verdient. Ich habe mich tatsächlich im Netz umgesehen, bevor ich mich hingesetzt habe, um dies zu schreiben, und habe bemerkt, dass jeder über das Thema schreibt, aber niemand konnte es auf eine schnelle, normal-menschliche Art erklären. Also los geht’s!

„Jede ausreichend fortgeschrittene Technologie ist von Magie nicht zu unterscheiden.“ – Arthur C. Clarke

Für die meisten von uns fasst das obige Zitat das Geheimnis der MP3-Kompression perfekt zusammen. Leider fasst es auch die meisten Erklärungen zusammen, die es gibt.

Warum sind MP3-Dateien kleiner, klingen aber gut?

Frage:

Ich habe kürzlich ein Album online gekauft und es wurde als 160 kbps-Datei geliefert. Ich habe das nur bemerkt, weil die Dateigröße selbst viel kleiner war als die unkomprimierten Wave-Dateien, die ich selbst erstellt habe.

Was ich nicht bemerkt habe, war ein Qualitätsverlust. Können Sie mir erklären, wie diese mp3-Kompression funktioniert, denn offensichtlich lässt der Kompressionsalgorithmus einige Daten weg, um dies zu ermöglichen, richtig?

Danke,
Mason D.

Antwort:

Mason, das ist eine tolle Frage. Ich kann das nur so beantworten, weil ich mir lange Gedanken darüber gemacht habe, wie ich meine eigene Musik über das Internet verbreiten kann, und natürlich, nachdem ich mich selbst aufgefrischt habe. Es ist gut 15 Jahre her, dass ich mich intensiv mit dem Thema beschäftigt habe.

Was MP3-Kompression ist&Warum es sie gibt

Niemand hat sich um dieses Zeug gekümmert, als wir noch im analogen Bereich gearbeitet haben. Wir hatten Vinyl-Schallplatten, 8-Tracks, Kassettenbänder und Compact Discs (diese sind zwar digital, brauchten aber keine Kompression). MP3s wurden nach der Explosion des Internets zu einem „Ding“.

Vergleich der Audiodatenkompression — MP3-Kodierung bedeutet massive Einsparungen, sogar noch mehr bei 128 kbps Bitrate.

Eine typische unkomprimierte Wave-Datei kann für einen typischen 3-Minuten-Song bis zu 30 MB groß sein. Aber nachdem sie durch die MP3-Kompressionsalgorithmen gelaufen ist, könnte sie auf 3 MB fallen, ohne dass es zu einem ernsthaften Qualitätsverlust kommt.

Dies war vorteilhaft, als unsere Bandbreitengeschwindigkeiten bei Einwahlmodems extrem niedrig waren und wir vielleicht sogar Bandbreitenobergrenzen für den Monat hatten. Anstatt tagelang zu warten, um einen Song herunterzuladen, konnten wir es in ein paar Stunden tun (und in der Gegenwart in ein paar Sekunden!).

MP3’s behalten ihre Präsenz aufgrund von MP3-Playern wie dem iPod. Sie haben nur einen begrenzten Speicherplatz auf der Festplatte oder dem Flash-Laufwerk, so dass wir durch die Komprimierung viel mehr Musik mit uns herumtragen können.

Zudem brauchen wir keine Dateien in voller Auflösung, wenn wir im Garten arbeiten oder im Fitnessstudio winzige Sportkopfhörer benutzen. Es ist auch ein riesiger Platz- und Bandbreitensparer für Online-Streaming-Dienste.

MP3 steht für MPEG Layer 3

MPEG ist ein Videodateityp, der für Videos das Gleiche tat wie MP3s für Audio. In der Tat sind MP3’s nur die 3. Schicht, die für Audio auf den Videodateien abgesetzt ist. Es ist alles die gleiche Technologie.

Wie spart die MP3-Kompression so viel Platz?

Hier wird es verrückt. Die Leute, die diese Kompressionsalgorithmen entworfen haben, haben unser Wissen über Psychoakustik genutzt, um die Datenbandbreite zu verwalten. Psychoakustik bezieht sich auf die Art und Weise, wie unser Gehirn Geräusche interpretiert.

Das Gehirn verwendet bestimmte Tricks wie die auditive Maskierung, um Ressourcen und Aufmerksamkeit auf das zu verteilen, was zu einem bestimmten Zeitpunkt das wichtigste Geräusch ist. Anhand dieser Informationen wissen wir, was wir datenmäßig loswerden können.

Hörverlust bei Erwachsenen

Die erste und einfachste Einsparung besteht darin, einen bestimmten Frequenzbereich herauszuschneiden, wenn die Musik dies zulässt. Erwachsene beginnen ihre Hörfähigkeit oberhalb von 16-18 kHz zu verlieren, während die obere Grenze für Menschen bei etwa 24 kHz liegt. Bei diesem Pegel passiert nicht mehr viel in Bezug auf die Verständlichkeit. Es ist nur „Funkeln, Glanz, Schimmern“

Wie funktioniert mp3-Kompression — Links: Unkomprimiertes Audio-Spektralbild. Rechts: MP3 schneidet Audio oberhalb von 16-18 kHz ab.

In den meisten Fällen brauchen wir es gar nicht oder können es zumindest mit einer niedrigeren Auflösung in die MP3-Datei kodieren.

Das Leise betonen

Dies bezieht sich auf etwas, das unsere Ohren und Gehirne tun, und das sich simultane Maskierung nennt. Wenn ein lautes Geräusch über viele leise Geräusche hinweg dröhnt, werden Sie sich natürlich auf das laute Geräusch konzentrieren. Das bedeutet, dass wir viel weniger Daten für die leisen Geräusche aufwenden können. Sie müssen in diesen Zeiten nicht so viele Details enthalten.

Temporale Maskierung

Wenn zwei Schallereignisse im Abstand von Millisekunden auftreten, werden wir uns nur auf das lauteste konzentrieren können. So wurden wir evolutionär darauf vorbereitet, zu reagieren. Unsere Ohren und unser Verstand können Ereignisse, die zeitlich so nah beieinander liegen, nicht trennen.

Der Encoder-Algorithmus ignoriert also das leisere Geräusch oder weist ihm zumindest viel weniger Daten zu, da wir es ohnehin nicht wahrnehmen werden.

Minimum Audition Threshold

Die minimale Hörschwelle bezieht sich auf die Lautstärke. Wenn eine Stimme oder ein Geräusch immer leiser wird, können wir immer weniger Details wahrnehmen. Der Encoder weiß das und speichert bei leisen Geräuschen nicht jedes einzelne Detail, da wir es ohnehin nicht gebrauchen können. Und wenn ein Geräusch unter eine bestimmte Lautstärkeschwelle fällt, bei der das menschliche Ohr es nicht mehr hören kann, dann wird es komplett verworfen.

Bitrate, Bittiefe, & Sample Rate Management

Und schließlich wird hier die eigentliche Arbeit geleistet. Wenn Sie alle oben erwähnten Einsparungen verarbeitet haben, bleibt immer noch eine recht große Datei übrig. Das liegt daran, dass all die übrig gebliebenen Daten immer noch in der höchstmöglichen Auflösung gespeichert werden.

Zunächst einmal ist MP3 per Definition eine verlustbehaftete Datenkomprimierung, weil wir die Bittiefe der Audiodaten von 24 Bit oder mehr sofort auf 16 Bit reduzieren. Verlustbehaftet bezieht sich auf diese Verringerung der Auflösung, muss aber nicht zwangsläufig einen Verlust an Audioqualität bedeuten.

16 Bit ist eine Tiefe, die viel Spielraum für einen hohen Signal-Rausch-Abstand bietet. Es bedeutet, dass jedes Sample mit 16 Bit kodiert werden kann (mit einer 0 oder einer 1 im Binärformat). Indem wir von 24 Bit auf 16 Bit heruntergehen, haben wir bereits 25 % an Größe eingespart, ohne erkennbaren Qualitätsunterschied.

Als wir davon sprachen, dass jedes Sample 16 Bit hat… das ist ein weiterer Ort, an dem massive Einsparungen gemacht werden. Die Sample-Raten können bis zu 96.000 Samples pro Sekunde betragen! 44,1 kHz ist die typische Samplerate für MP3s und das ist immer noch eine Menge Samples pro Sekunde, aber es stellt einen 50-prozentigen Rückgang der Datenmenge dar, die im Vergleich zu 96 kHz Sampleraten gespeichert wird. Hier ist, wie es funktioniert, via Bild:

Das Grundprinzip ist, dass eine niedrigere Abtastrate weniger „Schnappschüsse“ von jedem Moment der Musik einfängt. Sie können sich das wie einen Film oder ein Videospiel mit 60 Bildern pro Sekunde im Vergleich zu den typischen 24 Bildern pro Sekunde vorstellen. 24 ist mehr als gut genug, aber 60 sieht bei schnellen Actionszenen großartig aus. Das Gleiche gilt für Musik und Sample-Raten.

Und schließlich setzen wir eine Grenze für den Datendurchsatz. Dies berücksichtigt alles oben genannte und setzt dann eine Obergrenze, wie viele Daten Sie auf einmal senden können. Die meisten MP3-Streaming- und -Verkaufsdienste verwenden eine CBR, also eine konstante Bitrate, in der Regel von 128 Kilobyte pro Sekunde.

Andere gängige Optionen sind 192 kbps und 320 kbps, was die höchste bei MP3 verfügbare und so gut wie unkomprimierte Audioqualität ist. Einige Streaming-Dienste senden nur 64 kbps und das merkt man deutlich. Unterhalb von 128 kbps nimmt die Qualität stark ab.

Konstante Bitraten sind für diese Dienste und die Verbraucher vorzuziehen, da sie so ihren Bandbreiten- und Speicherbedarf besser vorhersagen können. Aber es gibt auch Fortschritte für den privaten Gebrauch, wie z.B. VBR, eine variable Bitrate.

Dies ermöglicht eine niedrigere Bitrate während ruhiger Teile eines Songs und eine höhere Bitrate bei lauteren oder komplexeren Teilen eines Songs. Dies ist vorteilhaft für diejenigen, die höchste Audioqualität bevorzugen, aber dennoch die Dateneinsparungen von MP3s wünschen.

Wie funktioniert die MP3-Kompression? So geht’s!

Und das war’s! Das ist die kürzeste und einfachste Erklärung der MP3-Kompression, die Sie je finden werden. Wenn einer Ihrer Freunde das nächste Mal fragt: „Wie funktioniert MP3-Kompression?“, können Sie ihn hierher schicken oder, wenn Sie sich an diese Details erinnern können, es ihm erklären und ihm das Gefühl geben, unterlegen zu sein. Dafür sind Freunde ja da!

Danke für diese solide Frage. Ich musste tief graben, um zu beantworten, wie mp3-Kompression funktioniert!
Jared

Jared H.

Jared H. LedgerNote Author Headshot Jared hat sein 20. Jahr in der Musikindustrie überschritten. Er fungiert als Eigentümer, Herausgeber, Hauptautor und Webdesigner von LedgerNote, sowie als Co-Autor aller Artikel. Er hat 4 unabhängige Alben und Merchandise-Artikel veröffentlicht, die sich weltweit verkaufen. Er hat auch gemischt, gemastert und & für unzählige unabhängige Künstler aufgenommen. Erfahren Sie mehr über Jared & Das LN Team hier.