Hoe werkt MP3 compressie? Dat is een veelgestelde vraag die een snel antwoord verdient. Ik heb wat rondgezocht op het net voordat ik dit ging schrijven en zag dat iedereen romans schreef over dit onderwerp, maar niemand kon het uitleggen op een snelle, normale manier. Dus hier gaan we!
“Elke voldoende geavanceerde technologie is niet van magie te onderscheiden.” – Arthur C. Clarke
Voor de meesten van ons vat bovenstaand citaat het mysterie van MP3-compressie perfect samen. Helaas vat het ook de meeste verklaringen samen.
Hoe worden MP3-bestanden kleiner maar klinken ze goed?
Vraag:
Ik heb onlangs een album online gekocht en het werd geleverd als een 160 kbps bestand. Ik merkte het alleen omdat de bestandsgrootte zelf veel kleiner was dan de ongecomprimeerde wave-bestanden die ik zelf heb gemaakt.
Wat ik niet merkte was dat de kwaliteit achteruit ging. Kun je uitleggen hoe deze mp3 compressie werkt, want het is duidelijk dat het compressie algoritme wat data weglaat om dit te laten gebeuren, toch?
Dank,
Mason D.
Antwoord:
Mason, dat is een geweldige vraag. Ik kan hier alleen maar een duidelijk antwoord op geven dankzij het feit dat ik veel tijd heb besteed aan het nadenken over hoe ik mijn eigen muziek over het internet kan verspreiden, en natuurlijk na mezelf te hebben opgefrist. Het is een goede 15 jaar geleden dat ik veel tijd heb besteed aan het nadenken over dit onderwerp.
Wat MP3 Compressie Is & Waarom Het Bestaat
Niemand gaf om dit spul toen we nog analoog werkten. We hadden vinyl platen, 8-tracks, cassettebandjes, en compact discs (deze zijn digitaal maar hadden geen compressie nodig). MP3’s werden een “ding” na de explosie van het internet.
Een niet-gecomprimeerd wave-bestand kan tot 30 MB groot zijn voor een nummer van 3 minuten. Maar nadat het door de MP3 compressie algoritmes is gehaald, kan het terugvallen tot 3 MB zonder serieus kwaliteitsverlies.
Dit was te verkiezen toen onze bandbreedte snelheden extreem laag waren op inbel modems en we misschien zelfs bandbreedte limieten hadden voor de maand. In plaats van dagen te wachten om een liedje te downloaden, konden we het in een paar uur doen (en in het heden, een paar seconden!).
MP3’s blijven bestaan dankzij MP3-spelers als de iPod. Ze hebben weinig ruimte op de harde schijf of flash drive, dus met compressie kunnen we veel meer muziek meenemen.
Daarnaast is er geen behoefte aan bestanden in volledige resolutie als we in de tuin aan het werk zijn of in de sportschool met kleine sport oortjes. Het is ook een enorme ruimte- en bandbreedtebesparing voor online streamingdiensten.
MP3 staat voor MPEG Layer 3
MPEG is een videobestandstype dat hetzelfde deed voor video’s als MP3’s deden voor audio. In feite zijn MP3’s gewoon de 3e laag die apart is gezet voor audio op de videobestanden. Het is allemaal dezelfde technologie.
Hoe bespaart MP3-compressie zoveel ruimte?
Hier wordt het te gek. De mensen die deze compressie-algoritmen hebben ontworpen, hebben onze kennis van de psychoakoestiek gebruikt om de bandbreedte van de gegevens te beheren. Psychoakoestiek heeft betrekking op de manier waarop onze hersenen geluiden interpreteren
Het brein gebruikt bepaalde trucs, zoals auditieve maskering, om middelen en aandacht toe te wijzen aan het belangrijkste geluid dat op een bepaald moment te horen is. Met behulp van deze informatie weten we wat we kunnen weglaten, qua data.
Hoorverlies bij volwassenen
De eerste en gemakkelijkste besparing is om een bepaald frequentiebereik weg te laten als de muziek dat toelaat. Volwassenen beginnen hun gehoorcapaciteit te verliezen boven 16-18 kHz, terwijl de bovengrens voor mensen rond 24 kHz ligt. Op dat niveau is er niet veel aan de hand in termen van verstaanbaarheid. Het blijft bij “schitteren, glanzen, glanzen.”
In de meeste gevallen hebben we het helemaal niet nodig of kunnen we het op zijn minst met een lagere resolutie in het mp3-bestand coderen.
De-accentueer de stilte
Dit verwijst naar iets wat onze oren en hersenen doen en dat gelijktijdige maskering wordt genoemd. Het komt erop neer dat als je een hard geluid hoort over een heleboel lage geluiden heen, je je natuurlijk gaat concentreren op het harde geluid. Dit betekent dat we veel minder data kunnen besteden aan de stille geluiden.
Temporal Masking
Op dezelfde manier als hierboven, als twee geluidsgebeurtenissen binnen milliseconden na elkaar plaatsvinden, zullen we ons alleen op de hardste kunnen concentreren. Dat is hoe we evolutionair zijn voorbestemd om te reageren. Onze oren en geest kunnen gebeurtenissen die zo dicht bij elkaar liggen niet van elkaar onderscheiden.
Dus het encoder-algoritme negeert het stillere geluid, of wijst er in ieder geval veel minder gegevens aan toe omdat we het toch niet waarnemen.
Minimum Audition Threshold
De minimumauditiedrempel heeft betrekking op het volume. Naarmate een stem of geluid stiller en stiller wordt, kunnen we steeds minder details waarnemen. De encoder weet dit en kiest ervoor om niet elk detail van stille geluiden op te slaan, omdat we het toch niet kunnen gebruiken. En als een geluid onder een bepaalde volumedrempel zakt waarbij het menselijk oor het niet kan horen, dan wordt het er helemaal uitgegooid.
Bit Rate, Bit Depth, & Sample Rate Management
En tenslotte is dit waar het echte werk wordt gedaan. Als je alle bovengenoemde besparingen hebt verwerkt, blijf je nog steeds zitten met een flink bestand van grote omvang. Dat komt omdat alle overgebleven gegevens nog steeds in de hoogst mogelijke resolutie worden opgeslagen. De genieën achter MP3 hebben dit als volgt opgelost:
In de eerste plaats is MP3 per definitie een compressietechniek waarbij gegevens verloren gaan, omdat we de bitdiepte van de audio van 24 bit of meer onmiddellijk terugbrengen tot 16 bit. Verlies verwijst naar deze daling in resolutie, maar hoeft niet een verlies in geluidskwaliteit te betekenen.
16 bit is een diepte die veel headroom heeft om een hoge signaal-ruis verhouding te leveren. Het betekent dat elke sample 16 bits heeft om mee te coderen (met een 0 of een 1 in binair). Door van 24 bit naar 16 bit te gaan, besparen we al 25% in omvang zonder merkbaar kwaliteitsverschil.
Over het feit dat elk sample elk 16 bits heeft gesproken… dat is een andere plaats waar enorme besparingen worden gerealiseerd. Sample rates kunnen oplopen tot 96.000 samples per seconde! 44,1 kHz is de typische sample-rate voor MP3’s en dat zijn nog steeds een heleboel samples per seconde, maar het betekent een daling van 50% in de hoeveelheid data die wordt opgeslagen ten opzichte van 96 kHz sample-rate. Hier is hoe het werkt, via een plaatje:
De basis is dat een lagere sample rate minder “snap shots” van elk moment van de muziek vastlegt. Je kunt het vergelijken met een film of een videospel met 60 beelden per seconde tegenover de gebruikelijke 24 beelden per seconde. 24 is meer dan goed genoeg, maar 60 ziet er geweldig uit tijdens snelle actiescènes. Hetzelfde geldt voor muziek en sample rates.
En tenslotte stellen we een limiet in voor de datadoorvoer. Dit houdt rekening met alles wat hierboven is genoemd en stelt dan een plafond in voor de hoeveelheid data die je in één keer kunt versturen. De meeste MP3 streaming en verkoop diensten gebruiken een CBR, dat is een constante bit rate, meestal van 128 kilobytes per seconde.
Andere veel voorkomende opties zijn 192 kbps, en 320 kbps wat het hoogst haalbare is op MP3 en net zo goed is als ongecomprimeerde audio kwaliteit. Sommige stream diensten sturen slechts 64 kbps en dat is te merken.
Constante bitsnelheden verdienen de voorkeur voor deze diensten en consumenten, omdat het hen helpt hun bandbreedte- en opslagbehoeften te voorspellen. Maar er is vooruitgang geboekt voor persoonlijk gebruik, zoals VBR, wat een variabele bitsnelheid is.
Wat dit doet is het toestaan van een lagere bitsnelheid tijdens rustige delen van nummers en een hogere bitsnelheid bij luidere of meer complexe delen van een nummer. Dit heeft de voorkeur van diegenen die de hoogste kwaliteit audio prefereren maar toch de data besparingen van MP3’s wensen.
Dus hoe werkt MP3 Compressie? Dat is hoe!
En dat is het! Dat is de kortste en eenvoudigste uitleg over MP3-compressie die je ooit zult vinden. De volgende keer dat een van je vrienden vraagt “Hoe werkt MP3 compressie?” kun je ze hierheen sturen of als je je deze details kunt herinneren het aan ze uitleggen en ze een minderwaardig gevoel geven. Daar heb je vrienden voor!
Bedankt voor deze goede vraag. Ik moest diep graven om te antwoorden hoe mp3 compressie werkt!
Jared
Jared H.
Jared is al meer dan 20 jaar actief in de muziekindustrie. Hij is eigenaar, redacteur, hoofdauteur en webdesigner van LedgerNote, en co-auteur van alle artikelen. Hij heeft 4 onafhankelijke albums en merchandise uitgebracht die wereldwijd zijn verkocht. Hij heeft ook gemixt, gemasterd, & opgenomen voor talloze onafhankelijke artiesten. Leer meer over Jared & Het LN Team hier.