
Vor 30 Jahren, genau gesagt am 14. Juli 1995, bekam das Audio-Datenreduktionsverfahren MPEG 1 Layer 3 seinen noch heutige gültigen Dateinamen: mp3. Erfunden wurde es in Deutschland.
von Harald Wittig
Das Dateiformat mp3 hat das Musikhören revolutioniert, denn mit dem Kompressionsverfahren namens „ISO Standard IS 11172-3 MPEG Audio Layer 3“ ließ sich die Musik vom Trägermedium befreien und auf einfachste Weise digital verbreiten. Dabei ist das Dateiformat eine deutsche Erfindung: Ein Entwicklerteam des Fraunhofer-Instituts für Integrierte Schaltungen (IIS) in Erlangen schuf das Format in jahrelanger Tüftelei – dabei wirkten Kompetenz, Standhaftigkeit und Idealismus kongenial zusammen..
Es begann in Erlangen
Obschon nicht alleine verantwortlich, gilt Karlheinz Brandenburg als Vater der mp3. Aus gutem Grund, denn der Wissenschaftler forschte bereits in seiner Studentenzeit an der Universität Erlangen am Lehrstuhl für Technische Elektronik an Möglichkeiten, die großen digitalen Musikdateien so klein zu machen, dass sie in bauchbarer Qualität über eine digitale Telefonleitung ISDN übertragbar zu machen. 1982 war das und Karlheinz Brandenburg handelte dabei im Auftrag: Denn der Jungwissenschaftler war Doktorand bei Professor Dieter Seitzer, der später das Fraunhofer IIS gründete. Der war nämlich bereits in den 1970er-Jahren auf die visionäre Idee gekommen, Musik übers ISDN-Telefonnetz zu übertragen – in HiFi-Qualität wohlgemerkt. Seitzers Plan, sich diese Idee patentrechtlich schützen zu lassen, schlug indes fehl. Die Prüfer waren – aus nachvollziehbaren Gründen – der Auffassung, dass nach dem damaligen Stand der Technik mit den angepeilten Bitraten keine Musik übertragen werden könne. Ganz aufgeben wollte Seitzer aber nicht – und fand mit Karlheinz Brandenburg den richtigen Doktoranden, der sich mit Enthusiasmus dem Thema widmete. Recht bald wechselte der Wissenschaftler ans neu gegründete Fraunhofer IIS, wo ein Entwicklerteam unter Leitung von Professor Heinz Gerhäuser weiterforschte. Zum Kernteam gehörten weiter Ernst Eberlein, Bernhard Grill, Jürgen Herre und Harald Popp.
Konkret bildeten die Universität Erlangen-Nürnberg und das Fraunhofer IIS 1987 eine Forschungsallianz im Rahmen des EU-geförderten Projektes EU147 „EUREKA“ für Digital Audio Broadcasting (DAB). Dabei gelang den Forschern der erste Meilenstein in der Geschichte der Audiocodierung: Mit dem „Low Complexity Adaptive Transform Coding/LC-ACT“-Algorithmus wurde es erstmals möglich, Stereomusik in Echtzeit zu codieren. Kurz darauf, 1988, wurde ein weiterer Meilenstein geformt: Mit dem „Optimum Coding in the Frequency/OCF“-Algorithmus wurde es möglich, Musik in akzeptabler Qualität bei 64 kbit/s für ein Monosignal zu codieren. Tatsächlich enthielt OCF bereits viele charakteristische Eigenschaften des zukünftigen mp3-Codecs. „Mit OCF starteten wir dann die MPEG-Standardisierung“, so Karlheinz Brandenburg.
Ein Jahr später, also 1989, wird OFC für den geplanten Audiostandard der Internationalen Standardisierungsorganisation „Moving Picture Experts Group“, deren Kürzel MPEG vielen Menschen schon sehr oft begegnet ist, vorgeschlagen. Insgesamt 14 Vorschläge zur Audiocodierung gehen bei MPEG ein, die auf Anregung des Gremiums vereint werden und letztlich in vier Vorschlägen resultieren. Darunter sind das „Adaptive Spectral Entropy Coding“, kurz ASPEC und MUSICAM. ASPEC ist das Ergebnis weiterer Verbesserungen an OCF und schließlich schlägt die MPEG vor, aus MUSICAM und ASPEC eine dreiköpfige Codierverfahren-Familie zu gründen:
- Layer 1
als Variante von MUSICAM mit geringer Komplexität
- Layer 2 als MUSICAM-Coder
- Layer 3
– (ab dem 14. Juli 1995 mp3 genannt) basierend auf einer Weiterentwicklung von ASPEC.
Die technische Entwicklung des MPEG 1-Standards ist im Dezember 1991 abgeschlossen. Bernhard Grill, als solcher Mitglied des mp3-Entwicklerteams und heute Institutsleiter mit der Zuständigkeit für Audio und Medientechnologien des Fraunhofer IIS fasst zusammen:
„Die ISO MEPEG-Standardisierung unserer Technologie 1992 war für uns der entscheidende Erfolg. Gegen internationale Konkurrenz konnten wir in von unabhängigen Institutionen durchgeführten Tests beweisen, dass unser Verfahren allen anderen technologisch überlegen war. Diesem Ziel haben wir alles untergeordnet und viele Nächte und Wochenenden geopfert.“
MPEG 1 Layer 3 war der effizienteste und gleichzeitig aufwändigste der drei Codes und fand zunächst in den Bereichen „Musikübertragung via ISDN-Telefonleitungen“ und „Sprachansagesysteme für den öffentlichen Nahverkehr“ kommerzielle Verwendung. Doch schon früh gibt es Pilotprojekte, die den Codec einsetzen, um Musik auf den zu dieser Zeit kleinen, aus heutige Sicht winzigen PC-Festplatten zu speichern sowie Musikdateien über die richtig langsamen PC-Modems mit 28 kbit/s zu übertragen.
Musikbibliotheken in der Hosentasche
1998 dann – mp3 trägt seit drei Jahren seinen noch heute gültigen und bestens geläufigen Namen – wird das Format zum De Facto-Standard für Digitalmusik. Denn in diesem Jahr stellt das südkoreanische Unternehmen SaeHan Information Systems seinen MPMan F10 vor: Den weltweit ersten tragbaren mp3-Player mit internem Flashspeicher. Nur wenig später kamen Mitbewerber-Produkte auf den Markt, die Rechner werden immer leistungsfähiger und erschwinglicher, Speicher größer und das „Internet“ startet seinen bis heute andauernden Siegeszug. 2001 kam der damalige Renner für Musikkomponenten auf den Markt: Apples iPod. Apple-Chef Steve Jobs brachte bei der Weltpremiere das revolutionäre mp3-Konzept auf den Punkt: „1000 Songs in deiner Tasche.“
Mit den Worten des mp3-Entwicklerteam-Leiters Heinz Gerhäuser gesprochen:
„Mp3 war eine bahnbrechende Technologie genau zur richtigen Zeit. Denn nicht lange nach der mp3-Entwicklung kamen auch leistungsfähige PCs auf den Markt, die Speicherpreise sanken und das Internet breitete sich aus. Die technischen Voraussetzungen waren also vorhanden für den Markterfolg. Jetzt mussten wir der Welt nur noch erklären, wozu man die neue mp3-Technologie nutzen kann.“

Napster erschüttert die Musikbranche
Allerdings wurde der Plan des Fraunhofer IIS, die Software zur mp3-Umwandlung von Musikdateien an interessierte Unternehmen der Unterhaltungsbranche zu lizenzieren, 1997 durch einen kriminellen Akt zunächst vereitelt: Ein australischer Student erwarb mit einer gestohlenen Kreditkartennummer die Encoder-Software, schrieb eine neue Benutzeroberfläche und stellte sein Werk mit dem frechen Vermerk „Thank ypu, Fraunhofer“ für jeden freizugänglich ins Internet. Aber das Fraunhofer IIS ging trotzdem nicht leer aus, den der kostenlos verfügbare Encoder erhöhte sehr schnell die Zahl derer, die das neue Format nutzten und am Ende doch Lizenzeinnahmen brachten.

Das Rippen von CDs, also das Auslesen und Umwandeln der PCM-Dateien in mp3s beschäftigte schon sehr bald Millionen von PC-Nutzern und Musikfans. Dabei darf auch der Lame-mp3-Encoder nicht vergessen werden, der nämlich einen Fehler des Fraunhofer Codecs korrigierte, später – im Fraunhofer IIS hatten sich die genialen Köpfe längst neuen Projekten zugewandt – schufen die Lame-Entwickler einen eigenen Encoder, dessen im direkten Verglich dem Urpsrungs-Encoder überlegene Klangqualität ihn zum „Muss jeder haben“-Quasistandard, beispielsweise für kostenlose Kult-Playersoftware wie den Winamp oder Foobar, machten.
Mp3 wird ein Renner bei den Musikliebhabern – auf Kosten der Musikindustrie. Denn wer mp3 sagt, muss auch schnell „Napster“ nennen. Die Älteren werden sich erinnern: Napster war eine Online-Tauschplattform, die es den Nutzern ermöglichte, mp3s von urheberrechtlich geschützter Musik kostenlos zu teilen. 1999 ging die Plattform online und hatte bis zur Abschaltung im Jahr 2001 sage und schreibe 80 Millionen User, davon waren 1,6 Millionen ständig online. Das Tauschvolumen betrug zuletzt rund zwei Milliarden Dateien. Die Rechteverwerter der Musikindustrie überzogen Napster mit Klagen und erwirkten letztlich die Abschaltung der Plattform. Was blieb waren die Umsatzverluste der Musikindustrie und mp3, das sich auch dank Napster zum weltweiten Quasi-Standard für digitale Musik etablierte.

Das heißt nicht, dass das Fraunhofer-Institut ISS – das sich stets zur Wahrung des Urheberrechts bekannt hat – leer ausgegangen wäre. Bis 2017, mit dem Auslaufen des letzten mp3-Patents verdiente das mp3-Mutterhaus jährlich Millionen an Gebühren von mp3 Player-Herstellern, Musik-Plattformen sowie anderen Lizenznehmern. Laut Fraunhofer IIS habe die Vermarktung über die Patentlaufzeit „Einnahmen im hohen dreistelligen Millionenbereich“ generiert. Was isoliert betrachtet eine ganze Menge sein mag, jedoch nur ein Klacks im Vergleich zu den Milliarden-Gewinnen der kommerziellen Anwender der mp3-Technologie ist: Allein Apple machte nur mit seinem iPod von 2001 bis zur Produkt-Einstellung 2022 einen Umsatz von etwa 70 Milliarden US-Dollar, der Reingewinn muss mindestens 15 Milliarden Doller betragen haben.


Quelle: Fraunhofer IIS
Auch für die Musikindustrie bedeutet mp3 eine Neuausrichtung: Neue digitale Vertriebswege – heute längst gang und gebe – wurden gesucht und gefunden, die ärgerlichen Kopierschutzfunktionen von CDs zum Glück aufgegeben, während der mit dem Erscheinen von mp3 ins Schwanken geratene Datenträger sich inzwischen in Agonie befindet.
Perceptive Coding bleibt
Technisch basiert mp3 auf einem psychoakustisch motivierten Datenreduktionsverfahren („Perceptive Coding“), die sich als Quellcodierung auffassen lassen. Sie entfernen nicht nur redundante, sondern auch irrelevante Informationen aus dem Signal und verringern die Datenmenge damit drastisch. Im Vergleich zum Original benötigt eine mp3 nur rund zehn Prozent des Speicherplatzes. Mp3s – und alle anderen Datenreduktionsverfahren – eignen sich folglich hervorragend zur Speicherung und Distribution beim Endverbraucher. Weswegen mp3s nach wie vor gebräuchlich sind, um mal eben einen Titel zu verschicken oder geschwind den aktuellen Stand einer Produktion zu dokumentieren. Gänzlich ungeeignet sind die datenreduzierten Dateien indes für die professionelle Anwendung, konkret die Weiterverarbeitung im Studio.
Über die Klangqualität des mp3-Formats ist schon heftig gestritten worden. Mp3 ist ein „gehörangepasster Audiocoder“, der angeblich die Datenrate einer Musikdatei ohne hörbare Verluste reduzieren könne. Denn jedes Musikstück enthalte Elemente, die vom menschlichen Gehör nicht erfasst werden. Prinzipiell funktioniert eine psychoakustisch begründete Datenreduktion folgendermaßen:
Das eingehende PCM-Signal wird zunächst in einzelne Frequenzbänder zerlegt, die den kritischen Bändern des Gehörs nachempfunden sein können. Gleichzeitig wird durch ein psychoakustisches Modell die momentane Mithörschwelle auf Basis des Verdeckungseffekts berechnet. Auf Grund des Verdeckungseffekts ist ist nun die Dynamik des Gehörs sehr stark vom Signalverlauf abhängig. Daher ist die Signaldynamik an die prognostizierte Gehördynamik anpassbar. Je mehr leise Signalanteile durch laute Signalanteile verdeckt werden, desto gröber darf das Signal ohne hörbaren Klangunterschied quantisiert werden – Requantisierung mit geringer Wortbreite. Im Idealfall wird die Entropie verringert, ohne dass es zum Verlust relevanter Informationen käme. Das ist die sogenannte Irrelevanzreduktion, die im Zusammenhang mit datenreduzierten Audioformaten immer auftaucht – und angeblich belegt, dass datenreduzierte Formate mit ausgefeilten Codes subjektiv eine sehr gute Klangqualität bieten. Die Umwandlung von PCM in eine mp3 geschieht mit einer Hybrid-Filterbank durch nochmalige Zerlegung jedes Teilbands der Filterbank mittels 18 Punkt-Cosinus-Transformation, hinzu kommt ein erweiterter Requantisierungs-Algorithmus sowie eine Huffman-Codierung zur weiteren Redundanz-Reduktion. Das führt zu einer akzeptablen, in den besten Entwicklungsstufen recht guten Klangqualität – zumindest bei Datenraten von mindestens 192 kbit/s. Interessante Randnotiz: Auf der Suche nach dem bestmöglichen, sprich bestklingenden mp3-Algorithmus nutze Karlheinz Brandenburg das A Capella-Lied „Tom‘s Diner“ der Songwriterin Suzanne Vega, das der Wissenschaftler nach eigener Vermutung buchstäblich tausende Male gehört hat – und übrigens noch immer mag.
Heute ist mp3 immer noch verbreitetet und gebräuchlich, technisch aber von anderen Formaten übertroffen worden. Der mp3-Enkel nennt sich MPEG-2 AAC, was ausgesprochen Advanced Audio Coding bedeutet und zwar dem psychoakustischen Modell vom MPEG-1 Layer 2 entspricht, allerdings unter anderem mit einer verbesserten Zeit-Frequenz-Codierung aufwartet. Im Vergleich zu mp3 ist AAC deutlich effizienter, was seine Streaming-Eignung vergleichsweise erhöht. Bereits bei 96 kbit/s wird UKW-Qualität erreicht – mp3 benötigt 128 kbit/s -, ab 192 kbit/s kommt AAC sehr nahe an die CD. Im momentanen Streaming-Zeitalter dominiert deswegen der Audiocodec xHE-AAC, gewissermaßen der Ur-Ur-Enkel von mp3. Er kommt unter anderem bei den Plattformen Netflix, Instagram und Audible zu Einsatz.
Beim Fraunhofer IIS wird selbstverständlich mit bewährter Expertise und wendigem Forschergeist die Audiocodec-Geschichte fortgeschrieben. So erreicht die fünfte Codec-Generation dank Einsatz KI-basierter Methoden sensationell niedrige Bitraten von unter 3 kbit/s für Sprachsignale. Das ist nur ein Beispiel für den ungebrochenen Enthusiasmus der Fraunhofer ISS-Wissenschaftler, die am 14. Juli 1995, vor 30 Jahren, einem kommenden Weltstar eigener Schöpfung seinen Namen gaben

