
Die H.O.M.E.-Studios in Hamburg haben einen legendären Ruf und sind seit Jahren als Anlaufstelle für immersive Musikproduktionen etabliert. Verantwortlich dafür ist vor allem Tilmann Ilse, der für die Dolby Atmos Mischungen von Artists wie Cro, Joris, Marteria und vielen mehr verantwortlich zeichnet. Im Gespräch erklärt Ilse, warum bei ihm alles mit Stereo anfängt, aber das Ziel immer Dolby Atmos ist.
Von Dr. Moritz Hillmayer (Bilder Lebenskunst Photography; Jan Christoph Schultjen)
Tilmann Ilse kam eher zufällig zum Ton. Als es für ihn Zeit für die Berufswahl wurde, waren Medienberufe gerade in Mode, also bewarb er sich bei einer Filmproduktionsfirma. Die Produktion eines Werbespots führte ihn zur Nachvertonung erstmals in ein Tonstudio, und er war sofort fasziniert. Nach Bewerbungen bei unzähligen Tonstudios kam er schließlich zu einem Praktikum bei den H.O.M.E.-Studios in Hamburg. „Die waren gerade auf der Suche nach einem Praktikanten,“ erzählt Ilse. „Das war einfach richtige Zeit, richtiger Ort.“ Diese Formulierung nutzt er im Laufe unseres Gesprächs noch öfter.
Beispielsweise auch, als er den Produzenten Peter Schmidt kennenlernte, der gerade auf der Suche nach einem neuen Assistenten war. „Richtige Zeit, richtiger Ort.“ Tilmann Ilse zieht nach Berlin und baut dort von Grund auf ein neues Studio. Nach seiner Assistenzzeit bei Peter Schmidt und der Rückkehr nach Hamburg baute Tilmann Ilse mit seinem Kompagnon ein eigenes großes Studio auf 260 Quadratmetern. „Wir haben da unseren Traum verwirklicht,“ erinnert Ilse sich. „Und dann kam Corona.“ Die resultierende Downtime wollte produktiv genutzt sein, und Ilse befasste sich eingehend mit dreidimensionalem Audio. Heute gehört er zu den wichtigsten Namen in Deutschland, wenn es um Musikproduktion in Dolby Atmos geht.“

Professional-Audio: Wie hat deine Faszination mit immersivem Audio angefangen?
Tilmann Ilse: Das war 2007. Ich habe damals Ronald Prent im Galaxy Studio assistiert, und Wilfried van Baelen hatte dort ein großes immersives System mit 13 Lautsprechern oder so. Er hat einen Track abgespielt, den sie in einer Kirche aufgenommen hatten, und bei der Aufnahme hatte es geregnet. Die Top-Mikrofone haben das Regenprasseln auf dem Kirchendach eingefangen und in dem Studio kam das dann aus den Deckenlautsprechern. Das war irre, hyperrealistisch, das hat mich total gepackt und fasziniert.
Professional-Audio: Und dann hast du auf Dolby Atmos umgesattelt?
Tilmann Ilse: Ich habe sehr schnell gemerkt, wie viel Spaß ich daran habe. Als erstes Album habe ich Stefanie Heinzmann in Dolby Atmos gemischt. Einen Monat später hat Apple angekündigt, dass es ab sofort bei iTunes Spatial Audio gibt – wir konnten das liefern, und so ging das Telefon. Also wieder: richtige Zeit, richtiger Ort.
Professional-Audio: Wie bist du dann zu den H.O.M.E.-Studios zurückgekommen?
Tilmann Ilse: Ich habe mich nach etwa sieben Jahren von meinem damaligen Studiopartner getrennt und überlegt, welches Studio für mich infrage käme. Ich hatte eine kleine Liste und habe Franz (Plasa, Inhaber der H.O.M.E.-Studios – Anm. d. Autors) angerufen. Er trug sich mit dem Gedanken, aufzuhören, und nach ein bisschen hin und her haben wir beschlossen, uns das Studio zu teilen. Dieses Arrangement funktioniert jetzt wunderbar. Wir kommen uns nicht in die Quere, aber manchmal arbeiten wir zusammen, und das schon seit zwei Jahren.

Professional-Audio: So schließt sich ein Kreis.
Tilmann Ilse: So schließt sich ein Kreis, ja, und ich bin nach 20 Jahren wieder in den H.O.M.E.-Studios. Wir haben damals dann erstmal umgebaut und modernisiert. Ich habe mein Dolby Atmos System und meine SSL 4000 mitgebracht und eingebaut.
Professional-Audio: Das heißt, du hattest im Studio davor auch schon ein Dolby Atmos System?
Tilmann Ilse: Ja, genau. Das fing in dem großen Studio an, das ich gebaut hatte. Da war ein 7.1.4-System drin. Beim Umzug ins H.O.M.E.-Studio habe ich das Setup auf 9.1.4 erweitert, also noch die Wide-Speaker dazu genommen. Die konnte ich im alten Studio nicht richtig integrieren, dabei halte ich sie für entscheidend, weil zwischen Links und Rechts und den Surrounds ein relativ großer Abstand ist. Wenn man dann Objekte an die Position der Wides setzt, klingt das mit dedizierten Lautsprechern einfach anders als ohne. Da ist es gut, wenn man die Wides zum Checken hat.
Professional-Audio: OK, das heißt also, du schaltest beim Mischen in Dolby Atmos zwischendurch auch mal deine Wides aus?
Tilmann Ilse: Ich schalte sie nicht aus, denn dann würde ja einfach nicht wiedergegeben, was da draufgeroutet ist. Aber ich schalte auf 7.1.4 um und nehme damit die Lautsprecher aus der Wiedergabe. Stattdessen wird das Signal als Phantommitte zwischen Links und Links Surround beziehungsweise zwischen Rechts und Rechts Surround gebildet. Das ist vergleichbar mit dem Center-Speaker. Wenn man eine Phantommitte zwischen Links und Rechts hat, ist das einfach anders, als wenn das Mittensignal direkt aus dem Center kommt. Es ist mir wichtig, das immer zu prüfen, um sicherzustellen, dass der Mix auch auf kleineren Anlagen oder Soundbars funktioniert. Ich schalte ohnehin oft um auf den Stereomix. Ich habe ein paar Folddowns, damit ich von Dolby Atmos auf Stereo runterfalten kann, um die Verhältnisse zum Stereomix zu vergleichen.
Professional-Audio: Warum Folddowns?
Tilmann Ilse: Wenn zum Beispiel ein Klavier von hinten kommt und ich schalte auf Stereo um, dann kommt es von vorne. Das Gehirn kann damit nicht gut umgehen und die Lautstärkeverhältnisse sinnvoll vergleichen, wenn sich die Richtung völlig ändert. Also falte ich Dolby Atmos auf Stereo herunter und vergleiche das dann mit dem Stereomix, sodass ich die Level checken kann. So weiß ich nach einer Sekunde, wo ich bin. Das ist enorm wichtig für meinen Workflow.
Professional-Audio: Also vergleichst du einen Stereo-Folddown deines Dolby Atmos Mixes mit dem ursprünglichen Stereomix?
Tilmann Ilse: Der Mix ist in Dolby Atmos ja schon auf die Lautsprecher verteilt. Wenn ich dann nicht sicher bin, ob zum Beispiel die Gitarre ein bisschen zu laut ist oder die Backings ein bisschen zu leise, muss ich zusehen, dass die stimmen. Ich kann ja die Verhältnisse nicht ganz anders machen als im Stereomix, an dem die Künstler:innen mit Schweiß und Blut gearbeitet und ihn schließlich abgesegnet haben. Wenn ich die Signale aber auf meine ganzen Lautsprecher verteilt habe, kann es sein, dass die Backing Vocals zum Beispiel von den Wides oder den Surrounds kommen. Da kommt dann nur die Vocal-Spur raus und man kann kaum noch einschätzen, ob die zu laut oder zu leise sind. Also mache ich einen Folddown von meinem Dolby Atmos System auf Stereo, weil dann wieder alle Signale aus meinem Stereo-Set kommen und ich die Verhältnisse sofort beurteilen und vor allem vergleichen kann. Ich vergleiche dann zwei Stereo-Mixes miteinander und höre sofort, ob irgendwelche Verhältnisse nicht mehr stimmen.

Professional-Audio: Fängst du bei einem Mix dann mit den Levels an?
Tilmann Ilse: Genau, ja. Im Stereomix sind die Backing Vocals zum Beispiel ja meistens irgendwie eingebettet. Wenn ich die isoliert auf die Surrounds gebe, dann höre ich sie solo aus diesem Lautsprecher. Wenn ich sie dann so leise ziehen würde, dass ich das Gefühl habe, sie sind eingebettet, dann sind sie vielleicht später 5 dB zu leise. Erst, wenn ich nah genug an dem Master dran bin, fange ich an, die Signale auf die Lautsprecher zu verteilen.
Professional-Audio: Änderst du nochmal etwas, wenn du zum binauralen Mix übergehst?
Tilmann Ilse: Durch die Binauralisation werden Phasengang, Amplitudengang und Frequenzgang verändert, um die psychoakustische Platzierung über den Kopfhörer zu realisieren. Dadurch können Signale mehr in den Vordergrund oder Hintergrund treten. Also passe ich dafür dann unter Umständen nochmal ein bisschen die Lautstärken an, maximal ein dB. Außerdem kann man für jeden Kanal im Bed und für jedes Object zwischen vier verschiedenen Binauralisationsstufen wählen. „Off“ klingt exakt wie bei einem normalen Stereomix im Kopfhörer. Bei „Near“ wird etwas Räumlichkeit und Crossfeed zwischen linkem und rechtem Kanal hinzugefügt, als würde man vor Lautsprechern sitzen. Bei „Mid“ hat man noch ein bisschen mehr Crossfeed und leicht hörbaren Raum und bei „Far“ gibt es einen relativ großen Crossfeed und anständig Raum. Da geht die Direktheit des Signals schon zurück. Das muss man auf jeden Fall mit Bedacht einsetzen.
Professional-Audio: Du mischst aber auch in Stereo, richtig?
Tilmann Ilse: Ja, das ist sogar mein Hauptgeschäft. Ich habe bei einigen Produktionen das ganze Album aufgenommen und gemixt und dann davon auch die Dolby Atmos Version gemacht. Das hat den Vorteil, dass ich selber bestimmen kann, was ich für Stems bekomme. Ich habe mal eine Weile versucht, aus der Mixing Session direkt eine Dolby Atmos Mixing Session zu machen. Das ist aber kompliziert, weil ich ja im Stereomix schon einige Busse habe. Deswegen habe ich mir angewöhnt, dass ich mir selber Stems ziehe. Da ist alles reingeprintet. Dann kann ich in meinem Dolby Atmos Template weitermischen.

Professional-Audio: Der Stereomix entsteht also zuerst?
Tilmann Ilse: Ja. Ich halte nicht viel davon, wenn man erst den Dolby Atmos Mix macht, wenn die Kundschaft einen klassischen Stereomix erwartet. Der Stereomix muss immer knallen, da muss richtig Senf auf die Wurst. Wenn ich einen Atmos Mix erstelle, ist es sehr schwer, so einen Druck im Folddown zu erzeugen. So machen es ja einige, Dolby Atmos mischen und dann den Folddown als Stereomix nur noch anpassen. Ich empfinde das als sehr unbefriedigend. Ich mache lieber erst den Stereomix, dann kann ich daraus den Atmos Mix erstellen.
Professional-Audio: Viele arbeiten umgekehrt.
Tilmann Ilse: Das ist aus meiner Sicht am Ende mehr Arbeit. In Dolby Atmos muss ich beim EQing nicht so sehr darauf achten, dass sich Instrumente nicht verdecken. Wenn die Signale aus verschiedenen Speakern kommen, können sie alle fullrange sein. Dann habe ich aber einen matschigeren Kopfhörermix. Bei Stereo habe ich keine getrennten Instrumente, sondern die Kanäle. Die Instrumente muss ich dann auf jedem Kanal so tweaken, dass sie sich im Stereomix durchsetzen. Wenn ich erst den Stereomix mache, kann ich die Drums fett machen, die Gitarren im Mix platzieren, den Bass schieben lassen – das wird so gemischt, dass es durch zwei Speaker passt. Dann habe ich also schon die ganzen EQs und alles, und das funktioniert dann auch in Dolby Atmos noch wunderbar.
Professional-Audio: Was sind in deiner Erfahrung häufige Missverständnisse oder Denkfehler bei der ersten Produktion in Dolby Atmos?
Tilmann Ilse: Das sind eher technische Dinge. Künstlerisch gibt es ja keine Vorschriften. Mein Ansatz ist immer: Der Song ist King. Alles muss dem Song dienen und darf nicht ultra fancy werden, nur weil man es kann.
Professional-Audio: Was kann man denn technisch falsch machen?
Tilmann Ilse: Da wäre zum Beispiel die „Size“ im Dolby Atmos Renderer. Man kann damit ein Objekt größer ziehen, was im Grunde nichts anderes bedeutet, als dass es anteilig auf mehreren Speakern wiedergegeben wird. Wenn man das übertreibt, kann es passieren, dass das Signal von mehreren Lautsprechern gleichzeitig und gleich laut wiedergegeben wird, und wenn man dann den Kopf bewegt, kann es phasen. Im binauralen Mix bekommt man es dann gar nicht mehr platziert. Wenn man das jetzt auch noch mit mehreren Signalen macht, bleibt am Ende nur noch Matsch übrig. Die Funktion ist aus meiner Sicht für Kinomischungen relevant, da ergibt das oft Sinn. Eine andere Sache, die man aus meiner Sicht eher nicht tun sollte, ist die Platzierung von Objekten zu weit im Raum. Theoretisch kann ich das Objekt wirklich mitten im Raum platzieren. Das führt dann aber dazu, dass die Stimme aus allen Lautsprechern mit ungefähr gleichem Pegel rauskommt, und das wird dann eher eine diffuse Wolke aus Klang, weniger ein scharf umrissenes Objekt. Ich bin ein Freund von „balls to the wall“, ich setze die kugelförmigen Objekte im Renderer also eher an den Rand des Raumes. Natürlich kann man ein Signal mal ein bisschen von der Wand wegziehen, oder auch mal ein bisschen nach oben. Wenn ich dann Links und Rechts ausschalte, höre ich auf den Wides und den Top-Speakern noch ein bisschen was vom Signal. Das macht es ein bisschen größer. Bei Drums mache ich das manchmal. Das gilt zum Beispiel auch für Vocals, die sollten maximal 20 Prozent auf Links und Rechts kommen, zusätzlich zum Center. Dann hat man eine schön festgeankerte Mitte und trotzdem noch einen breiten Vocal-Sound.

Professional-Audio: „Richtige Zeit, richtiger Ort“ gilt entsprechend also auch für die Objekte im Mix.
Tilmann Ilse: Diese Dinge muss man einfach im Kopf behalten. Das gilt auch für Pannings. 90, vielleicht 95 Prozent der Leute, die Musik in Dolby Atmos hören, tun das über Kopfhörer. Darum müssen wir immer darauf achten, dass wir die Links-Rechts-Stereoachse beibehalten. Man kann ein Stereoklavier nicht so pannen, dass seine linke Seite auf dem Left Surround liegt und die rechte Seite auf dem Left Front. Im Raum ist das ein zwei Meter breites Stereofeld, das funktioniert. Aber auf dem Kopfhörer ist das einfach nur links. Also mono links. Das muss man im Kopf behalten und alle Signale, die für sich bereits Stereo sind, entsprechend so positionieren, dass sie auch Stereo bleiben, wenn die Leute den Mix über Kopfhörer hören.
Professional-Audio: Wie setzt du das Bed ein?
Tilmann Ilse: Fast gar nicht, also zumindest nicht für Signale. Das Bed ist eigentlich nur mein Effect-Return. Ich habe auf fast allen Audio-Stems einen Send drauf, der geht in den Reverb, ich benutze da gerne das Ocean Way Plug-in. Ich will ja nicht wirklich einen Reverb, sondern einen schönen Raum. Das ist einfach nur dafür da, dass ein Signal, das ich auf einen Lautsprecher schicke, nicht direkt an der Membran klebt, sondern dass da noch ein bisschen Raumantwort mit dabei ist. Der ist also nicht hörbar, aber wenn man ihn ausschaltet, dann fehlt er. Das Ocean Way ist aber nur ein Stereo-Plug-in, darum geht der Output dann in einen Upmixer und dann in mein Bed.
Professional-Audio: Wo siehst du Dolby Atmos in 5 Jahren?
Tilmann Ilse: Wo geht die Reise hin? Es wird nicht wieder verschwinden. Ganz sicher nicht. Immersive hat sehr viel mehr Potential als 5.1 Surround, weil das noch ein kanalbasiertes Format war. Man brauchte diese 6 Speaker, man brauchte diesen Receiver, man konnte das nicht auf Kopfhörern hören. Dolby Atmos ist ja objektbasiert. Das heißt, es kann skaliert werden, ob man das binaural über Kopfhörer hört oder über eine Soundbar oder die kleinste Lautsprecherkonfiguration. Das Format ist komplett flexibel, was die Abspielseite angeht. Die Premiummarken bauen das mittlerweile in ihre Autos ein.
Professional-Audio: Und was wünschst du dir?
Tilmann Ilse: Momentan kommt der Wunsch nach Dolby Atmos bei der Musikproduktion noch zu selten von innen heraus. Die Plattenfirmen zwingen das ihren Artists auf. Wenn du bei einem Major bist, dann musst du Dolby Atmos abgeben, ob du willst oder nicht. Da wird das Pferd ein bisschen von hinten aufgezäumt. Dabei müssen die Leute es nur mal hören. Wenn man Dolby Atmos nicht selbst gehört hat, kann man sich das vielleicht nicht so richtig vorstellen. Aber alle Leute, die es gehört haben, zumindest wenn ich dabei war, waren völlig begeistert. Das dauert normalerweise keine 20 Sekunden. Und wenn man diese Vorstellung einmal im Kopf hat, kann man auch anders produzieren. Es muss einfach mehr für Dolby Atmos produziert werden, statt dass wir Stems von einem Stereomix in Atmos mischen. Man könnte zum Beispiel mehr Backings einbauen, mehr Overdubs, ob Gitarre oder Keyboard oder Percussion. Der Platz wäre da.

