Trennung im Guten

Gesang vom Rest eines fertigen Mixes sauber trennen – die Software Trax Pro 3 SP möchte dies leisten. Ein interessantes Tool nicht nur für DJs, denn so bieten sich spannende Möglichkeiten zur nachträglichen Gesangsbearbeitung.

Von Freda Ressel

 

Viele werden die Situation kennen – eine alte Aufnahme einer ehemaligen oder pausierenden Band liegt noch als WAV auf dem Rechner oder in CD-Form im Regal, doch die Originalspuren sind verschollen – auf dem vorletzten PC des Bassisten, auf Bändern im Keller des Schlagzeugers, unerreichbar jedenfalls für den Moment. Beim Wiederentdecken dieser Aufnahme juckt es in den Fingern – der Gesang war stets einen Tick zu leise, könnte man da doch nur einen Hauch hinzugeben, wäre es einfach perfekt. Mit der Software Trax Pro 3 SP des französisch-amerikanischen Herstellers Audionamix kein Problem – und das ist nur eine der unkompliziertesten Funktionen des Programms. Denn der Hersteller verspricht die saubere Trennung von Gesang und Musiksignalen – einzeln exportierbar sogar im STEMS-Format. Eine Revolution für DJs und Remix-Künstler, die sonst auf einzelne Spuren angewiesen sind. Zudem hat die Pro SP-Version einen zusätzlichen Filter für Sprachaufnahmen – so können beispielsweise im Freien aufgenommene Dokumentationen nachträglich überarbeitet oder alte Sprachaufnahmen von Rauschen befreit werden.

Audionamix bietet TRAX in drei verschiedenen Fassungen an: Die Basisversion TRAX 3 kommt für einen Preis von 299 Euro und beinhaltet die Melodieseparierung ohne Spektralbearbeitung, welche in der Pro-Variante für 499 Euro enthalten ist. Die Pro SP-Ausgabe, der der Test zugrunde liegt, bietet zudem Spracherkennung und Panning-bezogene Spektralbearbeitung und kostet 999 Euro. Das Programm ist auf Mac-Computer beschränkt, eine Windows-Version ist laut Hersteller nicht geplant.

 

Installation

Beim Kauf von Trax 3 erhält man einen Aktivierungscode, mit dem man auf der Audionamix-Homepage das Programm herunterladen kann. Wichtig zu wissen ist, dass das Programm sämtliche Funktionen nicht auf dem Anwender-Computer, sondern serverbasiert erledigt. Eine stehende Internetverbindung ist daher zwingend notwendig und sollte auch recht schnell sein, da sonst die Wartezeiten der einzelnen Bearbeitungsschritte schnell frustrierend ausfallen. Durch das serverbasierte Arbeiten werden Software-Updates überflüssig, der Nutzer hat automatisch die neueste Version des Programms. Allerdings ist es so natürlich nicht möglich, offline unterwegs zu arbeiten.

 

Erste Schritte

Beim Einlesen einer Datei in TRAX 3 Pro SP stellt das Programm den Nutzer zunächst vor die Wahl, ob nur nach Melodiestimmen, Sprache oder beidem getrennt werden soll. Zudem lässt sich die Stimmerkennung deaktivieren, so dass jede Art von Melodieinstrument, wie Sologitarren oder Ähnliches, gefunden wird. Die erfolgte Auswahl im Separate-Fenster wird nun in zwei Spuren getrennt (Vocals und Music), die zusammenaddiert stets das Originalsignal ergeben. Die beiden getrennten Spuren lassen sich kinderleicht im Pegel anheben oder absenken – so hat man die eingangs erwähnten Altlasten bei fertigen Aufnahmen schnell gefixt und das Endergebnis exportiert – eine fantastische Funktion!

Das sogenannte Pitchogramm stellt nun den für den Melodiestimmenbereich zuständigen Frequenzbereich (60 Hz bis 1100 kHz) und, im Falle der Gesangsspur, die automatisch erkannte Melodie als Linie dar. Zudem zeigt die Konsonantenerkennung erkannte Konsonanten als Strich an. Die automatische Erkennung ist natürlich nicht perfekt und enthält noch viele Artefakte der Musikspur – gerade Schlagzeugobertöne und harmonisch nah an den Melodiestimmen rangierende Rhythmusinstrumente rutschen dem Programm anfangs gerne durch, und auch weniger kraftvoll gesungene Worte kommen manchmal nicht komplett an. Wo das Programm falsch analysiert, hat der Nutzer nun die Möglichkeit, mit einer Handvoll intuitiver Werkzeuge nachzuhelfen. Mit dem Stifttool lässt sich die Linie händisch nachzeichnen – ein Probeton auf der entsprechenden Frequenzhöhe lässt sich zur Kontrolle sofort abspielen. Das Magnetstifttool erkennt verschiedene zusammenhängende Frequenzen und zeichnet diese punktgenau nach. Mit dem Rahmen lässt sich ein ganzer Bereich heranzoomen, zudem können mit dem Konsonanten-Tool nicht erkannte Konsonanten gekennzeichnet werden. Zuletzt lassen sich offensichtlich fehlerhaft erkannte Signale mit dem Radierer-Tool entfernen – diese sind aber dank TRAX‘ nondestruktiver Funktionsweise natürlich nicht verloren, sondern wandern auf die jeweils andere Spur. Die Auswirkung der Bearbeitung lässt sich nicht direkt nachvollziehen, die Spuren müssen zunächst erneut mit Klick auf den „Separate“-Button getrennt werden. Hier ist eine schnelle Internetverbindung wirklich Trumpf, da die Wartezeit sonst frustrierend lang ausfallen kann. Bei einer schnellen Verbindung dauert die erste Trennung zwischen einer und drei Minuten, jede neue Separierung geht etwas schneller. Für die perfekte Trennung der Gesangsspur braucht es seine Zeit, aber die Werkzeuge, die dem Nutzer zur Seite gestellt werden, sind überaus hilfreich, und so gelangt man hier bereits zu guten Ergebnissen.

 

Weitere Bearbeitung

Ist die Gesangsspur melodisch akkurat nachgezeichnet, gibt das Process-Fenster einige Bearbeitungsoptionen durch unterschiedliche Algorithmen. So kann in der Rubrik Advanced Processing auf der gewählten Spur (wobei zwischen der Erstanalyse und der im Separate-Menü vorgenommenen genaueren Trennung unterschieden wird) mit der Einstellung Consonant Boost gezielt nach mehr Transienten gesucht werden. High Quality bietet, wie der Name vermuten lässt, eine genauere Trennung, die allerdings etwas mehr Zeit in Anspruch nimmt (zwischen drei und zehn Minuten im Testzeitraum). Mit Short oder Long Reverb wird gezielt nach mit Reverb-Signalen gesucht, da dieser vor allem auf Gesangsspuren angewendet wird. Zudem kann die Panning-Position eingestellt werden – liegt der Gesang in der Mitte, kann so der Analyseraum eingeschränkt werden um die Trennung zu vereinfachen. Aber auch außerhalb der Mitte platzierte Gesangsspuren lassen sich so leichter „einfangen“. Jede dieser Algorithmen hat eine signifikant hörbare Auswirkung auf die gewählte Spur.

 

 

Daneben stehen noch zwei Post-Processing-Algorithmen zur Wahl. Die Schlagzeug-Signale der bereits bearbeiteten Signale werden für die Musik verstärkt beziehungsweise für die Vocal-Spur abgeschwächt. Das Spatial Isolation Tool lässt genauere Panning-Bearbeitung sowie die Einschränkung auf einen bestimmten Frequenzbereich in Echtzeit zu. Durch einen Klick auf das Schlosssymbol wird eine neue Spur erstellt.

Aus den verschiedenen erstellten Spuren lässt sich nun eine Comp-Spur erzeugen, für die man die jeweils besten Ergebnisse zusammenschneidet. Im Test zeigte hier der Direktvergleich sowohl mit der automatischen Analysespur als auch mit der separierten Spur, dass durch die Algorithmen starke Verbesserungen hörbar wurden – und das ohne große Mühe.

Der Spectral-Screen

Mit der so erstellten verbesserten Spur geht es nun im Spectral-Reiter weiter.

Hier werden Vocals oder Musik als Spektrogramm angezeigt. Hier sieht man die Musik im wahrsten Wortsinn vor sich ausgebreitet und kann sich auf die Suche nach hörbaren Überresten aus der jeweils anderen Spur machen. Alle hier entfernten Signale landen wie gehabt auf der jeweils anderen Spur, so dass diese gleich mitkomplettiert wird. Die Darstellung des Spektrogramms kann individuell angepasst werden um eine optimale Ansicht zur Bearbeitung zu ermöglichen.

Wichtigstes Ansichtstool ist dabei der Pan-Specific View, mit dem das Spektrogramm nur noch einen gewählten Bereich in der Stereobreite anzeigt. So werden von der Vocalspur nicht beanspruchte Bereiche ausgespart, und die Bearbeitung wird noch leichter. Zudem kann die Auswahl invertiert werden, sodass beispielsweise nur die äußersten Ränder des Stereopanoramas sichtbar werden – hier auftretende Signale lassen sich so kinderleicht ausfindig machen und zur Musikspur schieben.

Auch bei dieser Ansicht stehen dem Nutzer verschiedene Werkzeuge zur Wahl.

An Auswahltools stehen eine frei ziehbare Rechteck-Auswahl, eine zeitspezifische Auswahl über die volle Frequenzbreite, eine frequenzspezifische Auswahl über die gesamte Dateilänge sowie ein Lasso-Tool für Freihandselektion und der sehr praktische Harmonic Selector zur Wahl. Dieses intelligente Tool erkennt automatisch harmonische Zusammenhänge und ist so in der Lage, Obertöne von falsch zugeordneten Signalen gleich mitzuerkennen.

Die Auswahl kann zudem invertiert werden, sodass alle Bereiche außerhalb der Markierung selektiert werden.

Die mit den Auswahltools selektierten Bereiche lassen sich nun auf verschiedene Art weiter bearbeiten. Mit der Gain-Einstellung wird die Lautstärke des gewählten Bereiches abgesenkt oder verstärkt. Das Tonal/Noise Filter entfernt entweder tonales Material oder Geräusche. Zudem ist die Balance zwischen den beiden Komponenten regelbar. So lassen sich etwa Atemgeräusche und Geigenobertöne leichter voneinander trennen.

Das Smart Attenuate Tool analysiert Informationen rechts und links vom ausgewählten Punkt, um abweichende Signalanteile (wie ein Schlagzeugartefakt in einem länger gehaltenen Vocal-Ton) zu finden und zu entfernen.

Mit dem Denoise-Tool wird vom Rest des ausgewählten Spektrums abweichendes Rauschen oder Instrumentenüberlagerung ausfindig gemacht. Im Test entfernt es beispielsweise einen ausklingenden Klavierton, derin die einsetzende Gesangsspur überspricht, indem der Punkt davor als Noise gekennzeichnet wird. Bei der anschließenden Anwendung auf den Überlappungsbereich wird das Klavier entfernt, der Gesang aber bleibt am Platz – sehr praktisch!

Ist – mit einer guten Portion Geduld und Fingerspitzengefühl – die saubere Trennung von Vocals und Musik geglückt, werden die Ergebnisse mit einem Klick zu einer neuen Datei gerendert.

 

 

Exportieren

Bearbeitete Einzelspuren ebenso wie die zusammengerechneten Spuren sind zu jedem Bearbeitungszeitpunkt exportierbar als WAV oder im STEMS-Format – die DJs wird es freuen. Im Process-Bereich wird dabei die Comp-Spur exportiert.

Klang

Für den Test wählten wir eine eigene Aufnahme zur Lautstärkeanpassung, sowie zwei weitere Aufnahmen und eine kurze Sprachaufnahme mit Hintergrundgeräuschen für die Separierung.

Die Lautstärkeanpassung funktioniert schon nach der automatischen Analyse erstaunlich gut, nach einer überarbeiteten Separierung natürlich entsprechend homogener. In wenigen Minuten ist die Aufnahme, deren zu leiser Gesang schon seit langem störte, repariert.

Bei den Aufnahmen, die wir für die Separierung gewählt hatten, sind gute Ergebnisse bei der schlagzeuglosen Pianoballade deutlich schneller zu hören als bei der Aufnahme im vollen Bandsound. Um hier zufriedenstellende Ergebnisse zu bekommen, die nicht von Artefakten wimmeln, sind Fingerspitzengefühl und viel Geduld ein Muss. In fünf Minuten wird sich hier keine perfekte Gesangsspur für einen Remix erstellen lassen, der man ihre Herkunft nicht anhört. Bei der gewählten Sprachaufnahme war die Separierung etwas leichter, da die Geräusche deutlicher von der Stimme zu unterscheiden waren. Hier brauchten wir an der automatischen Trennung nicht mehr viel ändern und hatten tatsächlich sehr schnell zufriedenstellende Ergebnisse. Für Post-Production im Filmton könnte TRAX Pro 3 SP so ein wertvolles Werkzeug sein.

 

Fazit

Ob schnelle Lautstärkeanpassung der Gesangsspur in fertigen Aufnahmen, Erstellung von Instrumental- oder Solo-Vocalspuren für Remixe oder zur Verbesserung von Sprachaufnahmen mit Hintergrundgeräuschen – Audionamix hat mit TRAX Pro 3 SP ein mächtiges Werkzeug entwickelt. Wer perfekte Ergebnisse nach fünf Minuten erwartet, wird hier natürlich nicht glücklich, aber die Ergebnisse, die sich mit etwas Geduld erreichen lassen, sind die Mühe definitiv wert.