Virtuelle Primadonnen

Die Hersteller Zero-G und Soundiron treten zum Kampf der Technologien an. Beide wollen eine klassische Sopranstimme auf unterschiedlichen Wegen virtuell zum Leben erwecken. Der eine nutzt Sprach-Synthese, der andere arbeitet auf Basis von Samples.

Von Sylvie Frei 

Die künstliche Nachbildung der menschlichen Gesangsstimme ist nach wie vor eine große Herausforderung, denn kein anderes Instrument besitzt so viele klangliche Details und Eigentümlichkeiten. Die Hersteller Zero-G und Soundiron haben sich mit unterschiedlichen Methoden dieser Herausforderung dennoch gestellt und die Stimme einer klassischen Opernsopranistin in Software gegossen. Schon im Jahr 2008 veröffentlichte der britische Hersteller Zero-G mit Prima eine virtuelle Sängerin, die auf dem Sprach-Software-Synthesizer Vocaloid 2 von Yamaha basiert. Zentrales Werkzeug in Vocaloid 2 ist ein Piano-Roll-Editor, in dem jede MIDI-Note mit einer Silbe der englischen Sprache sowie mit individuellem Vibrato versehen werden kann. Außerdem besteht die Möglichkeit, Automationskurven für eine große Auswahl von Gesangsparametern einzuzeichnen – beispielsweise für den Helligkeitsgrad der Intonation, die Dynamik oder den Öffnungsgrad des virtuellen Sänger-Mundes. Vocaloid 2 lässt sich sowohl über VST oder ReWire mit der DAW verbinden als auch im Stand-alone-Betrieb nutzen. Außerdem kann die Software MIDI-Dateien importieren und Audio-Dateien exportieren. Prima ist inklusive Vocaloid 2 für einen Preis von 70 Dollar bei Zero-G als Download erhältlich. Einen anderen Weg geht der US-amerikanische Soundware-Hersteller Soundiron mit seinem erst kürzlich veröffentlichten Voice of Rapture: The Soprano. Die Library ist das erste Produkt einer geplanten vierteiligen Reihe, für die professionelle klassische Gesangs-Solistinnen und -Solisten gesampelt werden. Die Soprano-Library basiert auf der Stimme der US-amerikanischen Opern-Sängerin Nichole Dechaine und enthält sowohl Multi-Samples als auch Phrasen-Material, das in insgesamt 81 Kontakt-Instrumenten-Presets geordnet ist. Das rund 3,5 Gigabyte umfassende Material besteht aus chromatischen Einzeltönen über zwei Oktaven, die auf den Lauten Ah, Ee, Mm, Oo, Woh und Yeh aufgenommen wurden. Außerdem beinhaltet The Soprano gesungene und gesprochene Phrasen eines lateinisch-sprachigen Chorals und eines französisch-sprachigen Gedichts, gepfiffenen Phrasen und Stimm-Effekte wie Luftholen, Lachen oder Husten. Hinzu kommen diverse aus den Gesangssamples kreierte Klangflächen-Instrumente sowie ein virtuelles Effekt-Rack bestückt mit Delay-, Reverb-, Amp-Simulations- und Kompressor-Effekten. The Soprano läuft ausschließlich auf den Vollversionen der Sampler Kontakt 4 und Kontakt 5 des Berliner Herstellers Native Instruments und ist für einen Preis von rund 140 Dollar erhältlich. 

 

Wollen wir uns die beiden virtuellen Sängerinnen zunächst im Detail ansehen. Den Anfang macht Prima für Vocaloid 2.
Die grafische Benutzeroberfläche des Vocaloid 2-Editors ist in vier untereinanderliegende Bereiche gegliedert: Menüleiste, Werkzeugleiste/Player, Piano-Roll-Editor und Automationsbereich. Prima selbst hat keine eigene Benutzeroberfläche und produziert im Hintergrund den Klang, der mit Vocaloid geformt werden kann. Die Eingabe von Melodie und Text erfolgt über den Piano-Roll-Editor. Einziger Unterschied zu den aus den Sequenzern bekannten Editoren: Jede MIDI-Note kann mit einer Text-Silbe in englischer Sprache versehen werden. Töne ohne Text werden automatisch mit einem Ooh-Laut versehen. Alle Silben werden in ihrer gewöhnlichen Schreibweise und in leicht modifizierter SAMPA-Lautschrift angezeigt. Der einzige Unterschied zur gewöhnlichen SAMPA: Für lange Vokale sind hinter das jeweilige Lautschrift-Zeichen Doppelpunkte zu setzen – ein eigentlich unnötiges Stilmittel, das aus der IPA-Lautschrift übernommen wurde.Besonderheit: Es ist möglich, dem Wörterbuch der Software, das für die Erkennung der Silben verantwortlich zeichnet, neue Worte beizubringen. Dies gelingt durch Eintragung der Worte und ihrer Aussprache in Lautschrift. So kann Prima mit etwas Aufwand und Fleiß theoretisch auch in anderen Sprachen als Englisch singen, was die Palette an Möglichkeiten entscheidend vergrößert. Im PDF-Manual ist praktischerweise eine englisch- und eine japanisch-sprachige Lautschrift-Gegenüberstellung zu finden, die das Editieren für Konsonanten und Vokale dieser beiden Sprachen erleichtert.Außerdem kann für jede Note zwischen unterschiedlichen Arten von Vibrato – schnelles, starkes, sanftes – gewählt werden und die Zeit, wie viel Vibrato pro Ton erklingen soll, festgesetzt werden. Prima kann zudem Portamenti singen, die sowohl für aufsteigende als auch absteigende Intervalle aktiviert werden können.Vocaloid erlaubt zwar pro Spur nur das Erstellen einer monophonen Melodie, bei der sich zumal keine Töne überlappen dürfen. Doch Chorsätze sind dennoch kein Problem: Maximal 16 monophone Spuren sind pro Instanz möglich. Sehr schön: Die Noten der anderen Spuren können dank Overlay-Modus sogar leicht transparent im Piano-Roll-Editor eingeblendet werden, sodass der Arrangeur immer den Überblick über den gesamten Satz hat.
Zu den Editor-Features kommen noch insgesamt zehn automatisierbare Parameter hinzu, die erheblichen Einfluss auf die Artikulation des virtuellen Gesangs nehmen.Die Velocity regelt, wie lange die Konsonanten am Anfang einer Silbe erklingen. Ein hoher Wert in der Kurve steht für kurze, ein niedriger für lange Konsonanten.Dynamics bezeichnet erwartungsgemäß die Kurve, die für die Anpassung der Lautstärke steht, während Breathiness, den Grad an Hauchigkeit festlegt. Die Grundeinstellung dieses Wertes steht auf dem geringsten Wert. Um etwas mehr Hauch auf die Stimme zu bekommen, genügen schon recht niedrige Werte. Die Brightness-Kurve beeinflusst hingegen die Präsenz einer Stimme. Je direkter sie klingen soll, desto höher muss der Wert gesetzt werden. Clearness regelt, wie klar und scharf oder sanft und flüsternd die Töne artikuliert werden. Der Gender Factor vermag es, der Stimme einen helleren, weiblicheren Anstrich oder einen abgedunkelten, männlichen Anstrich zu verleihen. Sehr hohe Werte führen zu einer tenorartig gefärbten, männlich anmutenden Stimme, während sehr niedrige Werte den Klang einer hochgepitchten Chipmunk-Stimme kreieren. In Maßen eingesetzt lassen sich über den Gender Factor typische Ethno-Stimmgebungen formen, die zwischen hell und dunkel intonierten Tönen changieren. Opening beeinflusst hingegen den Grad, wie weit der Mund der virtuellen Sängerin geöffnet sein soll. Hohe Werte verursachen einen höheren, offeneren Klang. Niedrige Werte bewirken hingegen einen sehr viel dumpferen Sound. Die Grundeinstellung arbeitet mit dem höchsten Wert, der auch am Ehesten der Artikulation einer professionellen, klassischen Sängerin entspricht. Die Portamento Timing-Ansicht ist hingegen keine Kurve, sondern zeigt lediglich mit Hilfe von vertikalen Streifen an, zwischen welchen Noten Portamenti stattfinden. Über die Pitch Bend-Kurve kann das Pitch Bending für die Melodie automatisiert werden. Die Pitch Bend Sensitivity-Kurve legt dafür fest, wie viel Einfluss die Pitch Bend-Kurve auf die Noten hat. Der maximale Wert ermöglicht eine Einflussnahme von bis zu zwei Oktaven nach oben und unten. Mit dezentem Einsatz lassen sich kleinere Intonations-Ungenauigkeiten erzielen, die der Stimme einen noch natürlicheren Klang verleihen.Die Automationskurven werden auf mehreren, übereinanderliegenden Ebenen gezeichnet. Das Stift-Werkzeug dient dabei zum Freihandzeichnen, während das Linienwerkzeug zum Zeichnen linearer Übergänge nützlich ist. Mit dem Augen-Symbol lassen sich auch momentan nicht eingeblendete Automations-Kurven-Layer leicht transparent einblenden. So können zwei oder mehr Eigenschaften leicht aufeinander abgestimmt werden.Da die Berechnung der einzelnen Parameter – gerade auch beim Einsatz mehrerer Spuren – die CPU stark belastet, bietet Vocaloid außerdem die Möglichkeit, den derzeitigen Bearbeitungsstand einer Spur – Töne, Silben und Automationen – vorzurendern. So können diese nach einem kurzen Rendervorgang ohne Verzögerungen abgespielt werden. Vocaloid kann außerdem bestehende MIDI-Dateien importieren, sodass sich diese für den virtuellen Sänger bearbeiten lassen. Der fertig editierte Gesang kann abschließend als Wav-Datei exportiert werden.

Trotz der vielen unterschiedlichen Parameter und Beeinflussungsmöglichkeiten fällt uns das Bedienen der Software im Praxistest keinesfalls schwer. Besonders hilfreich sind die enthaltenen Demoarrangements, anhand derer sich die Möglichkeiten der Software im Detail optisch und akustisch erkunden lassen. Innerhalb kürzester Zeit stellt sich ein angenehmer Spaßfaktor beim Experimentieren ein. Einzig die Anpassungsmöglichkeiten von Lautschrift und Wörterbucheinträgen müssen wir in der PDF-Anleitung nachschlagen. Derartige Anpassungen sind im Vergleich zur übrigen Bedienung auch so zeitaufwändig, dass wir bei unserer Gesangslinie in der Ausgangssprache Englisch bleiben.Klanglich liefert Prima durchaus hörenswerte Ergebnisse. Ihr sanftes, dezent nasales, nicht ganz so hell gefärbtes Timbre erinnert – ohne Einsatz von Gender Factor, Brightness und Opening – eher an die Wärme eines Mezzosoprans. Die besten Ergebnisse liefert Prima bei langsamen, getragenen und lyrischen Stücken mit weichen fließenden Melodielinien. Eine wirklich akzentuierte, dramatische Intonation wird von der Software nicht unterstützt. Wie problemlos das Überblenden der einzelnen Silben über die Bühne geht, hängt dabei ganz von der Silbenkombination und dem zu überbrückenden Intervall ab. Kleine Intervalle mit ähnlich artikulierten Silben intoniert Prima weitestgehend organisch. Größere Intervalle und sehr unterschiedlich klingende Silben führen bei den Übergängen von Ton zu Ton zu unnatürlichen, der menschlichen Stimme fremden Geräuschen. Die Möglichkeit, Ton für Ton mit unterschiedlich hohen Dosen und Arten von Vibrato zu versehen, machen Prima jedoch variabel und lebendig. So ist es selbstverständlich auch möglich vollkommen ohne Vibrato zu arbeiten, sodass auch Repertoire jenseits der Klassik von Prima interpretiert werden kann. Grundsätzlich gilt, je mehr und je organischer automatisiert wird, desto authentischer klingt das Endprodukt. Dies kann bei individueller Zuweisung von Vibrato und Portamento für jede einzelne Note und mit bis zu zehn Automationskurven einige Zeit in Anspruch nehmen. Doch die Mühe lohnt sich, klingt doch das Endresultat ungleich authentischer als vor der Bearbeitung. 
Zwar kann Prima im Soloeinsatz – trotz aller Nachbearbeitung – noch immer als virtuelle Stimme enttarnt werden. Doch im Rahmen eines Arrangements oder eines mehrstimmigen Satzes kommt sie nahezu beliebig nah an die Performance einer echten lyrischen Sopranistin heran. Insgesamt gefällt uns die Stimme des Prima-Instruments und der von allem unnötigen Ballast befreite, intuitiv bedienbare Vocaloid 2-Editor sehr gut.
Widmen wir uns als nächstes der Konkurrenz aus der Soundiron-Schmiede. Anders als Prima baut die Kontakt-Anwendung Voice of Rapture: The Soprano nicht auf einer Sprach/Gesangssynthese-Technologie auf, sondern besteht zu einem Großteil aus frei spielbarem Multi-Sample- sowie Phrasenmaterial, das sich über Kontakt 4 und 5 abspielen lässt. Die Soprano-Library ist also, abgesehen von den lateinisch- und französisch-sprachigen Phrasen im eigentlichen Sinne nicht sprachfähig. Wer keine Phrasen nutzen möchte, ist auf die Laute Ah, Ee, Mm, Oo, Woh und Yeh beschränkt. Doch die Software bietet eine breite Palette an Gestaltungsmöglichkeiten, die dieses vermeintliche Defizit zu relativieren wissen. Das Timbre der Stimme Nichole Dechaines klingt insgesamt hell und offen. Das gestalterische Spektrum reicht von einer sanften und luftigen Intonation bis hin zu einer kräftigen, liquiden und expressiven Singweise. Auch hohe, schrille und vibrierende Töne finden sich im Repertoire von The Soprano. Die Stimme kann als typischer Allround-Opern- und Oratorien-Sopran beschrieben werden, der sowohl das lyrische als auch das dramatische Fach beherrscht. Insgesamt bietet die Library 81 Instrumenten-Presets – 35 davon für Kontakt 4, 46 für Kontakt 5. Die Kontakt 4- und Kontakt 5-Instrumente sind nur zum Teil identisch. Unterschied: Während die Presets für Kontakt 4 nur Samples in niedrigerer Qualität enthalten, verfügt Kontakt 5 auch über solche in hoher Qualität. Ein Upgrade auf Kontakt 5 ist für eine vollständige Nutzung der Software also zu empfehlen. Die Presets sind im Falle von Kontakt 5 in vier Haupt-Kategorien/Ordner gegliedert. Im Lite- und High-Quality-Ordner finden sich die gleichen Gesangs-Presets, einmal in geringerer CPU-sparender, das andere mal in hoher Samplequalität. Der Tempo-Sync-Ordner enthält noch einmal alle phrasenbasierten Presets und ermöglicht, unter Einsatz von Kontakts Time Machine Pro-Funktionen, Phrasen zu stauchen, zu strecken oder im Tempo einander anzugleichen. Lite- und Hi Quality-Ordner enthalten zunächst vier chromatisch spielbare Presets. Dazu zählen Legato Ah, Legato Ah-Oo und Legato Oo, deren Sample-Material in echter Legato-Manier eingesungen wurde. Während die Ah-Laute in forte und mit starkem Vibrato artikuliert wurden, erklingen die Oo-Laute in piano und ohne Vibrato. Das Preset Sustains erlaubt eine Auswahl aus den Lauten Ah, Ee, Mh, Oo, Woh und Yeh – je einmal mit und ohne Vibrato. Alle chromatisch spielbaren Instrumente verfügen dabei über einen Stimmumfang von h bis d‘‘‘. Über diverse Bedienelemente lassen sich außerdem die Eigenschaften der erklingenden Töne beeinflussen, wie etwa ihr Legato-Verhalten, die Anschwell-Lautstärke oder die Art und Weise, wie Töne angesetzt werden und ausklingen. The Soprano ist zudem auch polyphon spielbar, wobei bis zu drei Stimmen gewählt und gleichzeitig gespielt werden können.  Im Praxistest gestaltet sich der Umgang mit der Library überaus leicht und intuitiv. Es ist keinerlei Eingewöhnungszeit oder Handbuch-Studium vonnöten. Alle Bedienelemente erklären sich durch Ausprobieren und Hören quasi von alleine. Klanglich haben die chromatisch spielbaren Presets einiges zu bieten und ermöglichen es, sowohl ruhiges und getragenes als auch dramatischeres und expressiveres Melodiegut zu realisieren. Staccato- und Legato-Optionen sowie die Möglichkeit mit oder ohne Vibrato zu arbeiten, geben uns eine Vielzahl von musikalischen Gestaltungsmöglichkeiten an die Hand. Die fehlende Sprachfähigkeit vermissen wir im Test nicht – lassen sich doch viele Background-Gesangsarrangements, Chöre oder Vokallinien für Musikstücke auch ohne Worte glaubhaft umsetzen. Um mit den chromatisch spielbaren Presets ein möglichst lebensechtes Klangbild zu erzielen, ist schon etwas Zeit und Geduld nötig, bis alle Parametereinstellungen in gewünschter Weise gesetzt sind. Die Überblendungen zwischen den einzelnen Tönen gestalten sich dabei sehr viel weicher und organischer als bei Prima. Besonders in den Legato-Presets klingen sie so glaubhaft, dass The Soprano auch problemlos solistisch eingesetzt werden kann und sich nicht in einem Ensemble verstecken muss.

Außer den chromatisch spielbaren Presets verfügt The Soprano über sieben unterschiedliche, auf Phrasen basierende Instrumente. Phrases French wartet mit sieben Phrasen-Sets auf, die unterschiedliche, ausdrucksvolle Vertonungen des Gedichts Ici-bas des französischen Dichters Sully Prudhomme beinhalten. Alle Phrasen sind dem traurigen Text des Gedichts entsprechend in Moll gesungen und in unterschiedlichen ruhigen, bis dramatisch anschwellenden und schmelzenden Legato-Melodien gehalten. Das Material eignet sich für eine traurige, melancholische bis dramatische Szene beispielsweise in einem Film- oder Gamesoundtrack. Phrases Latin enthält hingegen unterschiedliche Choral-Versionen des Ave Maria in lateinischer Sprache. Alle Melodien sind in unterschiedlichen Kirchentonarten intoniert und zeigen typische Melodiefortschreitungen des Gregorianischen Chorals. Sie klingen ruhig, sakral, getragen, meditativ und sind der Choral-Ästhetik entsprechend weitgehend ohne Vibrato eingesungen worden. Sie eignen sich beispielsweise für eine mystische oder besinnliche Stimmung in einem Film- oder Game-Soundtrack oder für ein Ambient- oder Trance-Stück.Praktisch: Für die französisch- und lateinisch-sprachigen Phrasen-Presets sind übrigens die Texte – inklusive einer Übersetzung ins Englische – im PDF-Handbuch abgedruckt, sodass sich der Nutzer bei seinen Kompositionen auch an den Wortbedeutungen orientieren kann.Phrases Vowels enthalten hingegen eine große Anzahl an Tonfolgen auf Basis unterschiedlicher Vokale. Diese sind mal kürzer, mal länger und haben teils ruhigen, teils dramatisch-expressiven, teils hypnotischen oder klagenden Charakter. Die Phrasen sind überwiegend in unterschiedlichen Moll-Skalen intoniert. Dadurch, dass sie frei von Text sind, lassen sie sich besonders flexibel für unterschiedlichste Musikstücke einsetzen oder können sogar als Keimzelle für eine Komposition benutzt werden.Phrases Whistles enthält hingegen zahlreiche gepfiffene Phrasen. Das Spektrum reicht von ruhigen, über heitere bis zu einer Vielzahl von düster-unheimlichen Melodien. Die Pfeif-Phrasen können wir uns besonders gut als Vertonungselement eines düsteren Films oder Computerspiels vorstellen.Für alle Phrases-Presets ist die Kontakttastatur übrigens so belegt, dass alle blau unterlegten Tasten die einzelnen Phrasen abspielen und alle orange hinterlegten Tasten unterschiedliche Atemgeräusche produzieren. So lassen sich bei einer Live-Performance mit der linken Hand die Phrasen spielen und mit der rechten Hand Atemgeräusche zwischen den Phrasen hinzufügen, welche den Gesang noch authentischer gestalten. Das Polystaccato-Preset enthält eine Auswahl von rund 20 lateinisch-sprachigen mehrsilbigen, im Staccato eingesungene Worte oder Wortkombinationen, die auf jedem der Töne des Stimmambituses gespielt werden können. Allerdings klingt die hohe Hälfte der obersten Oktave ziemlich gequält, was aber natürlich auch bei einem echten Sänger nicht weniger der Fall wäre. Dieses Preset können wir uns am Ehesten für einen Chorsatz vorstellen, bei dem mehrere Stimmen auf unterschiedlichen Tönen eindringlich die lateinischen Worte deklamieren, den hohen Extrembereich würden wir aus ästhetischen Gründen jedoch meiden.Sehr ähnlich ist auch das Preset Polysustains gestaltet. Der einzige Unterschied zum Polystaccato-Preset ist, dass die mehrsilbigen lateinisch-sprachigen Worte langsamer und im Legato intoniert wurden.Vocal Effects enthält hingegen eine große Zusammenstellung von Stimmgeräuschen abseits des Gesangs. Dazu zählen unterschiedliche Gelächter-Phrasen, Räuspern, Stimmaufwärmübungen, die wie ein Raunen über mehrere Vokale klingen, Atemgeräusche und unterschiedliche gesprochene und geflüsterte Phrasen in französischer und lateinischer Sprache, die sowohl in Legato als auch Staccato vorhanden sind, sowie geflüsterte Laute. Diese bunte Palette an Geräuschen können wir uns sehr gut für die Synchronisation von Computer-Spielen oder Filmen vorstellen, aber auch für unterschiedlichste Musikstücke oder Hörspiele. 
Als vollwertiger Sängerinnen-Ersatz kann natürlich keine der beiden Software-Lösungen dienen. Dennoch erfüllen sie ihren Zweck und reichern Arrangements mit vokalem Leben an. Die Stärken des Prima-Instruments liegen dabei klar in ihrer Sprachkompetenz und den vielfältigen Möglichkeiten, die Stimme durch Automation zum Leben zu erwecken. Das eher dunkle, lyrische Timbre verleiht ihr einen speziellen, angenehmen Charakter. Ihre Schwäche ist hingegen das mitunter sehr synthetisch klingende Überblenden zwischen den einzelnen Tönen/Silben. Dadurch, dass Prima auch ohne Vibrato singen kann, ist sie nicht ausschließlich auf klassisch intoniertes Repertoire beschränkt, sondern auch als Pop-, Chanson- oder Folk-Stimme einsetzbar. Dabei ist sie jedoch auf eher lyrisches und getragenes musikalisches Material beschränkt. Eine wirklich kraftvolle, dramatische bis schrille Intonation ist trotz unterschiedlicher Vibratotypen und Dynamikautomation nicht möglich. Prima empfiehlt sich besonders für Skizzen von Vocal-Linien in der Vorproduktion. Ihr Stimmcharakter ist authentisch genug, um die Sanglichkeit einer komponierten Melodie einschätzen zu können.
Die Stärken der Soprano-Library liegen hingegen in ihrer Vielseitigkeit. Die Library umfasst leise und sanft, aber auch dramatisch und schrill intonierte Töne, sowohl mit als auch ohne Vibrato. So lässt sich The Soprano für lyrisches und dramatisches, klassisches Repertoire, aber auch für sakrale Musik, Filmsoundtracks oder alle denkbaren Musikgenres einsetzen. Die Überblenden zwischen den Tönen sind sehr weich und natürlich und klingen sehr viel authentischer als bei Prima. So ist es möglich, The Soprano auch vollkommen solistisch einzusetzen. Die umfangreichen Phrasenpresets, die Stimmeffekte und die Klangflächen der Ambience-Instrumente bilden eine zusätzliche Ergänzung und empfehlen sich als ideale Werkzeuge für Film- und Game-Soundtrack-Kompositionen. Einzig sprachfähig ist die Library – abgesehen von den Phrasen in französischer und lateinischer Sprache – nicht. Daher eignet sie sich hauptsächlich für Background-Arrangements und textfreie Soloeinsätze.

Fazit

Prima und The Soprano gelingt es auf unterschiedliche Weise, die menschliche Stimme – teils an der Grenze zur Verwechselbarkeit mit einer echten Sopranistin –nachzubilden. Insgesamt gesehen ist The Soprano die authentisch klingendere Lösung, wenn sie auch im Gegensatz zu Prima nicht mit Sprachkompetenz aufwarten kann.

Erschienen in Ausgabe 09/2013

Preisklasse: Oberklasse
Preis: 139$
Bewertung: sehr gut
Preis/Leistung: sehr gut