Adobe-Produkt "VoCo"

Neue Software manipuliert unsere Sprache

Ein Mann hält sich in Osnabrück als Gehörschutz einen Finger in das Ohr.
Vorsicht vor "VoCo" - Martin Burckhardt warnt vor Manipulation. © dpa / picture alliance / Friso Gentsch
Von Martin Burckhardt · 17.11.2016
Jeder kennt Photoshop, jeder benutzt Bildbearbeitungsprogramme, um Urlaubsfotos und Selbstportraits schöner zu machen. Nun aber gibt es etwas Ähnliches für Sprachdateien - eine schöne, neue Welt kinderleichter Manipulation öffnet sich.
Wie können Sie sicher sein, dass das, was Sie gerade hören, von mir, dem Autor dieses Beitrags so gesagt worden ist? Und wie kann ich sicher sein, dass das, was ich gesagt habe, in unverfälschter Form wiedergegeben wird?
Leider, lieber Hörer, können weder Sie, noch kann ich mich darauf verlassen. Willkommen also in der Welt der "Lügenpresse" oder, wenn Sie so wollen, im post-faktischen Zeitalter. Was ist passiert? Ist das Deutschlandradio von Aliens übernommen worden? Nein, nein, es ist alles ganz anders, und viel harmloser zugleich. Die Firma Adobe (die uns mit dem Grafikprogramm Photoshop schon jene photogeshoppten Mutanten beschert hat, die als Schönheitsideale unsere Fernsehzeitschriften zieren) hat vor Kurzem ein kleines Weltverbesserungswerkzeug vorgestellt, das auf den Namen "VoCo2 hört.

Adobe hat einen Quantensprung geschafft

Der Clou: Es erlaubt dem Nutzer, eine beliebige Audiodatei auf denkbar simple Weise zu verändern – und einem Menschen Wörter in den Mund zu legen, die er niemals gesagt hat. Dazu muss er nicht einmal die Wellenform der Audiodatei bearbeiten, sondern tippt das entsprechende Wort in die Textspur, in diesem Fall also »Lügenpresse«, ein Wort, das ich nicht einmal in den Mund nehmen würde. Trotzdem haben wir die Bescherung, denn: Ratzfatz eingetippt, fertig ist die Fälschung! Und das Ergebnis ist so beeindruckend, dass selbst ich mich täuschen lassen und glauben könnte, ich hätte etwas gesagt, was ich in Wahrheit doch niemals gesagt habe.
Wie aber ist das möglich? Nun: Die Software braucht, um sich mit den Eigenheiten meiner Stimme und meiner Sprechweise vertraut zu machen, eine etwa 20-minütige Stimmprobe – dann ist sie, auf der Basis der zergliederten Phoneme und mit einer geschickten Intonations-Implementierung, imstande, mir alle erdenklichen Dinge in den Mund zu legen: Unwörter wie die "Lügenpresse" oder Zungenbrecher wie: Als Anna abends aß, aß Anna abends Ananas.
Glückwunsch! Und das ist aufrichtig gemeint – denn vergleicht man die Qualität dieser Aufnahme mit dem Roboterklang der klassischen Textsynthese-Programme, hat Adobe hier einen Quantensprung geschafft.
Schön, könnte ein advocatus diaboli einwenden, aber ist das wirklich so neu? Halten wir uns unsere computeraugmentierten Filmproduktionen vor Augen, stellt sich die Frage, ob wir nicht längst von animierten Gespenstern umgeben sind, Werwölfen, Hobbits, Superhelden, ganz zu schweigen von den Werbeplakaten, die uns mit ihrer Photoshop-Glasur in den Hyperralismus hinein katapultieren – in jene Sphäre der Makellosigkeit, in der man nur mit der Hilfe eines Schönheitschirurgen zu überleben vermag.
Abgesehen von den Kunstgestalten der Yellow Press, haben wir schon seit geraumer Zeit Anlass, an unseren Sinnen zu zweifeln. Denn in unserer Photoshop-Welt muss ein zeitgemäßer Jurist zögern, eine Fotografie als "objektiven Tatsachenbeweis" anzuerkennen. Denn was immer digitalisiert werden kann, kann auch manipuliert werden – und warum sollte unsere Stimme hier eine Ausnahme darstellen?
Warum aber wirkt diese Aussicht besonders unheimlich? Wahrscheinlich liegt es daran, dass unsere Stimme seit jeher als Sitz der Seele gegolten hat, unserer "anima". Und wird auch diese computeranimiert, beraubt man uns nicht bloß der äußeren, sondern auch der inneren Werte.

Gibst du dem Opi Opium, bringt Opium den Opi um

Bezeichnenderweise hat sich diese Drohung auch in Adobes Produktpräsentation niedergeschlagen – bei der der Entwickler Zeyu Jin einem Comedy-Künstler vorführte, dass er nicht nur seine Frau, sondern, sodomistischerweise, seine Hunde, dann einen gewissen Jordan geküsst habe, dreimal!
Was bedeutet dieser Kuss für uns, die wir uns als Bewohner des "Informationszeitalters" begreifen? Vielleicht, dass wir über den Begriff der Information nachdenken müssen. Denn informare heißt heißt nicht einfach, dass wir auf denkbar neutrale Weise über etwas unterrichtet werden, es bedeutet, dass sich eine Kraft in uns einformt – dass man es mit einer neuen, digitalen Einbildungskraft zu tun bekommt. Gibst du dem Opi Opium, bringt Opium den Opi um.
Martin Burckhardt, geboren 1957, Autor und Kulturtheoretiker, lebt in Berlin. Verfasste diverse Bücher zur Genealogie der Maschine. Zuletzt erschienen: "Digitale Renaissance. Manifest für eine neue Welt" (Metrolit, 2014), der Roman "Score" (Knaus, 2015) sowie "Alles und Nichts. Ein Pandämonium digitaler Weltvernichtung" (gem. mit Dirk Höfer, Matthes & Seitz 2015).
Mehr zum Thema