"Mathematisches Hintergrundwissen, einen spitzen Bleistift und dann einen Computer"
Viel Material sei nicht nötig, um eine wegweisende Methode für die Komprimierung von Videodaten zu erfinden, meint Professor Thomas Wiegand vom Fraunhofer Institut für Nachrichtentechnik in Berlin. Dank der Technik seines Teams seien viele Arbeitsplätze entstanden.
Dieter Kassel: Jan Rähm über den Videokomprimierungsstandard H.264, der heute weltweit Anwendung findet. Wir haben das gerade gehört, er hat uns das Team von Wissenschaftlern des Fraunhofer-Instituts für Nachrichtentechnik Heinrich-Hertz-Institut in Berlin vorgestellt. Und der Sprecher dieses Teams, das für den Deutschen Zukunftspreis nominiert ist, der ist jetzt bei mir im Studio, Professor Thomas Wiegand, schönen guten Tag!
Thomas Wiegand: Ja, guten Tag!
Kassel: Als Laie kommt mir natürlich immer dieser Vergleich mit MP3 in den Sinn, wo ja manche Dinge ähnlich sind, nur dass es nur um Töne geht. Da wird auch weggelassen, was man nicht hören kann, und die Dinge werden so übertragen, dass man nicht immer diese riesigen Datenmengen hat. Tut man Ihnen unrecht, wenn man sagt, das ist im Prinzip MP3 mit Bildern?
Wiegand: Nein, das ist durchaus ähnlich. Das, was bei MP3 für Audiosignale gemacht wurde, das machen wir ganz ähnlich für Videosignale. Wir reduzieren die Datenmenge. Und das Einzige ist eben, MP3 ist das File-Format und der Kodierstandard darin war MPEG1 DR3, und wir sind eben ein Kodierstandard in einem anderen File-Format für Filme.
Kassel: Ich will nicht wieder den Vergleich mit MP3 bemühen, aber was wir auch wissen, ist, das ist eine Technik, ein Standard, der eigentlich auch aus Deutschland kommt, von einem anderen Fraunhofer-Institut. H.264 haben im Kern Sie, also Ihre beiden erwähnten Kollegen und Sie in Berlin entwickelt. Was mich eigentlich wundert, weil, man könnte ja glauben, die Orte, wo das am dringendsten benötigt wird, wo viele Wissenschaftler sitzen, sind USA, Japan, vielleicht andere Länder. Warum kommt so eine Technik gerne mal aus Deutschland?
Wiegand: Also, H.264 ist das Werk von vielen und wir waren daran beteiligt. Es erscheint so, als ob wir mit einer sehr guten Tradition im Bereich Kompression ausgestattet sind in Deutschland, und im Grunde brauchen Sie nicht viel mehr als mathematisches Hintergrundwissen, einen spitzen Bleistift und dann einen Computer, um die Verfahren erst mal zu simulieren. Das ist sozusagen der Startpunkt. Und witzigerweise war ich in den 90ern in Erlangen, ich habe dort promoviert und habe auch damals die Bekanntschaft der MP3-Leute machen können und habe mich aber ganz klar für Video interessiert und dieses Thema vorangebracht.
Kassel: Das ist jetzt, finde ich, erstaunlich, wenn Sie sagen, man braucht einen spitzen Bleistift! Das heißt, ein Teil der Arbeit findet wirklich mit Stift und Papier statt in einer gewissen Phase?
Wiegand: Definitiv! Wir fangen immer an mit mathematischen Ideen und das Aufschreiben dieser Ideen und das Diskutieren, das ist der erste Schritt. Bevor irgendwas programmiert wird, reden wir immer darüber, wie wirkt sich das auf in Bezug auf bestimmte Größen. Nicht umsonst ist zum Beispiel eine Person in unserem Team ein Mathematiker.
Kassel: Jetzt haben Sie Erlangen schon erwähnt, aber Sie sind ja im Laufe Ihrer Karriere auch sowohl in den USA gewesen als Wissenschaftler als auch mal eine kurze Zeit in Japan. Wenn Sie das vergleichen - weil man ja immer diese Vorstellung hat, gerade wenn man als Wissenschaftler im naturwissenschaftlichen, technischen Bereich arbeitet -, ist es in den USA, vielleicht sogar in Japan schon aufgrund der Mentalität besser? Kann man das überhaupt so sagen? Sie haben ja Erfahrungen in mindestens diesen drei Ländern!
Wiegand: Ja, es ist leider so, dass von der Kultur her in Deutschland ganz häufig Technik und Wissenschaft als nicht so wichtig angesehen wird. Wenn Sie sich unsere Tageszeitungen ansehen, dann finden Sie dort auf der ersten Seite eigentlich nie Technologie. In der "LA Times" finde ich da ständig Technologie. Das ist ein Aspekt, der mir aufgefallen ist. Aber das, was ich als sehr positiv empfinde, ist, dass viele junge Menschen, die hier aufwachsen, ein Ingenieurstudium anfangen, während zum Beispiel in Amerika die in Amerika Aufwachsenden häufig andere Studiengänge wählen.
Kassel: Wir reden heute im Deutschlandradio Kultur mit Thomas Wiegand, der zusammen mit seinem Team vom Heinrich-Hertz-Institut in Berlin als eins von vier Teams nominiert ist für den Deutschen Zukunftspreis. Und bei Ihnen geht es, wie schon erwähnt, um den Kodex H.264. Das klingt jetzt natürlich nicht unglaublich sexy, aber vielleicht können wir das mal kurz sexy machen, weil ich weiß, dass Sie schon zwei Mal eine Emmy bekommen haben für diese Entwicklung! Emmy kennt vielleicht der ein oder andere, das ist der wichtigste Fernsehpreis der Welt, den kriegen natürlich Regisseure und Schauspieler und Drehbuchautoren, aber den gibt es auch für technische Entwicklungen. Und Sie haben, glaube ich, den dann auch wirklich in Las Vegas entgegengenommen, zwei Mal gab es einen! Was ist das für ein Gefühl? Wissenschaftspreise und Anerkennung von Technikern ist das eine, aber wenn wirklich die Menschen, die mit Ihrer Technik zum Beispiel Fernsehfilme dann so produzieren und vor allen Dingen weiterverbreiten können, wenn die Ihnen einen Preis geben, was für ein Gefühl ist das?
Wiegand: Ja, das war ganz interessant. Ich habe im Jahr 1995 nach meiner Diplomarbeit in Hamburg, war ich als junger Wissenschaftler in Kalifornien an der Universität in Santa Barbara und hatte dort die Möglichkeit, verschiedene Themen mir auszuwählen. Und ein Thema war eben Videokodierung. Und dieser Postdoc zeigte mir eine Szene, die er gerade kodiert hatte und dekodiert hatte aus einem Film, der damals sehr populär war, und dann hatten wir auch über die Mathematik geredet und die Algorithmen, und das ganze Paket zusammen fand ich so interessant, dass ich mich für dieses Gebiet dann entschieden hatte. Und dann bekomme ich sozusagen 13 Jahre später in Hollywood und dann noch mal in Las Vegas eine Emmy von gerade diesen Filmleuten überreicht. Das war auch ganz interessant, da hat sich so ein Kreis geschlossen.
Kassel: Da schließt sich natürlich die Frage an, also, die Schätzungen sind ja aktuell, dass so etwa 60 bis 70 Prozent des Datenverkehrs im Internet jetzt schon durch Bewegbilder verursacht werden. Und auch wenn immer diese Zukunftsprognosen schwierig sind, da sind sich alle einig, das wird noch weiter zunehmen. Und da haben natürlich alle, die die Netzinfrastruktur zur Verfügung stellen, Probleme. Kann man denn ohne - wir wollen ja alle immer bessere Bilder haben, wir wollen ja jede Videokonferenz in HD haben inzwischen -, kann man denn das immer weiter komprimieren? Oder sagen Sie auch, irgendwann wird das Netz zusammenbrechen vor lauter Videos?
Wiegand: H.264 ist ja ein Ergebnis der Arbeiten des letzten Jahrzehnts und wir haben seit 2010 an der Nachfolge gearbeitet. Dieser Nachfolgestandard wird dann etwa 40 Prozent geringere Bit-Raten erhöhen, was wahrscheinlich dazu führen wird, dass der Verkehr im Netz noch weiter anschwellen wird. Ich hatte mal diese Frage von meinen Netzleuten: Warum komprimiert ihr denn so gut, wir wollen doch auch, dass die Leute, das Netz ausgelastet sind. Und ich habe dann immer gesagt, je mehr wir komprimieren, desto mehr Netzverkehr habt ihr, weil immer mehr Geschäftsmodelle ermöglicht werden, und immer mehr Personen können Videos sich übers Internet ansehen. Und das heißt also, dass dieser Datenverkehr noch weiter anschwellen wird. Unsere Arbeiten zu H.264 und jetzt auch zum Nachfolgestandard, die haben natürlich eine enorme Bedeutung für ganz viele Bereiche.
Nehmen Sie zum Beispiel die Deutsche Telekom, die haben ein IPTV-System aufgebaut, um ihre DSL-Netze, mit denen sie ja Internet zur Verfügung stellen, auch für Fernsehen benutzen zu können. Und mit so einer DSL-Leitung, so eine klassische, bekommen Sie 16 Megabit pro Sekunde. Die mussten aber HDTV in ihr IPTV-System einstellen, das heißt also, ohne H.264 gäbe es dieses Business bei denen nicht. Und dann gäbe es 1000 Arbeitsplätze weniger. Und diese Art von Werten, die wir durch die Arbeiten geschaffen haben, das setzt sich immer weiter fort in ganz viele andere Bereiche, in der Telemedizin, wo es eben möglich wird, über Videokonferenzen Patienten auch zu Hause zu behandeln, oder anderen Ärzten möglichst bei Operationen dabei zu sein, in der Sicherheitstechnik, und eben der gesamte Unterhaltungsbereich, den wir ja schon vielfältig diskutiert haben.
Kassel: Ein bisschen ist es auch immer wie der Hase und der Igel: Als Sie angefangen haben das zu entwickeln vor zehn Jahren, war ja einer der Hauptgründe, weshalb es einen neuen Kodex bedurfte, die zunehmende Verbreitung von HDTV, also von einfach viel auflösenden Bildern, die im Prinzip viel mehr Daten brauchen. Dann kam, das haben Sie ja schon integriert, dann mussten Sie sozusagen nacharbeiten. Dann kam 3D, was natürlich im Prinzip noch mal eine Vergrößerung der Datenmenge passiert. Das heißt, es ist auch immer so, sobald der Wissenschaftler einen Kodex entwickelt hat, mit dem er sagt, das rechnen wir so weit runter ohne Verlust, da passt einiges durch die Leitung, kommt eigentlich immer jemand und erfindet was, was noch mehr Daten braucht!
Wiegand: Ja, ist doch super, da hat man auch immer wieder Arbeit!
Kassel: Dann hoffe ich, dass die Arbeit Ihnen erhalten bleibt! Ich hoffe aber vor allen Dingen, dass Sie zwischendurch Grund zum Feiern haben, nächste Woche am Mittwoch wird dann nämlich vom Bundespräsidenten der Deutsche Zukunftspreis nominiert. Ich muss unparteiisch sein, wir stellen ja alle vier Teams vor, insofern, ich schwöre, ich sage das die nächsten drei Tage auch: Ich würde es Ihnen und Ihren Kollegen herzlich gönnen! Professor Wiegand, danke, dass Sie bei uns waren!
Wiegand: Sehr gerne!
Kassel: Und morgen wieder um die gleiche Zeit, kurz nach elf im Anschluss an die Elf-Uhr-Nachrichten stellen wir Ihnen dann das nächste dieser vier nominierten Teams vor. Da geht es dann um Forscher, die mit neuer Technik gegen Datendiebe vorgehen.
Äußerungen unserer Gesprächspartner geben deren eigene Auffassungen wieder. Deutschlandradio macht sich Äußerungen seiner Gesprächspartner in Interviews und Diskussionen nicht zu eigen.
Thomas Wiegand: Ja, guten Tag!
Kassel: Als Laie kommt mir natürlich immer dieser Vergleich mit MP3 in den Sinn, wo ja manche Dinge ähnlich sind, nur dass es nur um Töne geht. Da wird auch weggelassen, was man nicht hören kann, und die Dinge werden so übertragen, dass man nicht immer diese riesigen Datenmengen hat. Tut man Ihnen unrecht, wenn man sagt, das ist im Prinzip MP3 mit Bildern?
Wiegand: Nein, das ist durchaus ähnlich. Das, was bei MP3 für Audiosignale gemacht wurde, das machen wir ganz ähnlich für Videosignale. Wir reduzieren die Datenmenge. Und das Einzige ist eben, MP3 ist das File-Format und der Kodierstandard darin war MPEG1 DR3, und wir sind eben ein Kodierstandard in einem anderen File-Format für Filme.
Kassel: Ich will nicht wieder den Vergleich mit MP3 bemühen, aber was wir auch wissen, ist, das ist eine Technik, ein Standard, der eigentlich auch aus Deutschland kommt, von einem anderen Fraunhofer-Institut. H.264 haben im Kern Sie, also Ihre beiden erwähnten Kollegen und Sie in Berlin entwickelt. Was mich eigentlich wundert, weil, man könnte ja glauben, die Orte, wo das am dringendsten benötigt wird, wo viele Wissenschaftler sitzen, sind USA, Japan, vielleicht andere Länder. Warum kommt so eine Technik gerne mal aus Deutschland?
Wiegand: Also, H.264 ist das Werk von vielen und wir waren daran beteiligt. Es erscheint so, als ob wir mit einer sehr guten Tradition im Bereich Kompression ausgestattet sind in Deutschland, und im Grunde brauchen Sie nicht viel mehr als mathematisches Hintergrundwissen, einen spitzen Bleistift und dann einen Computer, um die Verfahren erst mal zu simulieren. Das ist sozusagen der Startpunkt. Und witzigerweise war ich in den 90ern in Erlangen, ich habe dort promoviert und habe auch damals die Bekanntschaft der MP3-Leute machen können und habe mich aber ganz klar für Video interessiert und dieses Thema vorangebracht.
Kassel: Das ist jetzt, finde ich, erstaunlich, wenn Sie sagen, man braucht einen spitzen Bleistift! Das heißt, ein Teil der Arbeit findet wirklich mit Stift und Papier statt in einer gewissen Phase?
Wiegand: Definitiv! Wir fangen immer an mit mathematischen Ideen und das Aufschreiben dieser Ideen und das Diskutieren, das ist der erste Schritt. Bevor irgendwas programmiert wird, reden wir immer darüber, wie wirkt sich das auf in Bezug auf bestimmte Größen. Nicht umsonst ist zum Beispiel eine Person in unserem Team ein Mathematiker.
Kassel: Jetzt haben Sie Erlangen schon erwähnt, aber Sie sind ja im Laufe Ihrer Karriere auch sowohl in den USA gewesen als Wissenschaftler als auch mal eine kurze Zeit in Japan. Wenn Sie das vergleichen - weil man ja immer diese Vorstellung hat, gerade wenn man als Wissenschaftler im naturwissenschaftlichen, technischen Bereich arbeitet -, ist es in den USA, vielleicht sogar in Japan schon aufgrund der Mentalität besser? Kann man das überhaupt so sagen? Sie haben ja Erfahrungen in mindestens diesen drei Ländern!
Wiegand: Ja, es ist leider so, dass von der Kultur her in Deutschland ganz häufig Technik und Wissenschaft als nicht so wichtig angesehen wird. Wenn Sie sich unsere Tageszeitungen ansehen, dann finden Sie dort auf der ersten Seite eigentlich nie Technologie. In der "LA Times" finde ich da ständig Technologie. Das ist ein Aspekt, der mir aufgefallen ist. Aber das, was ich als sehr positiv empfinde, ist, dass viele junge Menschen, die hier aufwachsen, ein Ingenieurstudium anfangen, während zum Beispiel in Amerika die in Amerika Aufwachsenden häufig andere Studiengänge wählen.
Kassel: Wir reden heute im Deutschlandradio Kultur mit Thomas Wiegand, der zusammen mit seinem Team vom Heinrich-Hertz-Institut in Berlin als eins von vier Teams nominiert ist für den Deutschen Zukunftspreis. Und bei Ihnen geht es, wie schon erwähnt, um den Kodex H.264. Das klingt jetzt natürlich nicht unglaublich sexy, aber vielleicht können wir das mal kurz sexy machen, weil ich weiß, dass Sie schon zwei Mal eine Emmy bekommen haben für diese Entwicklung! Emmy kennt vielleicht der ein oder andere, das ist der wichtigste Fernsehpreis der Welt, den kriegen natürlich Regisseure und Schauspieler und Drehbuchautoren, aber den gibt es auch für technische Entwicklungen. Und Sie haben, glaube ich, den dann auch wirklich in Las Vegas entgegengenommen, zwei Mal gab es einen! Was ist das für ein Gefühl? Wissenschaftspreise und Anerkennung von Technikern ist das eine, aber wenn wirklich die Menschen, die mit Ihrer Technik zum Beispiel Fernsehfilme dann so produzieren und vor allen Dingen weiterverbreiten können, wenn die Ihnen einen Preis geben, was für ein Gefühl ist das?
Wiegand: Ja, das war ganz interessant. Ich habe im Jahr 1995 nach meiner Diplomarbeit in Hamburg, war ich als junger Wissenschaftler in Kalifornien an der Universität in Santa Barbara und hatte dort die Möglichkeit, verschiedene Themen mir auszuwählen. Und ein Thema war eben Videokodierung. Und dieser Postdoc zeigte mir eine Szene, die er gerade kodiert hatte und dekodiert hatte aus einem Film, der damals sehr populär war, und dann hatten wir auch über die Mathematik geredet und die Algorithmen, und das ganze Paket zusammen fand ich so interessant, dass ich mich für dieses Gebiet dann entschieden hatte. Und dann bekomme ich sozusagen 13 Jahre später in Hollywood und dann noch mal in Las Vegas eine Emmy von gerade diesen Filmleuten überreicht. Das war auch ganz interessant, da hat sich so ein Kreis geschlossen.
Kassel: Da schließt sich natürlich die Frage an, also, die Schätzungen sind ja aktuell, dass so etwa 60 bis 70 Prozent des Datenverkehrs im Internet jetzt schon durch Bewegbilder verursacht werden. Und auch wenn immer diese Zukunftsprognosen schwierig sind, da sind sich alle einig, das wird noch weiter zunehmen. Und da haben natürlich alle, die die Netzinfrastruktur zur Verfügung stellen, Probleme. Kann man denn ohne - wir wollen ja alle immer bessere Bilder haben, wir wollen ja jede Videokonferenz in HD haben inzwischen -, kann man denn das immer weiter komprimieren? Oder sagen Sie auch, irgendwann wird das Netz zusammenbrechen vor lauter Videos?
Wiegand: H.264 ist ja ein Ergebnis der Arbeiten des letzten Jahrzehnts und wir haben seit 2010 an der Nachfolge gearbeitet. Dieser Nachfolgestandard wird dann etwa 40 Prozent geringere Bit-Raten erhöhen, was wahrscheinlich dazu führen wird, dass der Verkehr im Netz noch weiter anschwellen wird. Ich hatte mal diese Frage von meinen Netzleuten: Warum komprimiert ihr denn so gut, wir wollen doch auch, dass die Leute, das Netz ausgelastet sind. Und ich habe dann immer gesagt, je mehr wir komprimieren, desto mehr Netzverkehr habt ihr, weil immer mehr Geschäftsmodelle ermöglicht werden, und immer mehr Personen können Videos sich übers Internet ansehen. Und das heißt also, dass dieser Datenverkehr noch weiter anschwellen wird. Unsere Arbeiten zu H.264 und jetzt auch zum Nachfolgestandard, die haben natürlich eine enorme Bedeutung für ganz viele Bereiche.
Nehmen Sie zum Beispiel die Deutsche Telekom, die haben ein IPTV-System aufgebaut, um ihre DSL-Netze, mit denen sie ja Internet zur Verfügung stellen, auch für Fernsehen benutzen zu können. Und mit so einer DSL-Leitung, so eine klassische, bekommen Sie 16 Megabit pro Sekunde. Die mussten aber HDTV in ihr IPTV-System einstellen, das heißt also, ohne H.264 gäbe es dieses Business bei denen nicht. Und dann gäbe es 1000 Arbeitsplätze weniger. Und diese Art von Werten, die wir durch die Arbeiten geschaffen haben, das setzt sich immer weiter fort in ganz viele andere Bereiche, in der Telemedizin, wo es eben möglich wird, über Videokonferenzen Patienten auch zu Hause zu behandeln, oder anderen Ärzten möglichst bei Operationen dabei zu sein, in der Sicherheitstechnik, und eben der gesamte Unterhaltungsbereich, den wir ja schon vielfältig diskutiert haben.
Kassel: Ein bisschen ist es auch immer wie der Hase und der Igel: Als Sie angefangen haben das zu entwickeln vor zehn Jahren, war ja einer der Hauptgründe, weshalb es einen neuen Kodex bedurfte, die zunehmende Verbreitung von HDTV, also von einfach viel auflösenden Bildern, die im Prinzip viel mehr Daten brauchen. Dann kam, das haben Sie ja schon integriert, dann mussten Sie sozusagen nacharbeiten. Dann kam 3D, was natürlich im Prinzip noch mal eine Vergrößerung der Datenmenge passiert. Das heißt, es ist auch immer so, sobald der Wissenschaftler einen Kodex entwickelt hat, mit dem er sagt, das rechnen wir so weit runter ohne Verlust, da passt einiges durch die Leitung, kommt eigentlich immer jemand und erfindet was, was noch mehr Daten braucht!
Wiegand: Ja, ist doch super, da hat man auch immer wieder Arbeit!
Kassel: Dann hoffe ich, dass die Arbeit Ihnen erhalten bleibt! Ich hoffe aber vor allen Dingen, dass Sie zwischendurch Grund zum Feiern haben, nächste Woche am Mittwoch wird dann nämlich vom Bundespräsidenten der Deutsche Zukunftspreis nominiert. Ich muss unparteiisch sein, wir stellen ja alle vier Teams vor, insofern, ich schwöre, ich sage das die nächsten drei Tage auch: Ich würde es Ihnen und Ihren Kollegen herzlich gönnen! Professor Wiegand, danke, dass Sie bei uns waren!
Wiegand: Sehr gerne!
Kassel: Und morgen wieder um die gleiche Zeit, kurz nach elf im Anschluss an die Elf-Uhr-Nachrichten stellen wir Ihnen dann das nächste dieser vier nominierten Teams vor. Da geht es dann um Forscher, die mit neuer Technik gegen Datendiebe vorgehen.
Äußerungen unserer Gesprächspartner geben deren eigene Auffassungen wieder. Deutschlandradio macht sich Äußerungen seiner Gesprächspartner in Interviews und Diskussionen nicht zu eigen.