Medien im Wandel: Künstliche Intelligenz als Gamechanger

Hinweis: mit "Play" wird eine Verbindung zu Podcastbude, Media On Work GmbH, Potsdam hergestellt.

In dieser Folge von Digitalwandler spricht Host Philipp Ebnet mit dem Medienexperten Michael Thielen, Vice President bei CGI Deutschland, um zu erfahren, wie künstliche Intelligenz die Medienlandschaft verändert. Im Gespräch diskutieren sie, wie die Technologie dank der einfacheren Bearbeitung von Inhalten neue Effizienzstandards setzt, aber auch, welche Risiken künstliche Intelligenz birgt und worauf Medienproduzenten sowie -rezipienten achten sollten.

Diese Inhalte erwarten Sie in der Episode 1.

1. Künstliche Intelligenz als Gamechanger in der Content-Produktion

Künstliche Intelligenz verstärkt den Demokratisierungsprozess der Medienproduktion: Schnitt und Bearbeitung sind längst keine Spezialaufgaben mehr, jeder kann Content erstellen. Für professionelle Redaktionen bringt dies die Herausforderung mit sich, mit der neuen Breite an Creator-Formaten Schritt zu halten.

„Im Prinzip kann heute jeder selbst zum Content Creator werden und Dinge umsetzen, die früher Spezialistinnen und Spezialisten vorbehalten waren.“] 2.

2. Neue Effizienzstandards in der Medienproduktion

Künstliche Intelligenz erleichtert die Erstellung von Inhalten. Deutliche Verbesserungen sieht Michael Thielen in der Audiotranskription, in der Archivaufbereitung und -verwendung sowie der Audioverbesserung. Künstliche Intelligenz beschleunigt den Schnittprozess und kann schlechte Aufnahmen in nahezu Studioqualität verwandeln.

„ Wir haben festgestellt, dass das Säubern von O-Tönen oft 80 bis 90 Prozent der täglichen Arbeit vieler Journalistinnen und Journalisten ausmacht. Genau hier kann künstliche Intelligenz unterstützen und die Arbeit spürbar schneller und zugleich hochwertiger machen.“] 3.

3. Künstliche Intelligenz erhöht Risiko der Desinformation

Trotz aller Vorteile birgt künstliche Intelligenz auch Risiken. Mit Stimmklonen und Deepfakes lassen sich Desinformationen leichter verbreiten. Eine Gegenmaßnahme besteht in der Verwendung digitaler Wasserzeichen oder der Beglaubigung von Inhalten in einer Blockchain. Wichtig für Rezipienten ist es außerdem, Inhalte kritisch zu hinterfragen, während Medienproduzenten vor allem darauf achten müssen, das bestehende Vertrauen nicht zu verspielen.

Transkript

Zum Nachlesen: das vollständige Gespräch mit Sprecherwechsel.

Begrüßung

Philipp Ebnet, CGI: Hallo und herzlich willkommen zur neuen Folge unseres Podcasts Digitalwandler. Ich bin Philipp und ich will in dieser Staffel herausfinden, wie es um die Digitalisierung in Deutschland steht.

Und du bist natürlich herzlich eingeladen, mich auf meiner Lernreise zu begleiten. In jeder Folge werden wir mit konkreten Beispielen erkunden, wie sich analoge Abläufe in digitale wandeln lassen. Heute will ich wissen, wie es sich um das Medienumfeld in Deutschland steht. Und ich habe ganz viele Fragen dabei, etwa wie sich Medienproduktion ändert, aber auch wie ich mein eigenes Konsumverhalten anpassen soll. Und ein paar Antworten auf die Fragen zu erhalten, habe ich mir heute Michael Thielen ins virtuelle Studio geholt.

Michael hat lange bei der International Trade Association for Broadcast and Media Technology gearbeitet und ist mittlerweile als Vice President im Bereich Media bei CGI Deutschland unterwegs. Also Michael ist ganz viel im Medienumfeld unterwegs und beschäftigt sich da mit dem Wandel des Medienumfelds. Insofern erstmal, Hi Michael, vielen Dank, dass du heute bei mir hier im Studio bist und dir die Zeit nimmst.

Michael Thielen, CGI: Hallo, gerne doch.

Künstliche Intelligenz als Gamechanger in der Content-Produktion

Philipp Ebnet, CGI: Michael, Du bist gut vernetzt in der Medienwelt und hast auch viel mit dem Fraunhofer Institut für Digitale Medientechnologie, IDMT, zusammengearbeitet. Ich frage jetzt einfach mal so, welches Thema beschäftigt dich denn aktuell im Medienbereich? Was ist denn im Moment dein Fokus?

Michael Thielen, CGI: Also im Moment bin ich bei CGI zuständig für unsere Radio- und Produktionssoftware, die nennt sich dira! Das ist eine Produkt-Suite, die im Einsatz ist bei hauptsächlich öffentlich-rechtlichen Rundfunkern, die damit ihr gesamtes Radioprogramm machen. Und ja, das ist eine spannende Tätigkeit, weil sich das Medienumfeld momentan tatsächlich sehr, sehr wandelt. Wir kennen das alle.

Wenn man ein paar Jahre zurückblickt, da gab es Fernsehen, da gab es vielleicht Leute mit Videorekordern. Also ich komme aus dem Alter, da gab es noch Videorekorder. Andere Leute hatten dann DVD und Festplattenrekorder und sonst was alles. Und wenn wir heute schauen, kaum jemand schaut Programme noch linear. Es gibt die ganzen Mediatheken und das Nutzungsverhalten von Medien hat sich stark geändert und dementsprechend auch das Produktionsverhalten von Medien.

Das gibt Änderungen in den Abläufen, wie Dinge hergestellt werden, Dinge konsumiert werden. Und du fragtest, womit ich mich im Moment beschäftige, was oder wenn man sagen wollen würde, umgangssprachlich, was ist der große heiße Scheiß? Der große heiße Scheiß, der uns gerade alle umtreibt, ist im Prinzip AI. Sei es im Generativen oder sei es halt eben auch da um Arbeitsabläufe zu erleichtern, um Dinge herzustellen, Dinge zu verändern und zu verbessern bei den Content-Creatern, bei den Content-Schaffenden.

Das ist auch eine spannende Entwicklung. Die Content-Creator, das sind nicht mehr nur Journalisten, wie man es aus der Zeit früher her kennt, durch die neuen Social-Media-Plattformen, wie unter anderem auch TikTok, die ja von manchen Leuten belächelt werden. Aber im Prinzip kann jeder sein eigener Content Creator sein und im Prinzip können heute ganz viele Leute Dinge tun, die früher Leute in Spezialberufen nur gemacht haben. Gerade wenn wir uns Sachen anschauen wie Audio Schnitt, Video Schnitt. Das ist mittlerweile eine Commodity. Das kann mittlerweile jeder.

Und das ist ganz interessant, weil Medien sind aus meiner Sicht und Content ist innerhalb der letzten Jahre tatsächlich hat sich gewandelt von einem teilweise mystifizierten Ding, wo Leute gedacht haben, mein Gott, was machen die da? Wenn man drüber nachdenkt, früher war jemand, Radio macht, jemand, der Fernsehen macht, da war was ganz Besonderes, weil man hatte riesige Studios, die mit sehr, sehr viel Geld ausgestattet sind und gebaut worden sind, die gibt es heute natürlich auch noch. Aber heute kann man ganz viel dieser Dinge, für die ich früher ganz spezielle Fachwissen und ganz spezielle Dinge notwendig waren, einfach auch selber machen. Und das ist total interessant. Es ist total spannend. Es ist natürlich aber auch für die, die Medien professionell herstellen, eine Herausforderung da mit Schritt zu halten, weil mittlerweile Leute im privaten Bereich teilweise genauso innovativ, wenn nicht sogar innovativer sein können, als große Studios und große Produktionsfirmen und auch große Sender.

Philipp Ebnet, CGI: Genau, an der Stelle hätte ich auch tatsächlich gleich mal eine Frage. Nämlich jetzt hast du schon ein paar Beispiele angesprochen oder gesagt, dass es ganz viele neue Möglichkeiten gibt. Aber was ist denn so das eine Tool oder die eine Funktion, bei der du persönlich sagen würdest, das sollte sich jede Redaktion anschauen. Ganz egal, ob ich jetzt von einer Ein-Mann-Redaktion spreche oder von eben dem Hobby-Creator oder ob ich von der großen Zeitschriften oder großen Zeitungsredaktion oder großen Fernsehredaktion sprech. Wo profitiert denn jeder davon?

Transkription, Metadaten & Audioverbesserung: Neue Effizienzstandards

Michael Thielen, CGI: Das ist eine gute Frage und die Antwort ist nicht leicht, weil es, glaube ich, einfach ein Ding ist, was jetzt das Lösungstool ist für alle Probleme, die man haben können sollte, die man haben mag. Wenn man unterwegs ist im Bereich Audio, also ich bin viel im Audiobereich, kommt halt eben daher, dass wir auch eine Audiolösung hauptsächlich bereitstellen. Ein Ding, was mittlerweile aber auch schon nichts Neues mehr ist, aber was, glaube ich, für gerade große Contentagenturen, für Hörfunker, für Archive was gebracht hat, war die Einführung der automatischen Transkription.

Wenn man ganz ehrlich ist, ist das auch Nutzung von AI, weil wir haben auch dort Language-Modelle, die dafür sorgen, dass Sprache verstanden wird und gesprochenes Wort in geschriebenes Wort übersetzt wird. Und das ist was, wenn ich ganz ehrlich bin, das ist für uns schon fast alter Kram, weil das wurde vor knapp 10, 15 Jahren angefangen, flächig auszurollen. Zu Beginn war da ein sehr sehr großes Misstrauen gegenüber solchen Services, weil man gesagt hat, das kann niemals eine echte Transkription, die von einem Menschen gemacht wird, von der Genauigkeit her einholen. Da sind wir eines Besseren belehrt worden. Die Modelle sind immer besser und besser geworden. Und das Ganze ist mittlerweile so, dass es wirklich fast schon perfekt ist. Natürlich hat man falsche Worte. Natürlich hat man teilweise, gerade wenn es um Eigennamen, wenn es um Personennamen geht und das Modell diese nicht kennt, hat man schon mal falsche Namen. Man hat aber grundsätzlich den Effekt, dass das so eine Transkription schon den Sinn des gesprochenen Wortes sehr gut wiedergibt.

Und das war und ist ein ganz großes Asset und das ist das, du fragtest, wer sollte sowas nutzen? Ich bin der Meinung, jeder sollte sowas nutzen, weil jeder der irgendwelche Aufnahmen macht, Sprachmaterial bei sich beherbergt. Der hat normalerweise, gibt er dem Ding einen Titel und sagt irgendwie Interview mit Max Müller, Interview mit Frau Merkel. Wenn du dann ein sehr ordentlicher Mensch bist, dann schreibst du vielleicht noch einen Text dazu und sagst irgendwie, sie gibt zu den und den Fragen irgendwelche Antworten. Du wirst aber wahrscheinlich als normaler Mensch niemals die Mühe machen, das selber zu transkribieren. Wenn es aber transkribiert ist hast du ein ganz anderes Asset, weil du durch die Anreichung der Metadaten so viel Informationen hast, dass du wirklich weißt, was du hast. Du kannst entscheiden, kann ich das auch wiederverwenden? Und du kannst vor allen Dingen es wiederfinden.

Und gerade das Finden von Assets und das Wiederverwenden von Assets ist was, was auch im professionellen Umfeld total wichtig ist, sei es bei Hörfunkern, sei es bei Fernsehsendern, weil es da letzten Endes auch darum geht, wie kann ich denn meine Assets, die ich habe, meine Archivinhalte monetarisieren?

Das ist das eine. Und das andere ist natürlich, wie kann ich die Inhalte auch schnell finden, wenn ich mal was brauche? Weil manchmal muss man Nachrufe machen zu irgendwelchen zu irgendwelchen Persönlichkeiten, zu Politikern oder sonst was alles. Und wenn man dann relativ schnell weiß, man hat noch das eine oder das andere, was die Person mal gesagt oder gemacht hat im Archiv, kann man auch schneller seine journalistischen Beiträge zusammenpacken. Das ist ein Ding, wo ich finde, das sollte man auf jeden Fall haben.

Ein zweites Ding, was hochinteressant ist, ist, wir haben mittlerweile, und wir arbeiten da auch in unserer Radioproduktionssuite zusammen mit mehreren deutschen Start-ups, extrem gute Modelle, die sich im Bereich der Audioqualitätsverbesserung rumtreiben. Und ganz stark vereinfacht gesagt, nach Peter Lustig Art, die machen aus Scheißsound guten Sound.

Die sind in erster Linie dafür gebaut, um wirklich das gesprochene Wort, egal wo es aufgenommen worden ist, egal in welcher Umgebung und egal mit welchen Störgeräuschen es aufgenommen worden ist, in einer Art und Weise zu verbessern, dass es annähernd einer Studioqualität entspricht. Und das ist tatsächlich was, was jeder der Audio-Material erstellt, wahrscheinlich kennt, man nimmt mal was auf. Manchmal hat man die besten Interview-Partner, die trifft man dann aber leider gerade, während der Trecker vorbeifährt, während ein Flugzeug über einem fliegt oder während die Kettensäge nebenan den Baum vom Nachbarn absägt. Und dann hat man einen wahrscheinlich super guten O-Ton, den man aber leider nicht benutzen kann, weil er wirklich schlecht klingt. Und da hilft die KI mittlerweile momentan massiv und kann dafür sorgen, dass Sachen gut klingen.

Und es kann auch dafür genutzt werden, dass das im Produktionsprozess und auch da wieder, das ist wahrscheinlich eher etwas was speziell für Leute, die im Audioschnitt unterwegs sind und die das kennen: Es gibt manchmal viele Leute, ich mache es persönlich leider auch ab und zu, die sagen gerne öh und äh und sonstige Überlegungslaute zwischendrin. Und so was wegzuschneiden, automatisiert ist eine enorme Hilfe.

Weil, durch auch Befragungen von vielen Journalisten haben wir festgestellt, dass gerade das sogenannte Saubermachen von O-Tönen eigentlich 80, 90 Prozent teilweise der alltäglichen Arbeit sind. Und da kann tatsächlich KI, da können moderne Language Models helfen, wirklich meine kreative Arbeit deutlich schneller und auch deutlich besser zu verrichten. Und das sind Dinge, die tatsächlich wichtig sind, die meiner Meinung nach jeder sich mal anschauen sollte. Und ich möchte jetzt keine große Werbung machen, aber vielleicht packen wir an die Shownotes ein paar Webseiten noch ran, wo es sich lohnt, sicherlich mal vorbeizuschauen und sich das anzugucken, weil das ist wirklich hochinteressant.

Von Störgeräuschen zu Studiosound – Künstliche Intelligenz zur Audioverbesserung

Philipp Ebnet, CGI: Ja, also ich muss schon schmunzeln, als du gerade das mit dem Trecker im Hintergrund erwähnt hast, weil ich erinnere mich an meine erste Straßenumfrage. Da hatte ich auch einen sehr schönen O-Ton, aber das war leider an einer Hauptstraße in Nürnberg und tatsächlich habe ich dann daheim bei der Bearbeitung der Audiodatei eben gemerkt, dass da in dem Moment leider an der Ampel irgendwie einer mit sehr lautstarken Motor angefahren ist und habe lange gekämpft, um doch noch irgendwie was Verwertbares draus zu machen.

Michael Thielen, CGI: Ich glaube jeder der mit Audio arbeitet, hat so was erlebt. Natürlich kann man da auch von Hand sehr sehr viel machen und ich möchte jetzt in keinster Weise die Arbeit von Toningenieuren hier irgendwo diskreditieren, aber auch bei der manuellen Arbeit sind teilweise Grenzen gesetzt, wo solche KI-Modelle mittlerweile tatsächlich fast mehr tun können als man manuell tun kann.

Das ist ein interessanter Punkt, weil man irgendwann in den Bereich kommt, wo die Verbesserung, die durch die KI gemacht wird, in der Theorie ein Hinzufügen von Teilelementen ist, was niemals sinnverändernd ist. Aber da kann man sich dann auch wieder auf der ethischen Basis drüber unterhalten. Ist das dann KI generiert oder nicht? Und wie groß ist da der Eingriff, der passiert ist?

Da gibt es auch unterschiedlichste Language-Modelle, die man nutzen kann. Und auf jeden Fall ist das ein super interessantes Thema. Und ich glaube, das ist im Moment auch ein Thema, was wir bei den Journalisten im Hörfunk sehen und auch bei den Content-Creatoren sehen. Die Unterstützung und Hilfe, die man da bekommt, um schneller und effizienter zu werden in der Herstellung der Beiträge, die ist riesig.

Und das ist natürlich auch, wenn wir uns gerade, wenn wir jetzt nochmal auf den Rundfunk zurückschauen, eine der Herausforderungen, die man dort ja hat, ist, man hat über die letzten Jahre immer mehr Outlets bekommen, immer mehr unterschiedliche Programmanforderungen. Früher hatte man sein lineares Radioprogramm, das hat man geplant, das hat man gesendet, dann war gut und fertig. Das ging dann los mit Wiederholungen, dass man irgendwann dann begonnen hat zu sagen, das Programm müssen wir unseren Hörern auch noch mal im Internet zur Verfügung stellen, damit sie, wenn sie nicht live hören konnten, das noch mal hören konnten. Und mittlerweile ist es ja so, dass wir, dass wir ein Programm haben und da werden dann aber unterschiedlichste Dinge für unterschiedlichste Plattformen draus generiert. Und das Problem ist schlichtweg, die Leute, die es machen, sind heute genau wie vor 10, 15 Jahren eine eine ähnliche Anzahl an Personen, wenn nicht sogar weniger.

Und das heißt, die Effizienz in der Erstellung von Programmen muss einfach steigen. Und da ist es tatsächlich über solche Methoden richtig gut und kann den Leuten tatsächlich helfen, gut voranzukommen.

Künstliche Intelligenz erhöht Risiko der Desinformation

Philipp Ebnet, CGI: Jetzt hast du gerade schon so in einem Halbsatz die ethischen Neuheiten angesprochen, die sich durch den ganzen Einsatz von KI ergeben. Und das ist natürlich auch ein großer Themenblock, bei dem ich ganz viele Fragen habe. Ganz klar.

Also der Einsatz von KI in den Medien bringt ganz viele Chancen, das ist klar, das haben wir gerade schon gut durchsprochen, also dass ich einfach viel leichter produzieren kann, viel mehr produzieren kann oder einfach meine Arbeit deutlich erleichtern kann. Aber KI in den Medien bringt auch Risiken mit sich. Das Weltwirtschaftsforum hat zum Beispiel in seinem Risiko-Report von 2025 Desinformation als eine der drei größten weltweiten Bedrohungen genannt.

Unter anderem natürlich, weil Fehlinformationen einfach den gesellschaftlichen Zusammenhalt schwächen können. Oder auch 2021 hat in einem Arte-Interview Dinara Toktosunova, das ist die ehemalige Berliner Büroleiterin von dem Sender Russia Today, hat in dem Interview gesagt, dass der dritte Weltkrieg wohl im Informationsbereich stattfinden wird.

Es gibt natürlich zahlreiche Gründe, warum diese Fehlinformationen zunehmen, also klar politisch motiviert, aber wir haben auch in der Gesellschaft zwischenmenschlich einfach viele, teils sehr fragwürdige Motivationen. Also ein Beispiel da ist für die Bundeszentrale für politische Bildung hat Anja Schmidt mal gesammelt, wie vor allem Frauen unter neuen Deepfake-Pornos einfach leiden, weil die natürlich nicht einvernehmlich erstellt werden. Also auch das ist einfach ein Beispiel für ein gesellschaftliches Problem, das jetzt nicht politisch motiviert ist, sondern das von der Gesellschaft selber kommt.

Und da würde mich jetzt einfach mal interessieren, einerseits aus Produzentensicht und einerseits aus Rezipientensicht, wie kann ich denn als Produzent sicherstellen, dass meine Nachrichten als echt und nachvollziehbar wahrgenommen werden? Also dass meine Rezipienten gar nicht überlegen, ist das, was ich da sehe, jetzt wirklich echt, sondern dass die einfach wissen, das ist eine vertrauenswürdige Quelle, das ist eine echte Nachricht, da passt alles. Was gibt es denn da so an Empfehlungen?

Michael Thielen, CGI: Das ist natürlich ein sehr großer Themenkreis und ich glaube, ganzen psychologischen Felder, das ist nicht meine Expertise. Es ist sicherlich so, dass das auf alles, was die KI-basierten Möglichkeiten, die es jetzt gibt, zutrifft, ähnlich der Spruch, den die Amerikaner gerne hier nehmen, wenn sie über Pistolen sprechen, sie sagen, die Pistole bringt niemanden sondern der Mensch, die Pistole bedient. Und es gibt ja auch die Aussage, alles ist ein Gift, aber es kommt immer auf die Dosis drauf an.

Du hast vollkommen recht. Also es ist von der technischen Sichtweise her absolut faszinierend, was die neuen technischen Möglichkeiten hergeben und was man machen kann. Es ist auf der anderen Seite auch total erschreckend, wenn man sich anschaut, dass zum Beispiel reden wir zum Beispiel über eine technisch verhältnismäßig simpel zu erstellende Sache, einen Stimmklon, das zur Erstellung eines Stimmklons von mir oder von dir, was auch schon längere Zeit geht, also die entsprechenden Modelle sind ja jetzt nicht innerhalb der letzten zwölf Monate erst entstanden. Damals musste man Stunden, wenn nicht Tage, Material von einem Originalsprecher einsammeln, um eine halbwegs ähnlich synthetische Stimme zu erzeugen.

Die aktuellen Modelle, wenn man auf Webseiten geht, die sich mit KI-Avataren auseinandersetzen, die brauchen von dir 20 bis 30 Sekunden Sprache. Die Dinge, die dabei rauskommen, sind nicht perfekt. Und wenn du gute Freunde hast und du spielst denen dann was vor, die können wahrscheinlich dann noch sehr einfach herausfinden, dass es vielleicht oder mit höherer Wahrscheinlichkeit nicht du warst. Aber wirklich sagen kann man es nicht. Und man hat manchmal im Moment noch das Glück, dass man als Mensch so ein Bauchgefühl hat und sagt irgendwie, das klingt seltsam, das passt nicht, das kann nicht echt gewesen sein. Ich sage aber extra, das ist momentan so, weil mit der Schnelligkeit, mit der die Modelle wachsen, wird es meiner Meinung nach in Kürze nicht mehr so sein, dass man es raushören kann.

Du hattest gefragt nach der Glaubwürdigkeit und ich glaube, das ist eine schwierige Sache. Ich glaube, das ist gerade im medialen Bereich und wir sehen das bei Plattformen wie TikTok zum Beispiel, da schwirrt ganz viel Content bei rum. Der ist schon KI-generiert, der ist nicht gekennzeichnet als KI-generiert. Der ist dann teilweise gepaart mit Falschinformationen und du liest dann Dinge, dass irgendwelche geht los mit du liest Sachen, dass irgendwelche prominente Personen verstorben seien und du wunderst dich, hä, kann doch gar nicht sein und guckst danach, was ist da passiert. Oder du siehst Dinge, wo du denkst, das kann doch jetzt auch nicht wirklich sein, weil wir sind als Menschen halt visuelle Menschen und sind eigentlich gewohnt, dass ein Bild, was wir sehen, echt ist. Das war lange, lange Zeit so, deshalb haben wir auch immer Fotos und Bildern geglaubt und der Mensch ist so bisschen gepolt, dass er sowas glaubt, aber, es ist halt mittlerweile nicht mehr so, dass das Bild, was ich sehe, tatsächlich wirklich echt sein muss.

Und ich glaube, für große Medienunternehmen ist erst mal der Ruf der Unternehmen, das ist deren Asset, ist wirklich deren Wichtigkeit. Wenn ich, ich sitze hier in Deutschland, in Nordrhein-Westfalen, wenn ich was höre vom WDR als Beispiel, dann weiß ich, der WDR ist eine vertrauenswürdige Organisation, der hat vernünftig recherchiert. Und ich gehe mit annähernd hundertprozentiger Sicherheit davon aus, dass was die publizieren, das was die sagen oder senden oder auf ihre Webseite stellen, das stimmt. Und ich glaube, das ist ein wichtiger Punkt, wo auch alle Produktions- und Produktschaffenden dran arbeiten. Der große Besitz ist auch das Vertrauen, was die Leute in mich haben. Und das muss erhalten bleiben. Und das ist auch wichtig für die Sender.

Vertrauen der Rezipienten ist die wichtigste Währung für Medien

Und das kann man dadurch stärken. Einerseits, dass die Leute wissen, dass was von einem gewissen Sender kommt, echt. Das kann man natürlich aber auch mit gewissen technischen Möglichkeiten unterstützen. Das heißt, wenn wir über generiertes Material reden, wenn wir über Authentizität von Material reden, es gibt technische Möglichkeiten, Material, was man erstellt, was in einer Umgebung erstellt worden ist, die vertrauenswürdig ist, auch markiert als Material.

Es gibt unterschiedlichste Formen derer Dinge, die man da tun kann. Man kann zum Beispiel digitale Wasserzeichen in Audio einbetten, die auch annähernd nicht löschbar sind. Man kann digitale Audiomaterialien, ähnlich wie man das von von Bitcoin kennt in einer Blockchain. Man kann theoretisch, das ist noch relativ aufwendig, aber man kann theoretisch jede Produktion, die erstellt wird, in einer Blockchain beglaubigen und kann somit dafür sorgen, dass ein nachvollziehbarer Lebenslauf von einem Stück Audio oder Video da ist und kann auch das dann Zuhörern oder Zusehern ermöglichen, das zu prüfen.

So was ist machbar. Es gibt auch technische Möglichkeiten. Du sagtest vorhin, wir arbeiten gerne und oft auch mit dem Fraunhofer IDMT zusammen. Die forschen an vielen Punkten, wenn es darum geht, festzustellen, ist ein Audiomaterial zum Beispiel geschnitten worden? Welche Historie hat ein Audiomaterial? Wie wahrscheinlich ist es, dass so ein Audiomaterial echt ist oder eventuell von einer KI erstellt worden ist?

Wobei dieser Punkt, gerade dieser Punkt, wie wahrscheinlich ist es, dass ein Audiomaterial von einer echten Person oder von einer KI erzeugt worden ist, das ist verdammt schwierig rauszufinden. Und das heißt, der Punkt zu sagen, wenn ich ein vertrauenswürdiges Unternehmen bin, dem die Leute vertrauen, und ich gebe meinem Material eine Kennzeichnung mit, die nachvollziehbar ist, sodass ich quasi einen Gütesiegel habe und feststellen kann, das ist wirklich echt. Das ist fast noch einfacher als hinterher zu sagen, ich prüfe technisch, ob etwas geändert worden ist. Und da gibt es mehrere Möglichkeiten. Aber ich glaube, neben den ganzen technischen Punkten, die man da zu betrachten hat, ein Punkt tatsächlich der, dass man als Unternehmung, als Rundfunker, als Informationsquelle für die Öffentlichkeit, dafür sorgen muss, dass man trotzdem saubere journalistische Arbeit leistet und eben nicht einfach nur als, ich sag mal, Verstärker fungiert und Dinge, die von irgendwo aufpoppen, einfach weiterverbreitet.

Das wird interessant und das ist sehr, spannend. Wir begleiten diese Reise auf der technischen Seite. Aber wie du vorhin auch schon gesagt hast, das ist nicht nur die technische Seite, da spannend ist, sondern das ist auch eine gesellschaftliche und ethische Diskussion, wo, glaube ich, ganz andere Leute als ich noch viel mehr, viel wichtigere Dinge zu sagen könnten.

Philipp Ebnet, CGI: Danke dir für die ganzen technischen Ausführungen, sehr spannend. Und ich denke auch, dass, weil du vorhin gesagt hast, das Schöne ist, dass wir Menschen ja auch ein Bauchgefühl haben. Und ich glaube, das ist auch ein wichtiger Punkt, dass einfach wir auf Rezipientenseite eben noch mal stärker uns bewusst machen, dass wir die Medien, die wir konsumieren, ja, noch mal, wenn es wichtige Sachen sind, die wir da sehen, noch mal stärker hinterfragen. Also ist die Quelle vertrauenswürdig? Ist die Quelle eine Originalquelle? Ich meine, wenn Michael Jackson versucht, mir ein Produkt zu verkaufen, dann kann ich mir relativ sicher sein, dass das KI-generiert ist. Aber wenn ich jetzt irgendwie sehe, dass keine Ahnung, Donald Trump Belgien dazu auffordert, dem Klimaabkommen auszusteigen, dann muss ich schon dreimal nachschauen, vielleicht ob das nicht doch echt sein könnte. Aber dann eben nicht gleich glauben, sondern erst verschiedene Quellen, seriöse Quellen nachfragen und einfach, wie du selber schon gesagt hast, einfach mal auf das Bauchgefühl hören, auf das eigene.

Michael Thielen, CGI: Also ich denke, das einzige Problem ist, dass das Bauchgefühl halt eben mit immer besser werdender Technologien immer schwieriger hat, tatsächlich einen validen Hinweis zu geben, was da so passiert, weil wie gesagt, die LLMs, die es da gibt, die ganzen Möglichkeiten, die es da gibt, die werden so schnell so viel besser und dass es das eigentlich fast nicht mehr heraushörbar ist.

Und es ist dann auch immer die Frage, wenn jemand gezielt desinformieren möchte, in der Regel werden die Leute nicht den totalen Quatsch verbreiten, sondern werden es subtiler unterbringen. Und je subtiler Fehlinformationen untergebracht sind, und je plausibler ein Gesamteindruck ist, den ich bekomme durch etwas, ich höre oder was ich sehe, desto noch schwieriger wird es, dann festzustellen, ist das jetzt was, worauf ich vertrauen kann oder nicht.

Und ich glaube, das wäre so mein Punkt. Ich hoffe, dass gerade öffentlich-rechtliche Medien, die ja in vielen europäischen und grundsätzlich in vielen Ländern als quasi vertrauenswürdige Nachrichteninstanz gelten. Ich glaube, die werden sehr viel Zeit aufbringen und Arbeit aufbringen, dieses Verständnis der Rezipienten, dass es sich wirklich um vertrauenswürdige Nachrichten handelt, nicht verspielen, weil das ist, glaube ich, ganz wichtig und das ist essenziell.

Verabschiedung

Philipp Ebnet, CGI: Ja, das glaube ich auch, dass es ein Prozess ist, an dem viele Akteure beteiligt sein werden und beteiligt sein müssen. Aber ich bin dir und deinen Kollegen sehr dankbar, dass ihr die technische Seite betrachtet und vorantreibt und einfach da ein paar Sicherheitsmerkmale auf technischer Seite oder Lösungen entwickelt und euch da dafür einsetzt.

Insofern sage ich schon mal ganz vielen Dank, Michael, dass du heute da warst. Wir sind auch schon am Ende unserer Folge. Insofern danke dir, dass du da warst. Vielen, Dank für die ganzen Antworten. Ich fand es mega spannend, habe ganz viel gelernt, nehme sehr viel mit. Und auch an dich danke, dass du zugehört hast. Ich hoffe auch, dass es dir gefallen hat. Wenn es dir gefallen hat, dann like und subscribe den Podcast gern, damit du keine Folge verpasst. Und ich freue mich natürlich schon auf das nächste Mal und bis dahin sage ich tschau, wir hören uns.

Quellangaben

Im Gespräch erwähnte Statistiken: