Oliver Alsbach, CGI

Oliver Alsbach

Director Consulting

In der Radio- und Audioproduktion zeigt KI bereits heute, was sie bewirken kann. Sie erleichtert Redakteurinnen und Redakteuren die Arbeit, beschleunigt ihre Workflows radikal und ermöglicht Services, an die zuvor nicht zu denken gewesen wäre. Dabei wird eines deutlich: KI muss nicht an Zauberei grenzen, um eine echte Hilfe zu sein. Vielmehr sind es altbekannte Anwendungen – wie Speech-to-Text – die dank KI endlich den erhofften Mehrwert bringen.

Ob endlose Parlamentsdebatten, abendfüllende Fußballspiele oder stundenlange Konzertmitschnitte: Tagtäglich zeichnen Rundfunksender riesige Mengen an Material auf. Darin rasch ein bestimmtes, aussagekräftiges Statement zu finden, war bis vor Kurzem mühsame Arbeit und dauerte lang. Zeit ist beim Radio jedoch ein entscheidender Faktor. Soll in den nächsten Nachrichten über etwas berichtet werden, muss es schnellgehen.

Künstliche Intelligenz (KI) ist in diesem Szenario ein Game-Changer. Mit ihrer Hilfe werden Mitschnitte automatisch transkribiert. Im Audio-Editor wird der erstellte Text parallel zur so genannten Hüllkurve, also der Visualisierung des Audiopegels, angezeigt. Die Redakteurinnen und Redakteure können einfach im Text suchen. Markieren sie dort eine Stelle, springt die Markierung im Audio an genau den passenden Zeitstempel. Sie können eine Stelle auswählen, sie ausschneiden, daraus ein neues Audio erstellen, es in die Sendeplanung einfügen und ausspielen – dies alles in kürzester Zeit.

Speech-to-Text auf einem neuen Level

Die ersten Anfänge von Speech-to-Text reichen mehrere Jahrzehnte zurück, doch erst durch Machine Learning (ML) und KI hat sich die Technologie so weiterentwickelt, dass sie einen deutlichen Mehrwert bieten kann. Wurden anfangs nur wenige gesprochenen Wörter richtig niedergeschrieben, ist heute eine Erkennungsrate von über 90 Prozent realistisch.

Das Beispiel Speech-to-Text zeigt sehr anschaulich, dass es niemals reicht, eine neue Technologie auf den Markt zu bringen. Erst, wenn ihre Qualität stimmt, wird sie tatsächlich angewendet und kann sich etablieren.

Eine besondere Herausforderung für Speech-to-Text ergibt sich aus der Vielzahl an immer neuen Themen, Begriffen und Eigennamen. Auch die Vermischung von Wörtern aus verschiedenen Sprachen ist für die Technologie sehr anspruchsvoll – sei es das Einbinden von fremdsprachigen Fachbegriffen oder vom allseits bekannten Denglisch. Spracherkennungssysteme werden deshalb darauf trainiert, eigenständig neue Wörter und Phrasen zu lernen – und sie werden laufend besser darin. Insgesamt ist die Transkriptions-Qualität heute erstaunlich. Die KI liefert sogar eine Prozentzahl mit, wie hoch die Wahrscheinlichkeit ist, dass das von ihr ermittelte Ergebnis stimmt.

Archive werden zu Schatzkammern

Ist der Text transkribiert, können hierauf weitere Funktionen aufsetzen. Sehr hilfreich ist es, wenn KI die wichtigsten Schlüsselwörter ermittelt und automatisch in den Metadaten ergänzt. Dies erhöht die Nutzbarkeit der Inhalte drastisch. Rundfunkanstalten verfügen über umfangreiche Archive, die bis in die Anfänge der BRD und DDR zurückreichen können. Im Laufe der Jahre wurde solches Archivmaterial weitgehend digitalisiert – doch nutzen lassen sich die Inhalte erst, wenn sie auch gefunden werden können. Mit KI lassen sich komplette Archive in Sekundenschnelle durchsuchen. Zudem gelingt es immer zuverlässiger, automatisiert zu bestimmen, welche Person wann spricht. Durch die Kombination von Sprach- und Sprechererkennung wird es möglich, ohne großen Aufwand ein bestimmtes Statement einer bekannten Person zu finden.

Schon längst sind KI-Funktionen wie diese in CGI dira! integriert – unser Content-Management- und Playout-System für die Radio- und Audio-Produktion. Die dira!-Produktfamilie deckt alle Arbeitsabläufe ab, die für das Medienmanagement im Radiojournalismus erforderlich sind: von der Produktion von Sendungen und dem Austausch von Materialien und Programmen über die Sendeplanung und die eigentliche Ausstrahlung bis hin zur Nachbearbeitung und Archivierung. Da unsere Kunden unterschiedliche KI-Technologien präferieren, tragen wir dafür Sorge, dass sich alle Lösungen nahtlos einbinden lassen.

Was die Zukunft bringen wird

KI hat im Radiojournalismus bereits gezeigt, dass sie eine große Unterstützung sein kann. Daher ist die Branche sehr aufgeschlossen gegenüber dem, was sich für die nahe Zukunft abzeichnet: -

  • Großes Potenzial liegt beispielsweise in der automatisierten Nachbearbeitung von Audiomaterial, das in der Folge schneller gesendet werden kann. -
  • Füllwörter und Überlegungslaute lassen sich automatisiert herausschneiden. -
  • Zudem kann KI Vorschläge machen, wie das Audiomaterial am besten gekürzt wird, oder es automatisiert schneiden – zum Beispiel für Podcasts, Kurzformate oder Teaser auf verschiedenen Plattformen. -
  • Ebenso kann KI Showprofile erstellen und dabei unterstützen, Musik, Bilder und Videos themen- oder marktbezogen zusammenzustellen und einzuplanen.
     

Aber auch über Text-to-Speech wird viel diskutiert. Ob sich KI-generierte Nachrichtensprecherinnen und -sprecher etablieren werden, bleibt indes abzuwarten.

Anhand der Radioproduktion wird deutlich, dass KI ein ideales Werkzeug dafür sein kann, die Arbeit kreativer Menschen zu unterstützen. Sie übernimmt wiederkehrende, einfache Tätigkeiten, sodass sich die Redakteurinnen und Redakteure auf Wichtigeres konzentrieren können. Sie hilft ihnen, schnell die richtigen Informationen zu finden, und mehr Output für verschiedenste Plattformen zu generieren. Menschen sind – und bleiben – in diesem Prozess unersetzlich.

Über diesen Autor

Oliver Alsbach, CGI

Oliver Alsbach

Director Consulting

Oliver Alsbach ist als Product Owner für die Entwicklung von dira! verantwortlich – unserem Content-Management- und Playout-System für die Radio- und Audio-Produktion.