Viele Unternehmen beschäftigen sich inzwischen mit künstlicher Intelligenz – doch nur ein Teil schafft es, daraus echten Mehrwert zu erzeugen. Fehlende Strategie, schlechte Datenqualität oder unrealistische Erwartungen führen häufig dazu, dass KI-Projekte scheitern oder nie produktiv genutzt werden.
In dieser Folge des Digitalwandlers spricht Philipp Ebnet mit Merlin Spöttl über die Frage, wie Unternehmen KI sinnvoll einsetzen können und welche Voraussetzungen dafür geschaffen werden müssen.
Im Verlauf des Gesprächs wird deutlich: Erfolgreiche KI-Projekte entstehen selten allein aus technischer Begeisterung. Entscheidend ist vielmehr, dass Unternehmen konkrete Geschäftsprobleme identifizieren, qualitativ hochwertige Daten nutzen und Mitarbeitende aktiv in den Veränderungsprozess einbinden.
Die Folge richtet sich an alle, die verstehen möchten, wie Unternehmen künstliche Intelligenz strategisch einsetzen können, ohne sich vom Hype oder von technischen Entwicklungen verunsichern zu lassen.
- Begrüßung
-
Philipp Ebnet, CGI:
Herzlich willkommen bei der neuen Folge unseres Podcasts Digitalwandler. Ich bin Philipp und will in diesem Podcast erfahren, wie es um die Digitalisierung in Deutschland steht. Alle zwei Wochen lade ich mir Expertinnen und Experten ins virtuelle Studio ein, die mir meine zahlreichen Fragen zu Best Practices und ungenutzten Chancen der Digitalisierung beantworten, mir aber auch verraten, wo noch Verbesserungsbedarf besteht. Heute geht es noch mal künstliche Intelligenz.
Heute geht es noch mal um künstliche Intelligenz. Ich bin in Folge 1 ja bereits der Frage nachgegangen, was sich hinter dem Begriff Agentic AI verbirgt. In Folge 3 habe ich mich ein bisschen mit künstlicher Intelligenz in den Medien auseinandergesetzt. Und in Folge 4 hat mir Ralf Richter zum Beispiel erklärt, wie sich Communities für den Austausch über künstliche Intelligenz aufbauen lassen, damit man beruflich nicht den Anschluss verliert.
Und heute will ich das Thema noch mal bisschen konkret aus Unternehmenssicht beleuchten. Warum? Weil das Institut der Deutschen Wirtschaft bis 2030 mit einem durch KI gesteigerten jährlichen Produktivitätswachstum von 0,9 Prozent rechnet. Ab 2030 dann sogar mit 1,2 Prozent. Das mag jetzt erst mal nicht so viel klingen, aber zum Vergleich: 2025 lag das Wachstum der Arbeitsproduktivität bei 0,2 Prozent, wie das Statistische Bundesamt im Januar 2026 berechnet hat. Also wäre das eine sechsfache Steigerung, die wir da erzielen könnten.
Damit das aber gelingt, müssen die KI-Projekte natürlich auch erfolgreich sein. Dass das nicht immer der Fall ist, das hat eine Studie des MIT im August 2025 aufgezeigt, die auch viel diskutiert wurde, wonach 95 Prozent der KI-Projekte scheitern.
Und auch in Deutschland besteht noch viel ungenutztes Potenzial, wie das Institut der deutschen Wirtschaft selbst aufzeigt. Im Juli 2025 verwendeten demnach nur etwa 37 Prozent der Unternehmen KI-Technologien.
Als häufigstes Hindernis nennen die Unternehmen den schwer einschätzbaren Nutzen von KI oder die Fehlerquellen bei der Einführung. Außerdem fürchten sie auch den Schulungsaufwand für das Personal oder einfach die Herausforderung, die KI an die eigenen Bedürfnisse anzupassen, also überhaupt die Use Cases zu identifizieren. Und insofern will ich heute konkret dieser Frage nachgehen: Wie lassen sich maßgeschneiderte Lösungen für Business-Probleme identifizieren und auch umsetzen?
Und klar, wie immer, um eine Antwort auf die Frage zu finden, habe ich mir einen Experten ins Studio eingeladen. Heute habe ich mir Merlin Spöttl ins virtuelle Studio eingeladen.
Merlin ist Experte für Data Science, für Machine Learning und natürlich für Künstliche Intelligenz. Er ist Head of AI-Kompetenz in München bei CGI Deutschland und mit seinem Team hilft er Kunden bei allen Fragen rund um Strategie und Umsetzung von Daten und KI-Projekten. An der Stelle sage ich erstmal Hi Merlin, schön, dass du da bist.
Merlin Spöttl, CGI:
Freue mich da zu sein bei dir, Philipp.
- Gute KI beginnt mit einer klaren Datenstrategie
-
Philipp Ebnet, CGI:
Ich habe gerade schon gesagt, viele Unternehmen haben noch Schwierigkeiten, den Nutzen von KI zu erkennen. Wie ist das bei dir und deinen Kunden? Wie oft haben deine Kunden bereits konkrete Ideen für Use Cases?
Merlin Spöttl, CGI:
Ich glaube, tatsächlich mangelt es im Moment erfahrungsgemäß nicht unbedingt an den Ideen. Es mangelt eher an der Konsolidierung und strategischen Ausrichtung dieser Ideen. Viele Kunden haben riesige Listen an Anwendungsfällen, Use Cases, die aus den Business-Bereichen kommen. Und ich würde sagen, ein sehr, sehr kleiner Teil davon ist tatsächlich mehrwertstiftend. Wir sehen einfach eine viel zu große Menge, zu großes Volumen an Initiativen, die nicht unbedingt auf die Unternehmensstrategie oder Kennzahlen einzahlen.
Philipp Ebnet, CGI:
Wie schaust du, welche von den Ideen, mit denen deine Kunden zu dir kommen, realistisch umsetzbar oder nützlich sind? Wie gehst du vor bei der Bewertung?
Merlin Spöttl, CGI:
Das ist meistens ein iteratives Vorgehen. Zum einen braucht es aus unserer Sicht und Erfahrung meistens dieses Alignment mit der Unternehmensstrategie. Wenn eine Idee von einem KI-Anwendungsfall nicht auf die Unternehmensziele einzahlt, dann ist sie meistens keine eine tiefere Bewertung wert. Im zweiten und dritten Schritt gehen wir dann oft mit Priorisierungen vor.
Also man kann ganz gut auf Basis von Matrizen errechnen, wie groß ist der Aufwand und auch der Mehrwert von so einem Use Case aus einer geschäftlichen Perspektive und dadurch dann eine Art Journey aufbauen, feststellen, welche Low-Hanging-Fruits gibt es, wo bleibt der Entwicklungsaufwand relativ gering, während der Mehrwert für das Unternehmen aber groß ist. Das ist das Standardvorgehen, das wir bei Kunden anwenden. Aber wie gesagt, erst mal eine strategische Brille aufzusetzen und zu bewerten, was zahlt denn wirklich auf die Unternehmensziele ein, ist der allererste Schritt.
Philipp Ebnet, CGI:
Wenn du bei einem KI-Projekt hinzugezogen wirst, bei dem die Umsetzung nicht so funktioniert, wie es deine Kunden sich wünschen: was sind die häufigsten Fehler, die du persönlich miterlebst?
Merlin Spöttl, CGI:
Sehr gute Frage. Tatsächlich wiederholt sich da so ein bisschen das Muster, das ich auch schon aus dem klassischen Machine Learning kenne.
Vielleicht da auch für unsere Hörer der Kontext. Ich komme ursprünglich aus dem klassischen Machine Learning Data Science Umfeld, war da sehr lange Entwickler, habe dann auch Teams in dem Umfeld geleitet, die ein bisschen forschungslastiger unterwegs waren. Früher haben wir im Machine Learning Umfeld eher Modelle trainiert. Inzwischen ist es im Agentic AI Umfeld eher zu Integrationsarbeit geworden, weil die Modelle schon vortrainiert sind, viele Capabilities mitbringen und auch deutlich generischer funktionieren. Damals war das vielleicht so eine Lernperiode von circa zehn Jahren, in denen man immer mehr festgestellt hat, die kleinen Schrauben und Hebel, die wir drehen können auf der algorithmischen Seite, die bringen kleine Verbesserungen mit sich. Aber das, was tatsächlich meistens das Bottleneck war oder auch der Faktor, der am Ende zum Erfolg geführt hat, war gute Datenqualität. Und es erscheint mir so, als hätten wir all das, was wir diese zehn Jahre lang gelernt haben, jetzt plötzlich wieder verlernt.
Weil wir unsere KI-Modelle wieder einfach auf Datengrundlagen losschießen, die einfach nicht stabil und solide sind. Insofern: Faktor Nummer eins ist tatsächlich Datenqualität. Wenn die nicht stimmt, dann ist es sehr schwierig, den Mehrwert am Ende auch tatsächlich rauszuholen.
Ich habe es auch so wahrgenommen, dass die Organisationen, die sowohl im klassischen Machine Learning als auch jetzt bei Agentic AI am erfolgreichsten sind, die Unternehmen sind, die von Anfang an experimentierfreudig waren und den Mehrwert von qualitativen Datensammlungen sehr früh erkannt haben, ohne dass sie vielleicht partout wussten, was sie damit am Ende tun.
Die also einfach die intrinsische Motivation hatten: alles, wir im Unternehmen tun und wo wir Massendaten sammeln können, dort tun wir das auch. Und dort sammeln, klassifizieren und labeln wir Daten. Und irgendwann wird sich der Mehrwert daraus schon erheben können. Und das sind tatsächlich die erfolgreichsten Unternehmen. Also ich würde sagen, Datenqualität und die Sammlung von Daten ist tatsächlich Faktor Nummer eins.
Philipp Ebnet, CGI:
Dann muss ich da jetzt als Nicht-Techniker natürlich nochmal nachfragen, was unterscheidet gute Datenqualität von schlechter Datenqualität? Wo ziehst du da die Grenze?
Merlin Spöttl, CGI:
Müssen wir vielleicht differenzieren zwischen strukturierten Daten und unstrukturierten Daten. Also wenn ich von strukturierten Daten rede, dann rede ich von numerischen Datenpunkten, die zum Beispiel in Systemdatenbanken, Transaktionsdatenbanken liegen.
Wenn wir jetzt mal rein hypothetisch über ein Unternehmen reden, das vielleicht im Manufacturing-Automotive- Umfeld unterwegs ist und vielleicht On-Board-Vehicle-Devices mitliefert, also die Fahrzeugdaten sammeln über den Lebenszyklus des Fahrzeugs, dann ist es gar nicht mal so selten, dass diese Daten gewisse Probleme aufweisen. Zum Beispiel das plötzlich ganz komische Timestamps erscheinen, also Zeitstempel, wann diese Daten gesammelt wurden, die gar nicht realistisch sind. Also vielleicht wurden diese Geräte erst ab 2010 verbaut, aber die Zeitstempel sagen irgendwie 1975. Und wenn diese Zeitstempel durcheinander sind, dann kann ich natürlich sehr schlecht Analysen auf diesen Daten fahren.
Es sind manchmal ganz kleine Ursachen, die dazu führen, dass irgendein Server falsch konfiguriert war mit der falschen Uhrzeit, falschen Datum und dadurch wurden diese Daten falsch gesammelt, was aber am Ende tatsächlich, den Mehrwert aus den Daten zu erheben, absoluter Blocker ist.
Wenn wir über unstrukturierte Daten reden: Ich habe Wissen im Unternehmen gesammelt, das ist verteilt über Confluence, über Jira, dokumentiert über verschiedene Projekt- und Ordnerstrukturen hinweg. Dann ist es oft schwierig, wenn wir jetzt zum Beispiel eine Wissensmanagement-Lösung mittels KI implementieren wollen, die Relation dieser Daten im Nachgang deutlich zu machen.
Das heißt, wenn ich von Anfang an die entsprechenden Pointer setze und sage, da gibt es irgendwie eine Tag-Struktur zum Beispiel, das wäre das Erste, was man einführen könnte, da steht irgendwie das Projekt drin, da steht das Team drin, das diese Datenpunkte erzeugt, da werden Projektnamen und Identifier richtig gesetzt, dann kann ich am Ende einen großen Wissensschatz miteinander in Verbindung bringen, was die absolute Grundlage wäre, so eine Datenbasis aufzubauen, die dann als Kontext für ein KI-Modell im Wissensmanagementumfeld gesetzt wird. Das ist es, was ich mit Datenqualität meine. Die Daten richtig zu sammeln, Probleme frühzeitig zu erkennen, zu beheben und am Ende Mehrwert daraus schöpfen.
Philipp Ebnet, CGI:
Wenn du von Daten sammeln sprichst, da stellt sich mir schon die nächste Frage. Es gibt ja auch die Möglichkeit, KI mit synthetischen Daten zu trainieren. Wenn ich das jetzt richtig bei dir raushöre, lohnt es sich aber mehr, die realen Daten zu verwenden. Also korrigiere mich gern, wenn ich das falsch verstanden habe. Ansonsten wäre meine Frage, wieso lieber reale Daten nehmen als synthetische Daten?
Merlin Spöttl, CGI:
Also ich würde sagen, es gibt da keine eine richtige Antwort. Wir haben auch im klassischen Machine Learning Umfeld eigentlich immer mit synthetischen Daten gearbeitet, weil meist die schiere Menge an realen Daten nicht ausreichend ist, um in Modell zu generalisieren.
Und da gibt es zum Beispiel ein Konzept, das nennen wir Data Augmentation, wo wir existierende Daten leicht abändern, um das Modell dazu zu bewegen, zu generalisieren. Zum Beispiel, wenn ich jetzt mal ganz simpel ein Klassifizierungsmodell trainieren würde, das zwischen Katzen und Hunden unterscheiden soll, dann führt es tatsächlich zu besseren Resultaten, wenn ich das gleiche Katzenbild zehnmal in das Modell schiebe, mit ganz leichten Änderungen, zum Beispiel einer Rotation, einer leichten Perspektivänderung im Bild.
Das heißt, ganz gezielte synthetische Daten sind oft tatsächlich positiv zu bewerten. Was meistens eher zu einer Konvergenz in einen nicht lernenden Status führt, ist, wenn ich zu viele und zu überprüfte synthetische Daten generiere. Die Labs in Silicon Valley kämpfen gerade genau mit dem gleichen Aspekt. Die haben jetzt große Modelle pre-trained und sind jetzt gerade dabei, Alignment durch Reinforcement Learning einzuführen und denken natürlich auch darüber nach, synthetische Daten zu erstellen. Das Problem ist, dass sie dort meistens in einer Sackgasse landen, weil die Modelle gewissen Trainingsstand haben und den eigentlich wiedergeben durch diese Wahrscheinlichkeitsberechnung der Tokens und dadurch keine Verbesserung herbeigeführt wird.
Insofern würde ich sagen, aus dem Unternehmenskontext heraus bewertet, wenn synthetische Daten, dann sollten die statistisch repräsentativ und relevant verteilt sein. Das ist ganz wichtig.
Und es muss von fachlich kompetenten Personen bewertet werden, ob diese synthetisch erzeugten Daten tatsächlich der Realität entsprechen. Ansonsten werde ich ein synthetisches Modell trainieren, das nicht auf realen Daten funktionieren kann.
Philipp Ebnet, CGI:
Jetzt habe ich tatsächlich eine kurze Frage zu den Silicon Valley-Unternehmen, die du gerade angesprochen hast. Ich höre auch öfter mal das Argument, dass die großen LLMs mittlerweile das Problem haben, dass jetzt KI-generierten Daten verwendet werden, um die neuen KIs zu generieren und wenn diese Daten bereits falsch erzeugt wurden, sich das selbst verstärkt, weil die KI natürlich mit falschen Daten falsch lernt. Wie viel ist denn da dran?
Merlin Spöttl, CGI:
Ja, auch eine sehr gute Frage. Ich meine, aktuell arbeiten Labs ja tatsächlich meistens mit so versteckten Identifier, also dass KI generierte Texte von den Labs selbst wiedererkannt werden können, um die Datensätze dann entsprechend aus dem Trainingsprozess auszuschließen.
Ich glaube, das wird tatsächlich langfristig zu einem Problem, weil wir haben auch nicht nur ein Lab und ein KI-Modell, es gibt viele Open-Source-Modelle und wirklich differenzieren zu können oder einen vertrauenswürdigen Klassifizierungsalgorithmus zu entwickeln, der KI generierte Contents tatsächlich erkennt, ist gar nicht mal so einfach. Und ja, natürlich, wenn wir jetzt irgendwie zwei, drei, vier, fünf Jahre in die Zukunft denken, dann ist die schiere Menge an Daten, die wir erzeugen durch KI-Modelle, weil Menschen immer mehr damit arbeiten, natürlich exponentiell wachsend.
Und mir ist tatsächlich nicht bekannt, dass es die eine Lösung für das Problem gibt. Ich glaube, Labs denken jetzt immer mehr in Richtung auch qualitativer Datensetzung. Also diese riesigen Korpusse an textuellen Datensätzen, die aus dem ganzen Internet extrahiert wurden für die Pre-Trainings der Modelle. Die sind vom Qualitätsstandard sehr, sehr minderwertig. Da ist alles Mögliche Neues drin, von Aktienbewertungen mit ganz vielen verschiedenen Timestamps, die eigentlich gar nichts bewirken für ein Training von so einem Large-Language-Modell, das ja eigentlich die Sprache lernen soll und wo die Labs sich auch schwierig tun, das zu bereinigen.
Also ich glaube, Labs denken immer mehr in Richtung Partnerschaften, zum Beispiel mit Medienhäusern, um wirklich qualitativ hochwertige Datensätze hinzuzufügen zu diesem riesigen Korpus, den sie jetzt haben. Da kann man dann natürlich auch eine gewisse Kontrolle einführen. Da weiß man, dass Journalisten das zumindest nochmal überprüft haben, bevor Artikel veröffentlicht wurden.
- Menschlicher Austausch ist die Grundlage erfolgreicher KI-Nutzung
-
Philipp Ebnet, CGI:
Ich habe gelesen, dass ein guter Use-Case für KI zum Beispiel in der Finanzbranche ist, dass die Risikobewertung bei Transaktionen vornehmen kann. Ich möchte natürlich, dass meine Bank mich benachrichtigt, wenn gefährliche Transaktionen getätigt werden, die vermutlich nicht von mir selbst getätigt wurden. Das ist ja eigentlich ein super Use-Case für eine KI, aber was mache ich denn, wenn die mir zu viele Transaktionen als riskant bewertet und mein Team dann überfordert ist, weil zu viele Daten, die überprüft werden müssen, rauskommen?
Merlin Spöttl, CGI:
Ja, da sprichst du tatsächlich einen Kernpunkt an. Es ist in deinem Beispiel sehr, sehr wahrscheinlich, dass sowas passieren würde. Wenn wir das erste Mal ein KI-Modell trainieren würden, im Bereich Transaktionsanalyse, gibt es auch ganz, ganz viele andere Anwendungsfälle, wo ich das schon miterlebt habe bei anderen Kunden. Ein Problem ist oft, dass die Verankerung von solchen KI-Initiativen sehr, sehr stark in der IT liegt.
Wieso? Weil es ein sehr technisches Thema ist. Und gerade die Business-Stakeholder, die für die Fachabteilungen entsprechend verantwortlich sind, meistens ab einem gewissen Punkt aussteigen. Also die setzen ihre Anforderungen am Ende und sagen, das Thema soll Transaktion bewerten. Wir haben da schon irgendwie vorgelabelte Daten, weil wir natürlich über die letzten zehn Jahre manuell mit Experten Transaktionen bewertet haben. Und daraus wollen wir jetzt irgendwie Muster extrahieren. Und das war es dann eigentlich schon an Anforderungen, was du aus so einem Businessbereich bekommst.
Oft ist es nun leider so, dass Modelle, wenn sie so ein Konglomerat an Daten bekommen, gewisse Muster erkennen, die wir als Menschen vielleicht nicht erkennen würden. Was vielleicht in dem Fall dazu führen würde, dass konkrete Muster erkannt werden, die vielleicht viel mehr Transaktionen als bedrohlich bewerten würden, als das ein Mensch früher getan hätte. Und dann landest du in der Situation, dass du vielleicht ein Team mit drei Personen hast, die normalerweise Risikobewertungen von Transaktionen machen.
Früher war das auf Basis von logischen, mathematischen Grenzwerten, dass Transaktionen geflaggt wurden. Und dann hat ein Mensch sich das nochmal zum Review angeguckt und gesagt, ja, ist bedrohlich oder nein, ist nicht bedrohlich. Und jetzt plötzlich landest du in der Situation, dass 10.000 Transaktionen pro Tag durch dieses KI-Modell als bedrohlich bewertet werden und das Team gar nicht mehr in der Lage ist, all das nochmal nachzubewerten.
Da ist tatsächlich der einzige Weg, Business Stakeholder in dem ganzen Prozess mitzunehmen. Im besten Fall sogar die Ownership für die Entwicklung von so einem Modell im Business zu verankern. Das heißt, Business bleibt im Lead. Und von Anfang an auch klarzumachen, dass solche Anforderungen existieren. Solche, ich nenne es mal jetzt, Soft-Faktoren. Und vielleicht bauen wir auch eine Art Grenzwert ein. Also je nachdem, wie sicher sich das Modell ist, also wie der Confidence-Wert ist, können wir vielleicht gewisse Transaktionen voll automatisiert tatsächlich in den Prozess mit einschleusen. Und nur bei den Transaktionen, wo sich das Modell unsicherer ist, würden wir dann tatsächlich Menschen zum Review mit einbeziehen.
Und genau solche Anforderungen müssen von Anfang an klar sein, damit das entsprechende Entwicklerteam vielleicht nicht das perfekte Modell aus einer rein technischen Sicht entwickelt, sondern das Modell, das den Business Case angemessen beantworten kann. Und auch den entsprechenden Business-Stakehold dann eine Hilfeleistung bereitstellt und nicht eine Überforderung.
Philipp Ebnet, CGI:
Wie wichtig ist dann auch das Erwartungsmanagement, also wie stimmt man da am besten die Erwartungen im Team ab?
Merlin Spöttl, CGI:
Vielleicht machen wir da wieder den Schwenk in Richtung Agentic AI: Gerade da merken wir jetzt in der aktuellen Zeit, dass nicht-technische Stakeholder oft die Erwartungshaltung haben, dass KI ein Wunderheilmittel ist für jegliches Problem. Also egal welchen Use Case ich habe, die erste Intuition ist immer, das kann doch eine KI machen. Ohne sich zu überlegen, welche Voraussetzungen es dafür überhaupt gibt und welche Anwendungsfälle für KI überhaupt sinnvoll oder nicht sinnvoll sind.
Also ich glaube, den größten Mehrwert, den ich Kunden als KI-Berater und Techniker und Entwickler in der Vergangenheit geboten habe, ist nicht in der Entwicklung von KI-Systemen, sondern in der Kommunikation, wann KI nicht die richtige Technologie für diesen Anwendungsfall ist. Weil oft wollen Kunden einfach durch den Hype, der auch aktuell bei dem Thema einfach mit im Markt schwingt, mit Kanonen auf Spatzen schießen. Und oft ist es eine simple Schnittstellenautomatisierung oder ein rein logischer Algorithmus mit irgendwie drei FL-Statements, der ausreicht, das, was der Kunde haben will, tatsächlich umzusetzen.
Insofern würde ich sagen, Erwartungshaltung ist absolut wichtig. Und da sind dann so Doppelrollen oft die Lösung. Also Menschen, die entweder aus der Technik kommen und die Businessseite verstehen, sich eher eine strategische Ausrichtung bewegt haben, diese technischen Grundlagen und vielleicht auch Grenzen gut vermitteln können. Oder auf der anderen Seite jemand, der aus der Businesswelt kommt und einfach intrinsisch motiviert ist, die Technik besser zu verstehen. Das ist generell auch was, was ich immer probiere, näher zusammenzubringen in solchen Projekten.
Diese Fronten aufzubauen und zu sagen, ich bin nicht Techniker, ich bin nur fachlich hier verantwortlich für das Projekt oder ich bin nur ein Techie, ich entwickele nur, mich interessiert die Business-Seite nicht. Das sind Fronten, die sollten eigentlich nicht existieren. Wir helfen uns allen und am Ende sind KI-Initiativen erfolgreicher, wenn sowohl das Business ein intrinsisches Interesse für die Technik mitbringt und sich probiert, da auch weiterzubilden und tiefer einzusteigen, besser zu verstehen. Und andersherum Techniker auch mal aus ihrem Tunnelblick aussteigen und die Businessperspektive mit betrachten.
Philipp Ebnet, CGI:
Ich selbst kenne es von mir, dass ich etwas nutze und kann dann kaum erwarten kann, bis ein neu angekündigtes Tool zur Verfügung steht. Aber als Unternehmen will ich KI natürlich nicht einfach ungetestet einsetzen. Wie entwickle ich gute Proof of Concepts, ohne aber in einer ewigen Testschleife gefangen zu sein?
Merlin Spöttl, CGI:
Auch ein guter Punkt, ich würde die Frage tatsächlich noch mal aus einer anderen Perspektive beantworten. Also ich glaube, auch da, wenn ich mir jetzt so die letzten zehn Jahre im KI-Umfeld anschaue, sind die meisten Innovationen im KI-Umfeld oder die meisten guten Ideen tatsächlich aus der operativen Linie entstanden. Also es war nie irgendwie eine Management-Entscheidung. Wir müssen jetzt Tool 1, 2, 3 einführen und das ist der Game-Changer, sondern irgendein Mitarbeiter hat eine coole Idee und das ist jetzt wirklich dieser Game-Changer-Moment, wo wir sagen, hey, da sparen wir uns richtig viel Zeit oder Aufwand oder erschließen neue Revenue Streams.
Also ich glaube, Experimentieren in einem geschützten Umfeld zu ermöglichen, zu sagen, wir haben Sandbox-Umgebungen und da können sich Leute einfach mal austoben, Dinge ausprobieren, wir haben aber auch klare Guidelines für den Einsatz von KI.
Also wir als Unternehmen wissen ganz genau, was dürfen unsere Mitarbeiter tatsächlich auch außerhalb von den bereits eingeführten Tools mal ausprobieren und wie müssen sie damit umgehen. Welche Datenklassifizierung dürfen in nicht pre-approvete oder nicht ausgerollte Tools denn überhaupt rein? Welche Arten von Aufgaben darfst du damit durchführen, welche Grenzen gibt es und welche Risiken gibt es und worüber musst du dich informieren?
Das ist, ich, ganz, ganz wichtig, weil dann ermöglicht man eine dezentralisierte Innovation. Meistens haben Leute Ideen und auch Lust, diese Ideen auszuprobieren. Wenn überhaupt scheitern sie an den Möglichkeiten, die das Unternehmen bereitstellt, dieses Experimentieren durchzuführen.
Also erfahrungsgemäß sollten wir dort agile Entwicklungsmethoden, aber auch DevOps Prinzipien, die wir aus der Softwareentwicklung kennen, so klein wie möglich zu gestalten, damit wir schnell praxisnah erproben, ob etwas funktioniert, ob etwas im Business Mehrwert liefert oder nicht. Das sollten wir auch auf KI-Entwicklung anwenden oder das Rollout von KI-Tools.
Wir können uns meistens monatelang den Kopf darüber zerbrechen, ob etwas richtig gut, akkurat genug funktioniert, sicher genug funktioniert. Einfach mal ausprobieren ist meine Devise, in vorgesetzten Rahmen.
Und noch ein letzter Punkt dazu, bei mir auch tatsächlich oft zum, ich will jetzt nicht Erfolg ist das falsche Wort, aber zu wertstiftenden KI-Programmen geführt hat, ist, wenn Kunden mit sehr, sehr stringenten Quality und Killgates gearbeitet haben. Also wenn wir knallhart sagen, KI ist irgendwo eine R&D-Tätigkeit, wir gehen mit einer Hypothese rein und sagen, wir glauben, dass XY funktionieren könnte. Wir wissen das aber noch nicht sicher. Es ist nicht so deterministisch wie Softwareentwicklung, wo wir ganz klar wissen, da haben wir Feature 1 und das wollen wir entwickeln und am Ende wissen wir genau, was wir haben und wir können auch relativ gut einschätzen, wie viel Zeit das braucht.
KI-Projekte sind meistens anders. Das ist Ergebnis oft etwas unklarer, wir bewegen uns in einer kurvigen Straße auf das Ziel zu und hoffentlich wird es funktionieren. Das ist der Tenor. Und insofern ist es umso wichtiger zu sagen, wir reiten keine toten Pferde bis ins Nirwana.
Also wir sagen, wir setzen uns wirklich ein Ziel. Wir sagen, das ist ein halbwegs ambitioniertes Projekt. Wir geben uns jetzt sechs Wochen und wenn wir nach sechs Wochen nicht geschafft haben, einen Prototypen zu launchen, der schon einen Business-Mehrwert generiert, dann einfach vergessen und auf die nächste Sache fokussieren, egal ob wir jetzt emotional an dem Projekt hängen und die Entwickler sich denken, das ist doch eine unglaublich coole Sache und der Projektmanager sich denkt, das müssen wir unbedingt weitertreiben, weil ansonsten haben wir jetzt hier sechs Wochen in eine Wanne investiert.
Das hat meistens zum letztendlichen Erfolg geführt, auch wenn man zwischendrin immer mal wieder große Brocken zum Schlucken hatte, weil man Dinge aufgeben muss, an denen man vielleicht doch irgendwo gehangen hat oder die man gerne vorantreiben wollte.
- Der Aufbau von KI-Fähigkeiten ist ein kontinuierlicher Lernprozess
-
Philipp Ebnet, CGI:
Also auch nicht demotivieren lassen, höre ich da raus. Ein großes Problem ist ja auch der Schulungsaufwand für das Personal. Wie schätzt du denn die Bereitschaft von den Mitarbeitenden bei deinen Kunden ein, sich zu dem Thema weiterzubilden? Wie sind deine Erfahrungen?
Merlin Spöttl, CGI:
Es ist aus meiner Erfahrung heraus eher so eine Kurve, die am Anfang sehr, sehr langsam hochgeht. Und wenn so der Krux-Moment überstiegen ist, dann geht es steil nach oben. Weil ich kenne es ja auch selbst von mir. Also ich nehme ich da auch selbst nicht aus. Ich bin seit zehn Jahren KI-Entwickler und trotzdem gibt es gewisse Aufgaben im Alltag, die ich mit Foundation Modellen, mit LLMs deutlich effizienter durchführen könnte, es aber noch immer nicht tue. Zum Beispiel die Verfassung von Agendas. Das ist irgendwie so ein Gefühl von Kontrollverlust, wenn ich das nicht mehr selbst in die Hand nehme und sage, ich weiß ganz genau, was ich damit erreichen will. Ich weiß, wie ich diesen Workshop strukturieren will, was ich da für den Kunden an Mehrwert mitbringen will, und deshalb will ich das unbedingt selbst machen. Aber wenn ich so eine gut durchstrukturierte Agenda für einen 2,5 Stunden Workshop selbst verfassen will, dann sitze ich da vielleicht 30, vielleicht sogar 60 Minuten dran. Und diese Art von Aufgaben, wo ich vielleicht Kontrolle ein bisschen abgebe und sage, hey, das sind die Rahmenbedingungen, liebes Modell, strukturiere mir einen guten Workshop anhand dieser Rahmenbedingungen. Dann bin ich vielleicht in 10 Minuten fertig. Es ist vielleicht nicht genau das, was ich selbst gemacht hätte. Es ist aber genauso gut.
Und diese Art von Kontrollabgabe ist, glaube ich, am Anfang sehr schwer. Insofern würde ich sagen, die Unternehmen, die in der Maturity schon deutlich weiter sind, die früh diese Tools eingeführt haben, die die Leute immer wieder dazu bewegt haben, benutzt das, probiert das, hier sind auch Beispiele, Anwendungsfälle, was ihr damit tun könnt. Hier sind Erfolgsgeschichten aus dem Unternehmen, wo Mitarbeiter, Kollegen von euch echt coole Use Cases und auch Einsparungen von Aufwänden erreicht haben. Das ist ein Prozess, der dauert ein bisschen Zeit.
Und da darf man auch nicht zu viel zu schnell erwarten, weil es einfach in der menschlichen Natur liegt, dass es ein bisschen dauert, bis wir solche Dinge annehmen.
Philipp Ebnet, CGI:
Zum Schluss vielleicht noch eine Frage noch mal, wenn du jetzt noch mal alles in einen Topf wirfst, wie wäre denn so deine Empfehlung für alle Unternehmen, die sich mit KI beschäftigen wollen, aber bisher noch nicht den richtigen Zugang gefunden haben?
Merlin Spöttl, CGI:
Also ich komme wieder auf den ersten Punkt zurück, den wir ganz am Anfang besprochen haben. Datenqualität ist A & O. Also egal wo ihr das Gefühl habt, ihr sammelt Daten, die in Zukunft wertstiftend sein könnten, tut das und tut das mit dem Gewissen, dass die Qualität auch stimmt. Das wäre der erste Punkt.
Der zweite Punkt wäre: Lasst euch nicht entmutigen von den schnellen Entwicklungen am Markt. Das ist ein iterativer Prozess und wir wissen noch nicht ganz, wo die Reise hingeht. Also von sehr pessimistischen Meinungen. Ich meine auch die Zahlen, die du am Anfang vom Deutschen Wirtschaftsinstitut genannt hast, die sind ja eher konservativ, würde ich sagen. Wenn du dir Podcasts von den amerikanischen AI Labs anhörst, dann wird eher von Wirtschaftswachstum jährlich von 20 bis 30 Prozent gesprochen, schon in ein bis zwei Jahren.
Also da gibt es einfach eine riesige Range und ich glaube, das verunsichert viele Unternehmen auch im Moment, weil es total unklar ist, wo wir uns jetzt befinden. Also werden die Capabilities von diesen Modellen in den nächsten Jahren stagnieren, werden die ähnlich bleiben, wie das, wir jetzt sehen und ist die Art der Entwicklung der Anwendungsfälle, die wir jetzt entwickeln, tatsächlich auch zukunftsträchtig?
Oder haben wir tatsächlich in zwei Jahren schon diesen Drop-in-Remote-Worker, irgendwie ein KI-Modell, die ich einfach auf meinen PC losschicke und das super sicher alle Aufgaben erledigen kann, die auch irgendwie ein Praktikant oder ein Werkstudent erledigt hätte. Das ist die Range, in der wir uns bewegen. Und da wäre einfach meine Empfehlung, lasst euch nicht entmutigen, setzt die Basis so auf, dass ihr auch mit zukünftigen Entwicklungen gut umgehen könnt.
Also, ein ganz praxisnahes Beispiel wäre zum Beispiel gute LLM-Ops-Prinzipien anwenden. Das heißt, Autoprompt Engineering gute Testdatensätze für Anwendungsfälle aufsetzen, damit so ein Model-Switch von einem schlechteren Modell, das ich vor zwei Monaten verwendet habe, zu einem besseren Modell tatsächlich mit wenig Aufwand verbunden ist.
Und der dritte Aspekt wäre Fokus auf den Menschen und den Mitarbeiter. Auch da gibt es Unsicherheiten im Unternehmen. Und immer, wenn ich eine Änderung einführe, dann stößt das erst mal auf Resistenzen. Ich muss den Vorteil klar kommunizieren. Wenn ich jedem einzelnen Mitarbeiter durch den Einsatz von solchen Systemen ein besseres Arbeitsleben ermögliche, spannendere Aufgaben verspreche, dann zieht die Belegschaft auch gerne mit. Wenn ich es nur über einen Zaun werfe und es am Ende dann doch wieder mehr Arbeit ist als vorher oder ich Angst habe, meinen Job zu verlieren oder Angst habe, dass Dinge, die ich 20 Jahre gleich gemacht habe, irgendwie plötzlich ganz anders funktionieren, ohne dass für mich da großen Mehrwert bei rumspringt als Person, dann stelle ich mich auch wahrscheinlich eher quer, so was flächendeckend einzusetzen.
Philipp Ebnet, CGI:
Ja, klar, das kann ich gut nachvollziehen. Wenn mir ein Tool meine Arbeit spannender macht, dann bin ich auch motivierter, das einzusetzen oder mir neue Zugangsmöglichkeiten eröffnet. Dann habe ich auch viel mehr Freude im Umgang damit. Vielen Dank dir, Merlin, dass du da warst und für deine ganzen ausführlichen Antworten.
Merlin Spöttl, CGI:
Sehr gerne, Philipp. Hat mir Spaß gemacht.
Philipp Ebnet, CGI:
Und natürlich auch ein Dankeschön an dich, dass du zugehört hast. Wenn es dir gefallen hat, dann like und subscribe den Podcast gern, damit du keine Folge verpasst. Ansonsten sage ich, ich freue mich schon auf das nächste Mal und bis dahin, ciao, wir hören uns.