„Was kann KI?“: Michael Schmidt im Interview
Michael Schmidt ist Chairman of the Advisory Board von The Vault, New York. The Vault ist eine Beratungsgesellschaft zur Content Analyse in Film und Fernsehen. In seinem Vortrag bei der Veranstaltung „Was kann KI?“ der Film- und Medienstiftung NRW gab Schmidt einen Überblick darüber, wie The Vault mit ihrem System Sender und Plattformen wie Netflix bei Programming, Formatentwicklung und Erfolgsanalyse unterstützen kann. Im Interview im aktuellen „Film und Medien NRW – Das Magazin“ erläutert er die Anwendungsmöglichkeiten von KI bei Sendern und Plattformen weiter.
Was unterscheidet ihre KI-gestützte Arbeit bei Vault von klassischen Marktanalysen u. ä. Was kann KI besser als Menschen leisten?
Vault AI ist eine hochmoderne Technologieplattform, die Fähigkeiten der künstlichen Intelligenz (KI) zur Durchführung von Marktforschung nutzt. Sie unterscheidet sich in mehreren Punkten von der klassischen Marktforschung:
Erstens, Geschwindigkeit und Effizienz: Vault AI nutzt KI-Algorithmen, um große Datenmengen schnell und effizient zu verarbeiten und zu analysieren. Wir automatisieren Aufgaben, die traditionell einen erheblichen menschlichen Aufwand und viel Zeit erfordern würden.
Zweitens, Datenerfassung: Vault AI kann Daten aus verschiedenen Quellen sammeln, beispielsweise aus sozialen Medien, Online-Bewertungen, Kundenfeedback und Umfragen. Wir können Erkenntnisse aus unstrukturierten Daten gewinnen und ermöglichen es Unternehmen, auf ein breiteres Spektrum an Informationen für die Analyse zuzugreifen. Dies unterscheidet sich von Marktforschung, die auf kleinen Stichprobengrößen wie Fokusgruppen und Umfragen basiert.
Drittens, Datenanalyse: Die KI-Funktionen von Vault AI ermöglichen eine anspruchsvollere und komplexere Datenanalyse. Wir können Muster, Trends und Korrelationen identifizieren, die für menschliche Forscher schwer zu erkennen sind. KI-Algorithmen können große Datenmengen gleichzeitig verarbeiten und ermöglichen so eine umfassendere und genauere Analyse.
Viertens, Skalierbarkeit: Vault AI bietet Skalierbarkeit, was bedeutet, dass wir große Forschungsprojekte bewältigen und uns an sich ändernde Forschungsanforderungen anpassen können. Wir können nicht nur Daten kontinuierlich verarbeiten, sondern auch Einblicke in Echtzeit liefern und es Unternehmen ermöglichen, agile Entscheidungen zu treffen. Klassische Marktforschung und insbesondere Panelbasierte Marktforschung ist langsam und träge, ein neuer Satz an Fragen braucht ein neues Panel. Unser „virtuelles“ auf echten Benutzerdaten basierendes Panel ist permanent verfügbar und bietet schnellere Antworten mit höherer Vorhersagezuverlässigkeit.
In der Kreativszene wird quasi überall, vom Script über Dreharbeiten bis zur Postproduktion und Vermarktung nun immer mehr auf KI gesetzt. Wie wird sich die Unterhaltungsindustrie dadurch verändern?
Ich bin kein Orakel, aber ich gehe erstmal davon aus, dass der rechtlich Rahmen kreativer Tätigkeit, das Urheberecht ersteinmal nicht so leicht und auch nicht so schnell verändert wird. Das ist gut so. Was nützt einem auf KI setzendem Medienhaus, die schönste KI generierte Fernsehserie, wenn diese nicht urheberechtlich schützbar ist. Im Highend Bereich mache ich mir auf ganz lange Sicht keine Sorgen um Autoren, Regisseure, Cutter, Komponisten und Schauspieler usw. Eher mache ich mir Sorgen um Redakteure und Creative Executives, da Auftraggebern und Produzenten und auch Autoren und Direktoren durch predictive und generative AI Werkzeuge zur Verfügung stehen, die Bauchgefühl und vermeintliche Erfahrung ersetzen durch Prävisualisierung und Simulation (Houdine, Unreal Engine, Synthesia, DeepFake). Ich glaube, wir werden schnell dahin kommen, dass AI im Hintergrund viel übernehmen wird, aber der Mensch entscheidet und ausarbeitet. Im Skriptbereich kann AI im Handumdrehen hunderte von Vorschlägen zum Story development oder Themen von Episoden machen, basierend auf einer initialen Konzeptbeschreibung eines Autoren (siehe Plotbot und Scripta). AI wird Drehmaterial automatisch analysieren, transkribieren und beschreiben und auf Basis des Skripts den ersten Rohschnitt vorbereiten (Avid Script Scene, Adobe Firefly, Azure Video Analyzer usw). Nachdem dann Cutter und Regisseur den Look&Feel, der Serie definiert haben, wird AI das dann einlesen und analysieren können und den Rohschnitt der Episode 2 einer Serie dementsprechend anbieten.
Gleichzeitig wird AI über den gesamten Gestaltungsprozess immer wieder simulieren können, welche kreativen Entscheidungen welche Auswirkungen auf die Performance des Programms haben. Und wenn wir über internationale Versionierung reden, dann glaube ich sind wir schon ganz nah an der vollends automatisierten Synchronisierung mithilfe synthetischer Stimmen der original Schauspieler bei gleichzeitiger automatischer Anpassung der Lippenbewegung der Schauspieler.
All das führt zu erhöhter Geschwindigkeit und Effizienz: KI kann viele der zeitaufwändigen Aufgaben beim Filmemachen automatisieren, dies wird zu zu kürzeren Produktionszeiten und geringeren Kosten führen.
Personalisierung: Mithilfe von KI könnten personalisierte Filme und Fernsehsendungen erstellt werden, die auf die Interessen des einzelnen Zuschauers zugeschnitten sind. Dies könnte zu einem intensiveren und ansprechenderen Seherlebnis führen.
Werden sich die Produkte dadurch ebenfalls spürbar verändern? Werden Serien z. B. zukünftig anders aussehen und erzählt werden?
Als erstes wird sich ein sehr wesentliches Segment des Videomarktes verändern. Der Content von Kreativen auf Youtube und Tiktok. AI tools werden zu einer Kreativitäts- und Contentexplosion führen und das gesamte Segment nah an den High End Bereich bringen, für nachwievor verhältnismässig geringe Kosten. Das wird sich auch auf den Kids Markt massiv auswirken. Ich glaube dort werden wir die ersten vollautomatisierten von KI produzierten Serien sehen, denn meist ist die Story so dünn, da ist das Copyright auf die Geschichte vollends egal. Hauptsache, die Charaktere sind geschützt und können dann als Spielzeug verkauft werden.
Und ich glaube auch, dass es technisch relativ bald möglich werden wird, dass Zuschauer ihr eigenes Serienerlebnis gestalten können. Ich möchte Breaking Bad gucken, aber bevorzuge Bastian Pastewka als Hauptdarsteller (ein sehr löblicher Gedanke unseres imaginären Zuschauers – wir alle sollten mehr Bastian Pastewka in unseren Fernsehern haben), dann wird das unproblematisch möglich sein und für relativ wenig Rechen- und damit Kostenaufwand angeboten werden können. Doch wird es dafür einen Massenmarkt geben? Ich denke nicht. Das ist nicht Bastians Schuld. Ich sage mal ganz platt, wenn Zuschauer gerne casten wollen, dann hätten sie ja Regisseur werden können. Ich denke viel mehr, dass Konsumenten nachwievor ein verbindendes und gemeinsames Erlebnis insbesondere beim Konsum von Unterhaltungsprogrammen suchen. Man möchte sich über gemeinsam erlebtes austauschen.
Allerdings glaube ich schon an eine auf Zuschauer zugeschnittene automatische Versionierung von Programmen, allerdings nicht über Rollenbesetzung oder ähnlichem. Ich werde mir als Zuschauer aussuchen können, ob ich die unzensierte Version mit vielen Schimpfwörtern und Gewalt und Blut anschauen will, oder die PG-13 Version mit weniger Blut und Jump Scares, weil meine Kinder mit im Raum sind. Und ich werde zwischen diesen unterschiedlichen Versionen hin- und herwechseln wie ich es schon heute bei Netflix oder Disney+, wenn ich andere Sprachversionen wähle.
Werden innovative Formate, sei es thematisch oder in ihrer Erzählweise, dadurch erleichtert?
Mit Sicherheit erleichtert KI kreative Innovation, denn sie ermöglicht es nicht nur neue Ideen kostengünstig und schnell zu visualisieren (previz, wie wir es von aufwendigen Spezialeffekten kennen, aber zukünftig mit Hilfe von generative AI), aber gleichzeitig auch deren Erfolg und Auswirkungen vorherzusagen (mit predictive AI).
Ein interessanter Punkt in ihrem Talk war, dass Fragen der Schauspieler-Besetzung kaum einen Effekt auf die Vorhersagen der AI haben. Das war für mich überraschend. Gab es für Sie persönlich, mit Ihrer langen Erfahrung in der Industrie, auch überraschende Erkenntnisse, die Sie durch Ihre Arbeit mit dem AI-Modell gewonnen haben, was Erfolg beeinflusst – und was nicht? Können Sie Beispiele nennen?
Unseren Daten zufolge sind Talent und Besetzung das illusivste Signal, auf das wir uns konzentriert haben um ein gutes prädiktives Feedback zu bekommen. Das war auch für uns zuerst überraschend. Bei der genaueren Analyse wird klar, warum das so ist. Schauspieler, anders als zum Beispiel Sportler, die mehrere Hunderte von Spielen absolvieren, treten nur in 10 bis 20 Rollen auf (wenn sie Glück haben). Andererseits sammeln wir über die Story bis zu 200.000 Datenpunkte, da fällt Talent bei der Messung also kaum ins Gewicht. Es ist leicht zu erkennen, ob ein bestimmtes Talent das richtige Publikum, die passende Fanbase für eine Serie oder für einen Film mit sich bringt. Es ist aber schwierig, diesen Schauspieler zu isolieren und eine eindeutige Antwort darauf zu geben, wie sich eine Castingentscheidung zwischen Timothée Chalamet und Bastian Pastewka auf die Einspielergebnisse oder Einschaltquoten auswirken würden (ok das ist ein schlechtes Beispiel, natürlich wissen wir alle, dass Bastian gewinnen würde – aber für diese gesicherte Erkenntnis brauchen wir auch keine predictive AI). Die zweitgrößte Erkenntnis für mich persönlich ist wie wesentlich die Trailerkampagne für den Erfolg von allem was wir machen ist. Wir können uns die Nächte um die Ohren hauen und versuchen unsere Show im Schnitt immer weiter zu verbessern. Ein schlechter oder ein falsch positionierender Trailer entscheidet mehr über Sieg oder Niederlage als ich das je vermutet hätte. Natürlich haben wir immer bei schlechten Quoten geunkt, das Marketing ist schuld. Das heißt nicht, es ist egal was wir produzieren. Produktion und Marketing müssen Hand in Hand gehen. Und das ist auch der Grund warum Studio- und Plattformübergreifend die jeweiligen Marketingteams unsere größte Kundengruppe darstellen und mit unserer Hilfe Kampagne und Trailer optimieren.