Raphael Johannes Tostlebe
Künstliche Intelligenz (KI) hat durch Sprachmodellen wie ChatGPT oder Bildsynthese durch Stable Diffusion sprunghaft einen sehr hohen Stellenwert im gesellschaftlichen Diskurs angenommen. Videosynthese mit Künstlichen Neuronalen Netzen (KNN) war die nächste konsequente Entwicklung. Mit der Eingabe natürlicher Sprache (Prompt) können mit wenig Vorkenntnissen Texte, Bilder als auch Videos von erstaunlicher Qualität produziert werden und erleichtern den Arbeitsalltag von Medienschaffenden massiv, stellen gleichzeitig aber auch eine Bedrohung vieler Arbeitsplätze dar. Um diese Veränderungen verstehen und bewältigen zu können, ist es unabdingbar, die Prozesse der Technologie, die technomathematischen Vorbedingungen und die Auswirkungen auf die menschliche Wahrnehmung intensiv zu inspizieren.
KI-generierte Videos bergen neue Dramaturgien in sich, auch wenn sie auf den ersten Blick wie herkömmliche Videos oder Filme erscheinen. Die vorliegende Arbeit zeigt, wie die Dramaturgie und damit auch die seltsam anmutende Ästhetik KI-generierter Videos in der Technologie und den Algorithmen hinter KNN begründet liegt. Die Eigenlogik der Technologie offenbart sich in den von ihr geschaffenen Phänomenen.
Untersucht wird das Zusammenspiel von Mensch-Maschine, indem beide diametral gegenüberliegenden Perspektiven – auf der menschlichen die Phänomenologie, auf der technologischen die Medienarchäologie – eingenommen und dann miteinander verbunden werden. Für die technologische Perspektive wurden die Algorithmen der zugrundliegenden KNNs analyisiert und auf ihre Funktionsweise hin untersucht und diese detailliert beschrieben. Im Anschluss wurde eine kontrollierte Experimentierumgebung geschaffen, in der eigens zehn Videos synthetisiert wurden. Der Code wurde dabei so manipuliert, dass das Experiment wiederholbar ist und dieselben Videos produziert. Die nachfolgende phänomenologische Beschreibung der Videos bilden den Kern der menschlichen Perspektive. Verknüpft werden diese beiden Betrachtungsweisen im Anschluss, indem die dramaturgischen Kernaspekte auf konkrete Wirkmechanismen der Algorithmen zurückgeführt werden. Dabei konnte gezeigt werden, dass die Dramaturgie KI-generierter Videos sich zwar aus menschlicher Dramaturgie konstituiert, jedoch durch die technologische Prozessierung von Daten eine eigene Dramaturgie einschreibt, die der Mensch wiederum wahr- und dazu eine Position einnimmt. Damit öffnet die Arbeit die Interaktion zwischen Mensch und Künstlicher Intelligenz auf anschauliche Weise und legt somit einen eigenen Entwurf von eXplainable Artificial Intelligence (XAI) vor.