BLOG >>

Der schlimmste Albtraum der Kreativen Klasse? DALL·E 2!

Die künstliche Intelligenz Dall E 2 erzeugt Kontroverse. Fotograf:innen, Illustrator:innen, Designer:innen fühlen sich bedroht. Denn mit Dall E 2 lassen sich Bilder unkompliziert per Texteingabe erzeugen. Mit vielen offenen rechtlichen Fragen.

Was ist Dall E 2?

Dall E ist eine künstliche Intelligenz, entwickelt von OpenAI. OpenAI bezeichnet sich als KI-Forschungs- und Bereitstellungsunternehmen und sagt über sich selbst:

Die Mission von OpenAI ist es sicherzustellen, dass künstliche allgemeine Intelligenz (AGI), – womit wir hochautonome Systeme meinen, die Menschen bei einem Großteil der wirtschaftlich wertvollen Arbeit übertreffen, – der gesamten Menschheit zugutekommt.

Mit dem neuen Produkt Dall E 2 scheint dies dem Unternehmen zu gelingen. Denn Dall E 2 erzeugt Bilder binnen Sekunden allein auf Basis einer simplen Texteingabe in beeindruckender Qualität, in unterschiedlichen Stilen und mit kreativem Ansatz.

Was ist Dall E 2?

Dall E ist eine künstliche Intelligenz, entwickelt von OpenAI. OpenAI bezeichnet sich als KI-Forschungs- und Bereitstellungsunternehmen und sagt über sich selbst:

Die Mission von OpenAI ist es sicherzustellen, dass künstliche allgemeine Intelligenz (AGI), – womit wir hochautonome Systeme meinen, die Menschen bei einem Großteil der wirtschaftlich wertvollen Arbeit übertreffen, – der gesamten Menschheit zugutekommt.

Mit dem neuen Produkt Dall E 2 scheint dies dem Unternehmen zu gelingen. Denn Dall E 2 erzeugt Bilder binnen Sekunden allein auf Basis einer simplen Texteingabe in beeindruckender Qualität, in unterschiedlichen Stilen und mit kreativem Ansatz.

Das Problem? Dall E 2 setzt die prekäre Gruppe kreativ Tätiger weiter unter Druck, indem es künstlerische und handwerkliche Fähigkeiten von Menschen übertreffen kann.

Aber wie funktioniert Dall E 2?

Die KI funktioniert durch Texteingabe. User:innen können die gewünschten Bilder in kurzer und simpler Textform beschreiben und die KI präsentiert visuelle Interpretationen dieser Texteingaben. Ist eines der Bilder passend, können User:innen dieses weiter bearbeiten, bis sie mit dem Ergebnis zufrieden sind:

Für eine technische Beschreibung von Dall E 2 verweisen wir hier auf einen hervorragenden Artikel von: Alberto Romero

Ein Beispiel:
“an armchair in the shape of a peach ”

Aber es geht natürlich auch komplexer.

Ein weiteres Beispiel:
“A full-body statue holding a computer sitting at the edge of a pool in a roman bath. Marble, copy after Hellenistic original from ca. 200 BC, hyperrealism.“

Dieses Bild zeigt einen römische Statue mit Laptop.

Wunderbar, denken wir uns! Sie sich auch? Durchwegs skurril und interessant. Doch in den letzten Wochen kam es in den Mainstream-Medien zu kritischen Diskussionen über Dall E 2 und seine Implikationen/Folgen.

Warum und von wem wird die Nutzung von Dall E 2 kritisiert?

Manche Menschen fürchten um eine Gefahr für kreativ Schaffende und das wohl zu Recht. Kreativbranchen arbeiten jeher notorisch prekär im Rahmen der wirtschaftlichen Anwendbarkeit ihrer Leistungen. Sind diese nicht monetär verwertbar, sind sie nichts wert. Und dazu passt Dall E 2 perfekt. Denn die KI ist in der Erstellung von Inhalten schnell, variantenreich und billig.

Diese Vorteile kommen im Besonderen Magazinen, Zeitungen, digitalen Plattformen und werblichen Zwecken zugute, in denen Fotos und Illustrationen dekorativ und kurzzeitig eingesetzt werden. Wo früher Stock-Fotos benutzt wurden, finden nun Bilder von Dall E 2 ihren Platz.

Auch die – zumindest aktuelle – rechtliche Situation erleichtert die Handhabung, weil diese Werke aus heutiger rechtlicher Sicht keinen Urheber haben. Schöpfer ist „die Maschine“, also die AI – die meisten Rechtsordnungen sehen bisher vor, dass nur ein Mensch Urheber eines Werkes sein kann, und diese Rechte auch durchsetzen kann. Die Werke von Dall E 2 sind somit automatisch gemeinfrei.

Selbst renommierte Magazine wie „Cosmopolitan“ oder „Economist“ haben AI zur Gestaltung ihres Covers genutzt. Der KI-Hype greift um sich. Ob er zu einer nachhaltigen Änderung in der Gestaltung von Medien führen wird, bleibt abzuwarten.

Dieses Bild zeigt ein Cover der Cosmopolitan auf dem sich ein Astronaut befindet.

Blickt man auf den bestehenden Markt an Stock-Fotos, könnte man die Aufmischung des Marktes durch Dall E 2 durchaus begrüßen. Endlich eine spannende und inhaltlich selbst gestaltbare Alternative. Kostengünstig und inspirierend.

Tatsächlich ist ja die Qualität von Massenware Stock-Fotos eher schlecht, inhaltlich banal, ohne Aura und Leben – und somit oft unbrauchbar – und verhalf nicht primär kreativ Schaffenden zum Erfolg, sondern, wenn überhaupt, den Anbietern der Plattformen selbst.

Nicht nur deswegen könnte Dall E 2 eher als Ergänzung denn als Bedrohung zu sehen sein. Eine ernsthafte Konkurrenz für kreativ Schaffende stellt Dall E 2 nicht dar, denn schlussendlich gilt doch: schöpferische Kraft ist nicht gleich künstlerisch handwerklicher Leistung. Eine Venus von Milo kann jeder Computer reproduzieren, aber der Einfall und Zeitpunkt ihrer Entstehung machen sie einzigartig.

Die Furcht mancher produktionsorientierter Designer:innen oder Illustrator:innen ist dennoch durchaus verständlich. Denn die Kannibalisierung handwerklicher Leistungen durch neu entstehende Technologien ist kein neuer Trend, und was Dall E 2 heute bietet, ist wohl nur der Anfang.

Moral im Kontext der künstlichen Intelligenz?

Eine Technologie wie Dall E 2 bringt aber zwangsläufig nicht nur produktionstechnische Änderungen mit sich, sondern auch moralische Implikationen. 

Indem die KI visuelle Inhalte definiert, trifft sie moralische Entscheidungen. Rassenstereotypen, geschlechtsspezifische Zuordnungen, das Böse, das Gute, das sexuell Legitime, all das definiert nun eine KI. Dall E 2 bewertet und gibt Bedeutung im Rahmen der Möglichkeiten, die das Unternehmen OpenAI der KI freistellt.

Ein Beispiel:
“a beautiful man sits in a red chair and drinks a coffee, painting”

Malerei, die einen Mann lesend in einem roten Sessel zeigt.

Warum also dieser Mann? Warum ist er weiß? Wieso hat er einen Dreitagebart? Wiese hat er strubbelige Haare? Warum ist er in seinen 30ern? Warum sitzt er auf diesem Stuhldesign? Wieso diese Hosen? Und wieso ein V-Ausschnitt? All das bleibt unbeantwortet und orientiert sich nach den Normen und somit nach den Ansichten und Werten einer kleinen Gruppe Menschen, die unsichtbar im Hintergrund bleiben.

Open Ai sagt dazu:

Unsere Inhaltsrichtlinie erlaubt es Benutzer:innen nicht, unter anderem gewalttätige, nicht jugendfreie oder politische Inhalte zu erstellen. Wir generieren keine Bilder, wenn unsere Filter Textaufforderungen und Bild-Uploads erkennen, die möglicherweise gegen unsere Richtlinien verstoßen. Wir haben auch automatisierte und menschliche Überwachungssysteme, um Missbrauch vorzubeugen.

Die Problematik besteht also darin, dass wir die Entscheidung, was ein „beautiful man“ ist, der KI und ihren “Moderator:innen” überlassen – wobei dieses Beispiel der ästhetischen Wertung noch recht harmlos ist. Da die Quellen der KI nicht einsehbar sind und eben keine Kontrollinstanz besteht, werden Stereotype verstärkt und schlimmstenfalls die Säulen einer neuen Leitkultur.

Darüber hinaus erlaubt Dall E 2 tiefgreifende Manipulationen bereits bestehender Bilder von Menschen. So kann die Software helfen, ihren Kopf auf einen durchtrainierten männlichen Körper oder auf die Modellmaße einer 16 Jährigen zu montieren. Und das schnell, einfach und relativ perfekt.

Ein Beispiel:
Upload: Philip Reitspergers Kopf | Text: WWE wrestler

Dieses Bild zeigt Philip als Wrestler.

Hintergründe zu tauschen, Körperteile zu ergänzen oder zu manipulieren, die künstliche Intelligenz ist in der Lage, die Identität des Individuums und die Würde des Menschen selbst zu verändern. Die Zustimmung der abgebildeten Person wird von der KI nicht überprüft, daher vorausgesetzt. Ob diese aber vorhanden ist, wird nicht weiter überprüft. OpenAI sichert sich in den Nutzungsbedingungen lediglich rechtlich ab.

Ein Beispiel
Upload: Philip Reitspergs Kopf | Text: Laocoon and His Sons

Dieses Bild zeigt Philip in einem Zitat auf Laocoon and His Sons

Dall E 2, ein kreatives Werkzeug?

Bei all den berechtigten Fragen – Dall E 2 ist gekommen, um zu bleiben und nicht das einzige Produkt am Markt. Seine Verwendung wird zu einer Verschiebung im Kräfteverhältnis der Erstellung von kreativen visuellen Inhalten führen.

Besonders Menschen, die sprachlich gebildet sind, aber ihre visuellen Fähigkeiten nicht vertieft haben, können nun eigenständig Bilder erstellen und adaptieren. Je mehr und präziser ein Mensch der KI durch textliche Eingabe etwas mitteilen kann, desto besser und interessanter wird das Ergebnis sein. Der Weg vom Text zum Bild führt aber auch für visuell ausgebildete Menschen zu neuen Möglichkeiten.

Ein Werkzeug der Recherche.

Indem Dall E 2 einen Fundus an visuellen Inhalten zu einem Themenkreis erzeugt, ist es ein wunderbares Werkzeug zu Ästhetik und Inhalt. Die Interpretationen der KI in Kombination mit der Kreativität des Menschen schaffen völlig neue explorative Möglichkeiten.

Ein Werkzeug für Inspiration.

Dall E 2 kann ebenso dazu genutzt werden, um sich inspirieren zu lassen. Indem die KI Interpretation, Adaption und Synthese von bereits bestehenden, aber auch neuen textlichen Inhalten generiert, schafft sie in Windeseile eine Vielzahl von Ansatzpunkten, die sich von den Analogien eigener Gedankengänge mit Sicherheit unterscheiden und somit zu neuen Ideen führen können. Im Besonderen sind gerade inhaltliche und ästhetische Fehlinterpretationen von Dall E 2 oft bereichernd.

Ein Werkzeug zur Materialfindung.

Geht es um die Erstellung von Materialsammlungen, ist Dall E 2 eine große Hilfe. Durch Texteingabe lassen sich visuelle Sammlungen von Materialien erzeugen, die in der Weiterverarbeitung kombiniert und synthetisiert werden können und deren Nutzung auf den ersten Blick rechtlich frei ist. Es wird sich aber womöglich noch weisen, ob Dall E 2 genügend Abstand zu ihren „Inspirationsquellen“ hält, sollte einmal der Urheber eines zugrundeliegenden Werkes sich an der Verbreitung eines Ergebnisses von Dall E 2 stoßen – siehe unten zu den rechtlichen Fragen.

Ein Werkzeug zur Zukunftsfindung.

Laut Open AI wird die KI erfolgreich zur Imagination von zukünftigen visuellen Möglichkeiten eingesetzt: “A reconstructive surgeon told us that he’d been using Dall-E to help his patients visualise results. And film-makers have told us that they want to be able to edit images of scenes with people to help speed up their creative processes.”

Ein Werkzeugersatz für Programme der Bildbearbeitung.

Dall E 2 bietet neben der Bilderausstellung auch einen “Editor”-Modus. Dieser erlaubt es, Bilder zu kombinieren, während die KI eigenständig fehlende Inhalte generiert und hinzufügt. Ein Feature, das sich Top-Marken der Bildbearbeitung wohl in ihren Programmen wünschen würden. Denn dies geht weit über ästhetisches, inhaltsabhängiges Füllen von Bereichen hinaus.

Klar ist, Dall E 2 bietet mehr, als schicke Bilder um wenig Geld. Die beschriebenen Use-Cases spiegeln lediglich unseren Anwendungsbereich mit der KI wieder. Andere Menschen und Unternehmen werden verwertbarere Modelle finden. Eine spannende Sache.

Dall E 2, ist die KI eigenständig kreativ?

Inwiefern Dall E 2 eigenständig kreativ ist, scheint für uns fraglich. Versteht man Kreativität als die Verwendung von Vorstellungskraft, um originelle Ideen zu schaffen, dann lautet unserer Meinung die Antwort: Nein. Denn Dall E 2 schafft keine originellen Ideen. Die KI kreiert Interpretationen im Rahmen gelernter Bedingungen. Aber nicht über diese Bedingungen hinaus. Nimmt man es jedoch besonders genau, könnte man in den Missgeschicken und Fehlern der Bilderstellung von Dall E 2 einen Hauch von Schaffenskraft erkennen.

Freie Nutzung? Rechtliche Unsicherheiten?

Aus rechtlicher Perspektive interessieren vor allem zwei Fragen in Zusammenhang mit Dall E 2 Kreationen: 1. Gibt es einen Urheber und entsteht somit Urheberrecht an den Dall E 2 Kreationen? 2. Sind Rechte der Urheber der Werke zu beachten, von denen sich Dall E 2 Inspiration holt?

Entsteht urheberrechtlicher Schutz an Dall E 2 Kreationen?

Urheberrecht knüpft nach mitteleuropäischer Rechtstradition an das „Schöpferprinzip“ an, es erfordert zwar keine besondere Kreativität oder „Werkhöhe“, aber zumindest eine eigentümliche geistige Schöpfung eines Menschen. Auch wenn Dall E 2 zwar die eigenständige Kreativität abgesprochen wird und es mehr als Werkzeug angesehen wird, so ist dennoch klar: Es ist nicht der den Text eingebende Mensch, der hier eine geistige Schöpfung kreiert, sondern eben die AI.

Somit scheidet nach heutiger Rechtslage urheberrechtlicher Schutz aus. Vergleichbar dazu verweigerte etwa auch das europäische Patentamt die Eintragung der Inhaberschaft der AI Creativity Machine DABUS für ein Patent, da nur ein Mensch Erfinder sein könne. Zum Urheberrecht haben auch U.S. Gerichte schon 2014 im Fall des berühmten „Affen-Selfies“ festgehalten, dass nur ein Mensch als Autor und Inhaber von Urheberrechten in Frage kommt – der Fotograf, der dem Makaken die Kamera für sein Selfie in die Hand drückte, ging somit leer aus.

KI-Bilder für alle?

Sind somit alle Schöpfungen einer nicht-menschlichen „Autor:in“, wie auch Dall E 2, automatisch in der Public Domain? Auf den ersten Blick, ja. Auch OpenAI knüpft, ganz im Sinne ihrer Philosophie, keine weiteren rechtlichen Bedingungen an die Nutzung der Kreationen.

Als Zwischenergebnis halten wir fest, dass somit weder die AI, noch der eingebende Mensch Urheberrechtsschutz an den Dall E 2 Werken beanspruchen kann. Das bringt natürlich auch die Problematik mit sich, dass diese Werke schwer kommerzialisiert werden können: Will man sie als Teil eines größeren Werks, zum Beispiel eines Katalogs oder einer Website, Kund:innen verkaufen, so lässt sich die Nutzung kaum einschränken. Schließlich stehen keine urheberrechtlichen Unterlassungs- oder Schadenersatzansprüche zu.

Aber abseits der kommerziellen Verwertung – bedeutet dies nun, dass Kreationen von Dall E 2 uneingeschränkt genutzt werden dürfen?

Woher bekommt Dall E 2 seine Bilder?

Auch Ansprüche der Inhaber der zugrundeliegenden Werke, die Dall E 2 “interpretiert”, sind zu bedenken. Die Bilddatenbank Getty Images hat kürzlich verlautbart, keine Dall E 2 Kreationen mehr zu akzeptieren und verweist als Grund auf die nicht behandelten Rechteprobleme in Bezug auf die zugrunde liegenden Bilder und Metadaten, die zum Trainieren dieser Modelle verwendet werden.

Hier ist zunächst faktisch nicht klar, woher die AI all die Werke, von denen sie „lernt“ bezieht. Sind diese alle gemeinfrei oder werden Lizenzen abgeschlossen? Oder erfolgt hier ein „scraping“, also automatisiertes „Abgrasen“ des Internets ohne Zustimmung der Rechteinhaber? Und ferner: Selbst wenn die AI ganz legal Zugang zu den zugrunde liegenden Werken erhält, ist immer noch nicht geklärt, ob die Nutzung durch die AI, nämlich die maschinenbasierte Verarbeitung zur „Erlernung“ eines Stils, zulässig ist. Auf genau diesen Punkt sind aktuell Kläger in den USA aufgesprungen: Hier Klagen Urheber von Werken im Wege einer Sammelklage die Unternehmen hinter den AI Systemen Stability AI und Midjourney. Nach Einschätzung des Autors wäre eine solche Klage in Österreich aber nicht erfolgversprechend.

Genug Abstand zur „Inspiration“?

Zudem bleibt noch das Problem der Unkontrollierbarkeit des „Outputs“. Wie wird sichergestellt, dass Dall E 2 nicht „zu viel“ Inspiration nimmt, bzw. geradewegs Teile kopiert? Zunächst ist schon auf faktischer Ebene unklar, wie weit Dall E 2 sich von bestehenden Bildern „inspirieren“ hat lassen, und wie viele Bestandteile von bestehenden Werken verwendet, kopiert, oder „nachgeschaffen“ werden. Es gibt keine Möglichkeit, dies nachzuvollziehen.

Eine Pixel-Illustration von American Gothic.

Doch selbst wenn eine Quantifizierung möglich ist, bleibt die Frage; Wie viel ist zu viel? Einige Pixel? Ein figurativer, nebensächlicher Bestandteil eines Bildes? Ein wesentlicher Bestandteil? Dies bedingt immer eine rechtliche Wertungsentscheidung, die in jedem einzelnen Fall durchgeführt werden müsste. Eindeutig ist die Rechtslage nur insofern, als kein urheberrechtlicher Schutz für bestimmte Ideen, Methoden oder Stile besteht.

Die oben beschriebene Vorgabe „hyperrealism“ ist also ebenso wenig problematisch wie etwa die Vorgabe eines „Dalí style” oder “pixel art“. Das Urheberrecht schützt immer nur eine konkrete Ausdrucksform, die „Expression“. Bei Teilen eines Werks wird es aber genau hier problematisch. „Inspiration“, Ähnlichkeiten, Übernahme eines Stils ist ok – die Übernahme von Werken, oder Teilen davon, nicht.

Bis vor kurzem ging man zumindest in Österreich und Deutschland noch davon aus, dass jedenfalls eine „freie Bearbeitung“ vorliegt, wenn das alte Werk vor dem Hintergrund des neuen „vollständig verblasst“.

Seit der aus dem Musik-Sampling stammenden Entscheidung „Metall auf Metall“ des EuGH aus 2018 ist dieser Maßstab sogar noch strenger geworden. Nun soll immer schon dann eine „abhängige“ Bearbeitung vorliegen (die die Zustimmung des Urhebers des älteren Werks erfordert), wenn das ältere Werk noch „erkennbar“ ist. Ob dieser rechtliche Maßstab nun allgemein auch für Bildwerke gilt, ist allerdings noch umstritten.

Auch die weiteren bestehenden Ausnahmen des Urheberrechts (sogenannte „Schranken“: zB Privatkopie, Karikatur, Pastiche) kommen bei den meisten Nutzungsformen von Dall E 2 wohl nicht zur Anwendung.

Auch die weiteren bestehenden Ausnahmen des Urheberrechts (sogenannte „Schranken“: zB Privatkopie, Karikatur, Pastiche) kommen bei den meisten Nutzungsformen von Dall E 2 wohl nicht zur Anwendung.
Das bedeutet, dass wohl immer dann, wenn Dall E 2 nennenswerte Teile eines urheberrechtlich geschützten Werks „nachschafft“, keine „freie“, sondern eine „abhängige Bearbeitung“ besteht. Diese wiederum würde eigentlich die Zustimmung des Urhebers des zugrundeliegenden Werkes benötigen, bevor sie verbreitet oder vervielfältigt werden darf. Das heißt, bei jeder nicht-privaten Nutzung, insbesondere jeder Verbreitung, schwingt ein gewisses Risiko mit, dass sich Rechteinhaber an einem der „ursprünglichen“ Werke mit Ansprüchen melden. Weshalb auch Datenbanken wie Gettys dieses Risiko aktuell nicht auf sich nehmen.