Skip to content

Das Ende der Kreativität? Wie Midjourney, Dall-E und andere KI-Bildgeneratoren die Arbeitswelt von Kreativschaffenden beeinflussen

KI-Design, Illustration: Schaffrinna, erstellt mit Hilfe von Midjourney und Affinity Photo
KI-Design, Illustration: Schaffrinna, erstellt mit Hilfe von Midjourney und Affinity Photo

In vielen Branchen (Automobil, Industrie, Architektur) kommen im Bereich 3D-Modelling und -Printing bereits seit einigen Jahren Tools zur Anwendung, mit denen sich dank KI-Algorithmen eine sehr hohe Anzahl an Designvarianten generieren lässt. Spätestens jetzt, im Zuge der Verbreitung von KI-Bildgeneratoren wie Midjourney, Dall-E und anderer Software, erreicht die „künstliche Intelligenz“ nun auch die Arbeitswelt von Kreativschaffenden. Über Chancen, Risiken und Ethik.

Die Story ging vor einigen Tagen um die Welt. Das vom Spiele-Entwickler Jason Allen bei einem Fine-Arts-Wettbewerb im US-Bundesstaat Colorado eingereichte und mit Hilfe künstlicher Intelligenz generierte Bild „Théâtre D’opéra Spatial“ (Abb. unten) wird mit einem Preis ausgezeichnet. Sowohl Allen wie auch der Veranstalter stehen seitdem in der Kritik. Auf Twitter fallen Kommentare wie, es sei zu beobachten, wie sich der Tod der Kunst direkt vor unseren Augen entfalte. Es könne nicht angehen, dass ein von Algorithmen erzeugtes Bild ein von Menschenhand geschaffenes Werk aussticht.

Gegenüber US-Medien beteuert Allen, Inhaber einer kleinen Brettspielfirma namens Incarnate Games, er habe gegen keinerlei Regeln verstoßen. Die eingereichte Arbeit, die mit einem Preisgeld in Höhe von 300 US-Dollar bedacht wurde, habe er mit der Absenderschaft „Jason Allen via Midjourney“ versehen. Auf die von vielen Nutzern im Web geäußerten Vorwürfe angesprochen, das Bild sei eigentlich gar nicht sein Werk, erklärt Allen, sein Wettbewerbsbeitrag sei das Ergebnis von mehr als 900 Iterationen und Versuchen. Insgesamt habe er in die Arbeit 80 Stunden investiert und dabei auch andere Tools wie Photoshop verwendet, um an Details zu feilen.

„Théâtre D’opéra Spatial“, von Jason Allen, Quelle: Discord,@Sincarnate
„Théâtre D’opéra Spatial“, von Jason Allen, Quelle: Discord,@Sincarnate

Der international weitestgehend unbekannte Fine-Arts-Wettbewerb in Pueblo könnte, da dieser ungewollt vielfältige ethische, gesellschaftliche, kulturelle, wirtschaftliche wie rechtliche Fragen aufwirft, zum Nucleus eines neuen Verständnisses werden. Was ist Kreativität? Können Menschen, in dem sie Wörter per Eingabe (Prompt) an eine KI-Software übermitteln, für sich beanspruchen, eine kreative, schöpferische Leistung vollbracht zu haben? Ist es fair, gegenüber jenen Personen, die keine KI-Software verwenden, dass eine solche Arbeit ausgezeichnet wird? Müssen sich Künstler, Grafiker, Designer, Fotografen, Illustratoren und andere Kreativschaffende um ihre berufliche Zukunft sorgen?

Was vor einiger Zeit noch utopisch erschien, ist Realität geworden. Mit Hilfe künstlicher Intelligenz lassen sich einzig auf Basis von Textbeschreibungen visuelle Werke generieren, die neben jenen von Menschenhand geschaffenen Arbeiten nicht nur bestehen, sondern diese gar übertrumpfen. Die verwendete KI-Software ist nicht etwa lediglich einigen wenigen Forschenden in Laboren vorbehalten, sondern, und dieser Umstand trägt das Thema mit einem Schlag in die Arbeitswelt aller Kreativschaffenden, sie ist nunmehr frei zugänglich. KI-Bildgeneratoren wie Midjourney, Dall-E 2 (Open AI), Imagen (Google Brain) und Stable Diffusion drängen auf den Markt. Allein Midjourney hat mittlerweile mehr als eine Million Anwender.

Die Auseinandersetzung darüber, was Kunst ist und was nicht, wird seit der Antike geführt. Werke, wie die von Jason Allen, befördern den von Joseph Beuys geprägten Leitsatz „Jeder Mensch ist ein Künstler“ ins digitale Zeitalter. Das Internet und die Digitalisierung haben die Art und Weise, wie Menschen arbeiten und miteinander kommunizieren revolutioniert und gesellschaftliches Leben insgesamt radikal verändert. Beuys Leitsatz lässt sich heutzutage im Prinzip auf fast jede andere Disziplin, Berufsgruppe und jedes andere Betätigungsfeld übertragen. Jeder und jede ist Künstler, Designer, Schauspieler, Musiker, Entertainer, Berichterstatter, Reisereporter, Autor, Ernährungsberater, Ausstattungsspezialist, Koch, Mental-Coach oder Hundetrainer. YouTube, Twitter, Facebook, Instagram und TikTok sei Dank.

Kritik gegenüber technischen Innovationen wie auch hinsichtlich neuer Ausdrucksformen gibt es nicht erst seit dem Internet. Mitte des 19. Jahrhunderts äußerte sich der französische Schriftsteller und Kunstkritiker Charles Baudelaire abwertend über die Fotografie und sprach dieser ihre Berechtigung als Kunstform ab. Um Kunst zu schaffen, so seine Kritik, bedürfe es Phantasie. Und Phantasie im Zusammenhang mit dem technischen Fotoapparat konnte er sich nicht vorstellen. Seitdem hat sich nicht nur das Verständnis in Bezug auf Kunst grundlegend verändert.

Dort wo früher vielfach Expertentum erforderlich gewesen ist, braucht es heute dank vorhandener technischer Infrastruktur keines besonderen Know-hows mehr. Mit wenigen Klicks lässt sich eine Website ins Netz stellen (WordPress), ein Buch/eBook publizieren, ein Film/Song veröffentlichen oder der eigene „Sender“/Channel/Audiokanal als Podcast starten. Technisches Wissen oder besondere handwerkliche oder gestalterische Fähigkeiten sind hilfreich, jedoch nicht zwingend erforderlich. Was man nicht hat, findet sich im Netz (Google). Was man nicht weiß, erklärt einem das Kollektiv (Wikipedia, Reddit, u.a.). Und was man selbst nicht kann, steuert die Community bei. Nun wird auch die künstliche Intelligenz Teil der Crowd.

Die Demokratisierung von Wissen und Technik hat Raum für Kreativität und Einfallsreichtum entstehen lassen. Und die Phantasie und der Einfallsreichtum des Menschen sind bekanntermaßen grenzenlos (Albert Einstein). Kreativität ist nicht etwa ein Status, der sich erst nach erfolgreicher Ausbildung und akademischer Laufbahn erreichen lässt, kein Attribut, das allein erwerbsmäßig nachgehenden Gestaltern vorbehalten wäre. Kreativ sein kann jede/jeder, wie auf Twitter geteilte Memes, auf YouTube hochgeladene Videos, Clips auf TikTok und nun auch mittels Midjourney über Discord veröffentlichte Bilder verdeutlichen.

Sind KI-Bildgeneratoren „the next big thing“ innerhalb eines seit Jahrzehnten fortschreitenden Transformationssprozesses? Personal Computer (Hardware) und Programme (Software) hielten Mitte der 1980er/1990er-Jahre Einzug in private Haushalte und ermöglichten so später auch Zugang zum Internet. Mitte der 2000er-Jahre eroberten Blogs und Videoportale das Internet und ließen Millionen von Menschen quasi über Nacht vom reinen Konsumenten zum „Content-Creator“ und Geschichtenerzähler werden: das Buzzword „Web 2.0“ war geboren, und mit ihm ein unendliches Informations- und Unterhaltungsangebot. Auf YouTube, Facebook und später Instagram und TikTok geteilte Geschichten gehen viral und wirken derart anziehend, dass sich vor allem die junge Generation mittlerweile größtenteils abseits der linearen Fernseh- und klassischen Nachrichtenangebote bewegt.

Neue Ausdrucksformen, Medienformate und Spielarten, miteinander in Dialog zu treten, sind entstanden. Bestehende Inhalte werden in Retweets, Mash-Ups und Remixes geteilt und immer weiter re-kombiniert, moduliert und verfremdet, bis letztlich auch Urheberschaften verschwimmen und rechtliche Grenzen durchbrochen werden. Im Rap und Hip-Hop der 1980er-Jahre etablierte sich Sampling, das Kopieren, Phrasieren und Weiterverwenden von Tonsequenzen, als neue kreative Ausdrucksmöglichkeit. Die schöpferische Kraft, die dieser Remixkultur innewohnt, lässt sich kaum leugnen. Lässt sich dies auch über die mittels KI-Bildsoftware entstandenen Motive und Werke sagen?

Sind Bilder wie „Théâtre D’opéra Spatial“ das Ergebnis einer schöpferischen Leistung? Falls ja, worin genau liegt der Akt des Schöpferischen? Stellt bereits die Auswahl und das Formulieren der für das Rendering notwendigen Textbeschreibungen eine kreative, schöpferische Leistung dar? Oder bedarf es zusätzlich einer nachträglichen händischen Feinjustierung im Zuge der Bildbearbeitung in Affinity Photo oder Photoshop? Macht es in dieser Hinsicht einen Unterschied, ob ich ein Gedicht verfasse, einen Songtext schreibe oder einen Prompt an einen Bot sende?

KI-Design, Illustration: Schaffrinna, erstellt mit Hilfe von Midjourney und Affinity Photo
KI-Design, Illustration: Schaffrinna, erstellt mit Hilfe von Midjourney und Affinity Photo

Neben komplexen philosophischen und ethischen Fragestellungen ergeben sich durch die zunehmende Verwendung von KI-Bildgeneratoren wie Midjourney auch ganz praktische Herausforderungen und Probleme, wirtschaftlicher wie rechtlicher Art. Design- und Kreativwettbewerbe sowie öffentliche Ausschreibungen und Pitches werden auf ihre Teilnahmebedingungen hin überprüft und gegebenenfalls angepasst werden müssen. Schon allein deshalb, um dafür Sorge zu tragen, dass mit Hilfe von KI-Software generierte Wettbewerbsbeiträge nicht etwa nachträglich durch Dritte weiter „ge-remixt“ und anderweitig veröffentlicht werden, wie es bei derlei Community-basierten Anwendungen üblich ist.

Der Einsatz KI-basierter Software verändert nicht nur den Entstehungs- und Designprozess, auch das Berufsbild des Designers wird sich unter diesem technologischen Einfluss weiter wandeln (müssen). Denn wenn Entwurfsarbeiten auch mittels KI ausgeführt werden können, braucht es als Designer andere, weitere Qualitäten. Mehr und mehr entwickelt sich die Rolle des Designers vom Kreator zum Co-Kreator, Mediator und Kurator, wie ich bereits versucht habe im Beitrag „Generatives Design – Co-Kreation dank künstlicher Intelligenz“ herauszuarbeiten. Eine ganz ähnliche Entwicklung vollzog sich im Journalismus, wo im Zuge massenhafter Verbreitung von Halbwahrheiten und Fake News nicht allein das Schreiben, sondern mehr denn je das Kuratieren, Sortieren, Einordnen und Kommentieren zu Schlüsselaufgaben wurden. Ein Bruchteil von dem, was die KI auswirft, ist gebrauchsfähig. Das gilt es zu sortieren.

Kreativschaffende sind von Hause aus gut darin sich veränderten Bedingungen anzupassen, seien es technologische, gesellschaftliche oder marktwirtschaftliche. Also „no need to change, sondern Weiter­ent­wick­lung – wie immer“, wie Gesche Joost, Professorin an der Berlin University of the Arts und Leiterin des Design Research Lab, im Gespräch mit Design-Thinker Felix Kosok resümiert? Der damit verbundene Handlungsdruck, sich immer wieder neu aufstellen und erfinden zu müssen und sich den Umgang mit neuen Werkzeugen anzueignen, kann freilich auch einengend und lähmend wirken. Und der Druck, soviel scheint klar, wird durch KI-Software nicht geringer.

Autoren wie Charlie Warzel (The Atlantic) beginnen, anstatt eine Illustratorin oder einen Grafiker zu beauftragen, begleitendes Bildmaterial für ihren redaktionellen Beitrag mit Hilfe von KI-Engines anzufertigen, so berichtet etwa Vice. Für Leser des Magazins ist der Unterschied nicht zu erkennen. Viele, die einem gestaltenden Beruf nachgehen, stehen hingegen vor existentiellen Herausforderungen. Die Konkurrenz wird abrupt um Millionen Anwender größer. Was, wenn Unternehmen, Verlage, Medienhäuser und Redaktionen dazu übergehen Motive, Designs und Logos von der KI anfertigen zu lassen? Was bleibt dann an Arbeit für Fotografen, Illustratoren, Grafiker und Designer übrig? Muss die Politik auch hier regulierend eingreifen? #Debatte

Die Süddeutsche hatte im Rahmen ihres Projektes „ZukunftderArbeit“ einmal gefragt: „Wie wahrscheinlich ist es, dass ich durch einen Computer ersetzt werde?“. Bei Eingabe von „Bildender Künstler, Maler, Bildhauer, Illustrator“ wird derzeit lediglich 4,2 % als Wahrscheinlichkeit angegeben (Fotograf 2,1 %, Grafikdesigner 8,2 %). Da dieses Daten-Tool allerdings bereits 2015 entwickelt und veröffentlicht wurde, frage ich mich, wie viel Aussagekraft noch in diesen Zahlen liegt.

Dieser Beitrag hat 35 Kommentare

  1. Hab mich mal auf Lexica umgesehen, der Suchmaschine, auf der von der KI Stable Diffusion erzeugte Bilder zu finden sind. Diese Bilder haben alle, ich sage alle, egal ob sie alte Meister, überhöhte Fotografie oder andere Moderne nachahmen, etwas Surreales wie aus Galaxien. Dieses Midjourney tickt ähnlich. Es kann sein, dass es an den Nutzern liegt, welche vorrangig Freude an überhöhten Bildimpressionen haben. Das klassische Buinessstockbild ‘Gut aussehende und gut gelaunte Mitarbeiter mit Chef am Konferenztisch bei gleichmäßiger Ausleuchtung’ wird von engagierten ‘Kunst’ anvisierenden Nutzern wohl kaum angepeilt werden wollen. Ob es dennoch geht, probiere ich mal aus.

    So richtig brauchen kann galaktische ‘Kunst’-Bilder nur ein Bruchteil von Klienten/Auftraggeber auf ihrer kommerziellen Site – dann, wenn dieses ‘Timbre’ oder so ein ‘Tone of Voice’ bildsprachlich verlangt ist.

    Das Editorial braucht auch mal etwas anderes als immer Kunst-Galaktisches. Man kann sich bei solchen Eergebnissen kaum vorstellen, dass solche surrealen Erzeugnisse immer und überall alle Illustratoren und Künstler verdrängen können.

    Außer es gelingt sicher auch hier, ich denke JA – per gezielter Text-Eingabe – vollkommen sachliche Bildgedanken zu realisieren. Dann wird es zu einer Gefahr für viele Icon-/Stockbildersteller/-Fotografen.

  2. Da KI auf der Eingabe von Samples beruht und sich damit einen Reim draus mach was es ausspuckt, bleibt mir die Frage offen – kann KI einen eigenen Style entwickeln. Den der Style eines Künstlers ist das was Ihn/sie ausmacht.

    Wenn das Eintreffen sollte, wird’s interessant.

    1. Das hab ich mir auch schon überlegt, wie es wäre, der Maschine den eigenen Style verklickern zu können.

      Bis dahin wird man wohl so vorgehen müssen, dass man einen Upload, mehrere Uploads, eines eigenen Werks macht und Prompts dazu gibt, in der Hoffnung, die Maschine lerne aus neuen Datensätzen.

      Das setzt voraus, dass es einem egal sein muss, ob das eigene Werk irgendwo im Netz-Universum verändert, verfremdet wieder auftaucht.

  3. Frage an Achim:
    Müsste das in der Headline nicht heißen
    “Wie Midjourney, Dall-E und andere KI-Bildgeneratoren die Arbeitswelt von Kreativschaffenden beeinflussen.”
    ?

    (Komment kann weg wenn geklärt..)

  4. Was im Artikel außer Acht gelassen wurde ist die Möglichkeit der Bildmanipulation-, Retusche und Bearbeitung, also die “Edit” Funktion. Das sehe ich als Größere “Bedrohung” für die Zunft der Photoshop-Professionals und 3D-Artists.

  5. Gettyimages verbannt Bilder, die mittels KI erstellt sind:
    https://www.theverge.com/2022/9/21/23364696/getty-images-ai-ban-generated-artwork-illustration-copyright

    Auszug (auf Deutsch, Artikel ist in Englisch):

    „Es gibt echte Bedenken in Bezug auf das Urheberrecht der Ergebnisse dieser Modelle und nicht angesprochene Rechtefragen in Bezug auf die Bilder, die Bildmetadaten und die in den Bildern enthaltenen Personen“, sagte Peters. Angesichts dieser Bedenken, sagte er, könnte der Verkauf von KI-Kunstwerken oder -Illustrationen die Nutzer von Getty Images möglicherweise einem rechtlichen Risiko aussetzen. „Wir handeln proaktiv zum Nutzen unserer Kunden“, fügte er hinzu.

  6. Ein höchst spannendes Thema, ich bin selbst überwältigt von den Möglichkeiten, die etwa Midjourney bietet und seit Wochen süchtig danach. Wo die Kunst beginnt, ist mindestens schon seit Konzeptkunst und Ready-Mades unklar – und wird es auch weiterhin bleiben. Fix ist, dass die kuratierende Funktion der Designer*in immer wichtiger wir. Tools wie KI Bildgeneratoren lassen sich – ähnlich wie die beliebten Moodboards – wunderbar unterstützend im Kreativprozess einbinden. Es ist etwa sehr hilfreich, eine Artwork-Idee als Diskusionsgrundlage in Midjourney zu draften und dann basierend auf dieser Skizze in die Detailausführung zu gehen bzw eine Illustrator*in zu briefen.
    Sehr wohl verleiten derartige Möglichkeiten aber zu Gedanken wie etwa “warum sollte ich überhaupt noch selbst etwas malen” – was sonst 1 Woche Arbeitszeit wäre, ist hier in 10 min erledigt. Kund*innen werden logischerweise ähnlich denken, sobald die Möglichkeiten dort angekommen sind. Umsomehr wird sich die lukrative Design-Arbeit weiter in Richtung größere Aufträge, komplexere Themenstellungen und fachkundige Beratung verschieben.
    Dinge wie das illustrierte Plattencover für die Underground-Band und das coole Visual für den Flyer kann man aus finanzieller Sicht in Zukunft wohl eher vergessen.

Kommentare sind geschlossen.

An den Anfang scrollen