Dall-E 2 Text-zu-Bild-KI macht süchtig!

Hexe Faye aus den M.A.Y.A.-Romanen, courtesy of DALL-E 2.

“OMG, nehmt mir diese KI weg!” flehte neulich Selfpublisher-Kollege Ivan Ertlov, der mit Hilfe von Dall-E 2 Schauplätze und Charaktere für seinen jüngsten Roman zum Leben erweckte.

Doch ich bin sehr glücklich, dass niemand ihm diese OPEN-AI-Software abgenommen, bzw. seinen Zugang gesperrt hat. Denn so konnte er seinen neusten Avatar-Roman bebildern, den ich gerade lese:

Aber unabhängig von den witzigen, KI-generierten Bildern im Buch, kann ich, wie immer, die Avatar-Reihe nur empfehlen. Mit Teil 7 hat Ivan den Vogel endgültig abgeschossen. Ich bin erst bei der Hälfte, habe aber schon so oft laut gelacht, dass Miss Wiki irgendwann empört von ihrem E-Book aufgeschaut hat (irgendeinem Urban-Romantasy-Schmuh, höhö).

Ich bin mir nicht sicher, aber vielleicht ist Ivan sogar der erste, der seinen Roman mit Hilfe von Dall-E bebildert hat. Sogar die Cover seiner nächsten Romane, Avatar 7 und 8 sind dem Geist der Maschine entsprungen. Gruselig und wunderbar! Zu den Implikation gibt es unten mehr…

Aber was ist überhaupt Dall-E 2?

Dall-E ist ein, für meine Begriffe, schon unheimlich (wie in scary!) weit entwickeltes Text-zu-Bild-Programm auf Grundlage einer Künstlichen Intelligenz.

Der Name ist eine Anspielung auf den niedlichen Roboter Wall-E von Pixar, sowie den surrealistischen Künstler Salvador Dalí. Und besser hätte man diesen Bildgenerator wirklich nicht benennen können. Denn was diese “Roboter”-Intelligenz erschaffen kann, ist manchmal wirklich äußerst surreal, wie aus einem Traum oder Alptraum entsprungen.

Dall-E 2 ist nur schon die verbesserte Variante der ersten KI. Sie kann noch besser Texte auswerten, Zusammenhänge erkennen, und alles in Bilder umsetzen.

Und das ist SO ABGEFAHREN!

Ihr könnt in eine Google-artige Befehlszeile einfach reinschreiben, was gerade Schwachsinniges durch eure Hirnwindungen turnt. Am besten noch den Zeichenstil wie “Painting”, “Pixel Art”, “Synthwave Style”, “Hand Drawn”, “3D Art” (geht alles!) oder was auch immer dazu schreiben und abschicken. Und in nur wenigen Sekunden, hat die KI eure Angaben in einen Text übersetzt. Dabei schlägt sie euch stets demütig 4 Varianten vor, von deren besten Versionen ihr, wenn ihr möchtet, weitere Varianten generieren lassen könnt.

Einer meiner Ersten Versuche:

Odin standing in a giant throne room. He is laughing. There are strawberries everywhere. Realistic 3D Art.

Knüller, oder?

Oder wie wäre es mit einer Szene, die von dem Roman inspiriert ist, den ich gerade schreibe:

A terrifying golem made out of cake. In medieval kitchen. Realistic painting.

Vollkommen faszinierend, wie die KI versucht denn Sinn in euren Worten zu erkennen, um ein möglichst gutes Bild zu erschaffen.

Aus dem NICHTS!

Was übrigens auch bedeutet, dass ihr zwar nicht der Urheber seid, aber sämtliche Rechte zur Benutzung, Verbreitung und finanzieller Vermarktung habt! Im Gegenzug darf niemand ohne eure Erlaubnis kopieren und benutzen, was ihr mit Hilfe der Dall-E 2-KI erschaffen habt.

Bekloppt oder? Und wunderbar!

Ähnlich zwiegespalten bin ich natürlich auch, wenn ich über die Implikationen dieser KI nachdenke.

Wie schnell werden immer bessere Versionen von solchen KIs Künstler arbeitslos machen?

Ich könnte ja jetzt schon meinen ersten Roman kostenlos bebildern lassen! (was ich weiter unten, spaßeshalber auch mal getan habe…)

Doch wirklich terrifying ist, dass es sowas auch schon für Text-Generation gibt. Wann werde ich als Schriftsteller überflüssig sein?

Wer nicht sieht, worauf das mit der künstlichen Intelligenz langfristig (oder auch schon sehr kurzfristig!) hinausläuft, hat wohl Scheunentor-große Scheuklappen an.

Singularität.

Wunscherfüllung auf Knopfdruck.

Etwas, was ich in meinen M.A.Y.A.-Romanen ja nicht nur zufällig thematisiere…

“Neulich” hat es übrigens ein Computer-Brain-Interface das erste Mal geschafft, dass jemand etwas denken konnte und der Computer hat es nahezu fehlerfrei in Text übersetzt… WTF!? Googelt es!

Immer bessere Virtual Reality, immer bessere KI, immer bessere Schnittstellen zwischen Hirn und Maschine… schöne und furchtbare neue Welt!

Aber zurück zu angenehmen Dingen. Spielen wir mal weiter mit der KI.

Im Folgenden habe ich DALL-E 2 mit einer Handvoll Szenen aus meinem ersten M.A.Y.A.-Roman gefüttert. Faszinierend, wie die KI meine Charaktere und Locations interpretiert.

Hier trifft unser Ich-Protagonist, Nerd Kai, das erste Mal im Wald auf die rothaarige Hexe. Notiz an mich selbst: “Foto” ist nicht die richtige Wahl bei der Verbildlichung. LOL:

Aber mit den Zusätzen “Realistic Digital Art” oder “Realistic Painting” ging es schon überraschend gut:

Lex in seiner Speedball-Rüstung… krass
Die Pods von Dall-e sehen besser aus, als die, die ich im Kopf hatte…

Auf der Flucht über den Dächern…
Die Dagon… so friedlich erscheint sie da…
Gram
So stellt sich Dall-e 2 also Steampunk Dwarves with Chainsaw Swords vor

Faye auf Cass
Der Seelenspiegel…

Wie kann ICH Dall-E 2 nutzen?

Ihr könnt euch einfach auf https://labs.openai.com/ in die Warteliste eintragen. Bei mit flatterte schon nach drei Tagen ein Invite in mein Postfach und ich konnte loslegen.

Zu Beginn habt ihr 50 credits, mit der ihr die KI 50-mal euren Schwachsinn zeichnen lassen könnt. Glaubt mir, das macht total süchtig!

Danach bekommt ihr pro Monat 15 neue credits aufgeladen. Wenn euch das nicht reicht und ihr eine Kreditkarte zur Hand habt, könnt ihr euch auch einfach für 15 Dollar weitere 115 credits kaufen.

Wenn ich mir überlege, dass ich meinen nächsten Roman für 15 Dollar komplett bebildern lassen kann, ist das schon Wahnsinn. Und furchtbar für Künstler!

Was haltet ihr von dieser KI? Fluch oder Segen?

Vermutlich beides… no escape from Yin and Yang…

Über Thilo (1213 Artikel)
Hi, ich bin der Gründer dieses bekloppten Blogs. Außerdem Realitätsflüchter, Romantiker, Rollenspieler, Gamer, Fantasynerd, Kneipenphilosoph und hochstufiger Spinner. Manchmal jogge oder schwimme ich, doch meistens trinke ich Bier.