DALL-E zeichnet drei niedliche Digisaurier (erstellt mit DALL-E per Bing)

Praxis: Beeindruckende Bilder – DALL-E über Bing nutzen

Die Begeisterung von Otto und Lise Normaluserin über die beeindruckenden Bilder, die man mit bildschaffenden KI-Modellen wie Stable Diffusion, DALL-E oder Midjourney erzeugen kann, ist ein bisschen abgeflaut. Das mag daran liegen, dass Anfang 2023 Millionen solcher Bildchen die sozialen Medien überschwemmte, aber auch daran, dass die Betreiber der zugehörigen Plattformen die kostenlose Nutzung ihrer Modelle stark eingeschränkt haben. Jetzt aber ist DALL-E sowohl in ChatGPT als auch in Microsoft Bing integriert. Und während die Nutzung nur in den kostenpflichtigen Versionen von ChatGPT möglich ist, können wir Digisaurier fröhlich und gratis mit dem Bing Image Creator beeindruckende KI-Bilder erschaffen.

Übrigens sind alle Bing-KI-Funktionen auch über den sogenannten „Copilot“ zu erreichen. Während Texte und Antworten auf Fragen und Anweisungen in Normalsprache auf Basis von ChatGPT-4 und den Ergebnissen von microsoft-eigenen Bots erzeugt werden, müssen Prompts für Bilder mit Formulierungen wie „male ein Bild“ beginnen, damit die DALL-E-Funktionen angewendet werden.

Es ist sogar möglich, ein Prompt, das nach einer Textauskunft fragt, mit einer Visualisierung versehen zu lassen; dann muss im Prompt eine Formulierung „wie sieht es aus“ oder ähnlich vorkommen. Dann wird Bing eine passende Abbildung liefern.

Erstelle ein Bild von einem Tyrannosaurus Rex zusammengesetzt aus bunten quadratischen Pixeln (erstellt mit DALL-E per Bing)
Erstelle ein Bild von einem Tyrannosaurus Rex zusammengesetzt aus bunten quadratischen Pixeln (erstellt mit DALL-E per Bing)

Wie bekannt, sind die passenden Formulierungen im sogenannten Prompt das A und O auf dem Weg zum gewünschten Ergebnis. In der Regel kann man mit einer Beschreibung der Lebewesen und der Gegenstände beginnen, die im Bild enthalten sein sollen – zum Beispiel „Erstelle das Bild eines Tyrannosaurus Rex“. Dann kann man Genaueres um die Umgebung, den Ort oder den Raum sagen: „in einem Aquarium“ oder „am Rheinufer“ oder „auf dem Mars“.

So sieht DALL-E in Bing aus (Screenshot)
So sieht DALL-E in Bing aus (Screenshot)

Diese Beschreibung lässt sich mit äußerst komplexen Details ergänzen wie „ein Mensch im Dinosaurierkostüm“ oder „im Inneren eines Computers“. Angaben zur Tätigkeit der Hauptfigur(en) sind möglich: wandern, gehen, fliegen, liegen, springen etc.

Erstelle ein Bild im Stil von Salvador Dali, auf dem ein Mensch im Dinosaurierkostüm durch das Innere eines Computers wandert (Erstellt mit DALL-E per Bing)
Erstelle ein Bild im Stil von Salvador Dali, auf dem ein Mensch im Dinosaurierkostüm durch das Innere eines Computers wandert (Erstellt mit DALL-E per Bing)

Adjektive, die die Stimmung auf dem Bild kennzeichnen, sind möglich: traurig, düster, fröhlich, still, wild, gefährlich und so weiter. Überhaupt ist der optimale Weg, sich ein Bild im Kopf auszudenken und dann zu versuchen, es so genau wie möglich zu beschreiben. Übrigens: Wer versucht, die kostenlose ChatGPT-Version ein Bild malen zu lassen, bekommt als Antwort auf den Prompt eine sehr ausführliche, sehr inspirierte Bildbeschreibung.

Erstelle ein Bild von hunderten Menschen in Dinosaurierkostümen, die am Rheinufer bei Düsseldorf stehen (erstellt mit DALL-E per Bing)
Erstelle ein Bild von hunderten Menschen in Dinosaurierkostümen, die am Rheinufer bei Düsseldorf stehen (erstellt mit DALL-E per Bing)

Wichtig ist mitzuteilen, ob das Bild farbig oder schwarzweiß sein soll. Auch diese Angabe lässt sich spezifizieren: grellbunt, pastellfarbig, in Graustufen, sepia-farbig. Den Blickwinkel kann man definieren: von oben, zentralperspektivisch, auf Augenhöhe und so weiter.

Erstelle ein Bild vom Inneren eines echten Computers in dem niedliche Roboter spielen (erstellt mit DALL-E per Bing)
Erstelle ein Bild vom Inneren eines echten Computers in dem niedliche Roboter spielen (erstellt mit DALL-E per Bing)

Das alles muss man auch nicht auf Anhieb formulieren. Ist man im Bing-Chat, kann man die Arbeit an einem Bild schrittweise ergänzen – zum Beispiel mit der Formulierung: „Dasselbe in Schwarzweiß“ oder „bitte von oben gesehen“ oder so.

Erstelle das fotorealistische Bild eines Windhundes in der Größe von Godzilla, der durch eine Großstadt spaziert mit einer Menschenmenge und Autos im Vordergrund  (erstellt mit DALL-E per Bing)
Erstelle das fotorealistische Bild eines Windhundes in der Größe von Godzilla, der durch eine Großstadt spaziert mit einer Menschenmenge und Autos im Vordergrund (erstellt mit DALL-E per Bing)

DALL-E produziert jeweils vier Versionen des angeforderten Bildes, die man im Image Creator einzeln betrachten und herunterladen kann. In der kostenlosen Version werden die Grafiken immer im Format 1024 mal 1024 Pixel erstellt. Quer- oder Hochformate lassen sich durch einen Trick erzeugen; man fordert DALL-E auf, je einen schwarzen Balken an den jeweiligen Seiten einzufügen, sodass man den gewünschten Teil später einfach ausschneiden kann.

Fazit

Zugegeben: Mit DALL-E über Bing kann man eine Menge Spaß haben und die persönliche Bildbibliothek aufblähen. Ja, es gibt Menschen, die haben das Generieren von Bildern per KI zu ihrem Hobby gemacht. Die greifen dann aber auch zu den kostenpflichtigen Versionen, die sehr viel mehr Möglichkeiten bieten, auch in grafiktechnischer Hinsicht.

Ganz praktisch aber lässt sich diese bildgenerierende KI nutzen, um sich schicke Profilfotos und Titelbilder für die persönlichen Social-Media-Accounts zu erzeugen. Eine ebenfalls spannende Anwendung ist das Erstellen von illustrierenden Grafiken, die man in Textdokumenten und auf Websites verwenden kann. So baut DALL-E ziemlich tolle Visualisierungen der Blockchain – professionell erstellte Grafiken zum Download kosten Geld.

Mit dem kostenlosen DALL-E herumzuspielen kann eine Menge Zeit kosten, aber auch jede Menge Spaß machen. Digisaurier probieren so etwas aus.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert