Bilder einfacher erzeugen mit einem Bild-KI-Generator (Screenshot)

Praxis: Malen nach Zahlen – Benutzeroberflächen für generative KI-Modelle

Der große Hype um bildgenerierende KI-Modelle ist abgeflaut, die Zeiten, in denen die sozialen Medien mit „beeindruckenden“ Bildchen geflutet wurden, sind vorbei. Das liegt vermutlich daran, dass es nicht so ganz einfach ist, Midjourney, DALL-E und Stable Diffusion genau die grafischen Werke zu entlocken, die man im Kopf hat. Mit „Male mir das Bild von einem riesigen Einhorn auf dem Münchner Stachus“ kommt man eben nicht wirklich weit. Besonders die Bedienung von Midjourney erfordert schon fast ein Hochschulstudium, und Stable Diffusion bietet dermaßen viele Parameter, dass man verzweifeln möchte. Hilfe naht, denn inzwischen hat sich eine Auswahl an Benutzeroberfläche für die Bild-KI-Modelle gebildet, die auch Lise und Otto Normaluser:in in die Lage versetzt, ihre Vorstellungen in vorzeigbare Bilder zu übersetzen. Wir haben uns ein paar dieser Helfer für Stable Diffusion angeschaut.

Die Idee hinter diesen, nennen wir sie: Generatoren, ist es, die Bandwurmsätze, mit denen man in den KI-Modellen beschreibt, was erzeugt werden soll, durch Einstellen diverser Parameter zu unterstützen; und das im Rahmen einer anwenderfreundlichen Oberfläche. Wie benutzerfreundlich die Oberflächen sind, unterscheidet sich allerdings stark – die Palette reicht von ein bisschen Unterstützung beim Prompten bis hin zu Einstellelementen für fast alles.

DreamStudio – das Ding von den Stable-Diffusion-Machern

Auch beim Dream Studio kommt man um das Prompten nicht herum, muss also in Textform angeben, was das gewünschte Bild zeigen soll. In der Regel beschreibt man den Bildgegenstand. Das kann eine Person sein, ein Tier, ein Fabelwesen oder ein Ding oder jeweils mehrere davon. Außerdem sollte man die Umgebung beschreiben. Das alles in englischer Sprache.

DreamStudio: Bilder generieren und manipulieren (Screenshot)
DreamStudio: Bilder generieren und manipulieren (Screenshot)

Insgesamt 16 Stile werden angeboten, darunter der beliebte Comic-Stil. Außerdem kann das Seitenverhältnis des erzeugten Bildes eingestellt werden. Spannend wird es bei der Möglichkeit, Bilder hochzuladen und von DreamStudio transformieren zu lassen. Das alles funktioniert nicht immer ganz intuitiv, erzeugt aber erstaunliche Ergebnisse.

NightCafe – etwas für Künstler:innen

NightCafe bietet die Möglichkeit, eines von verschiedenen KI-Modellen zu wählen – und die Ergebnisse zu vergleichen. Die Unterschiede sind erstaunlich. Je nach dem gewählten Stil entstehen ausgesprochen künstlerische Bilder. Mehr geht aber in der kostenlosen Version auch nicht. Im Abo kann man mit NightCafe eigene Stile kreieren, die aus einer Sammlung verschiedener Parameter bestehen.

NightCafe: Bildideen künstlerisch umsetzen (Screenshot)
NightCafe: Bildideen künstlerisch umsetzen (Screenshot)

NightCafe versteht sich auch als Community. Man kann eigene Kreationen veröffentlichen und bewerten lassen. Außerdem gibt es „Challenges“ genannte Wettbewerbe. Die App ist im Prinzip kostenlos, intern wird mit Credits bezahlt. Eigene Bilder zu erzeugen, kostet Credits. Durch Veröffentlichungen und die Teilnahme an Challenges kann man Credits erwerben.

Rendernet – macht was aus Vorlagen

Hier kann man wählen, ob die Bilder mit dem SD-1.5- oder dem aktuellen SDLX-Modell erzeugt werden sollen. Auch Rendernet arbeitet mit Credits, kostenlos kann man nur eine sehr begrenzte Anzahl Bilder generieren. Schön ist der sogenannte „Prompt Generator“, mit dem Menschen anhand von sechs Kriterien beschrieben sowie der Hintergrund und der Stil ausgewählt werden. Die Ergebnisse sind erstaunlich.

Rendernet kann auch Vorlagen verwenden (Screenshot)
Rendernet kann auch Vorlagen verwenden (Screenshot)

Von den getestete Oberflächen erlaubt Rendernet die Bearbeitung und Transformation hochgeladener Fotos. So lassen sich aus Bildern die beliebten Abbildungen im Comic-Stil machen. Die Bedienelemente sind ein wenig merkwürdig gruppiert und angeordnet, aber daran gewöhnt man sich.

DeepAI – die Vielfalt der Stile

Das große Plus des Generators von DeepAI ist die unglaublich große Menge an Stilen, zwischen denen man wählen kann. Die Palette reicht von den üblichen Comic- und Zeichnungs-Stile bis hin zu Stilen, die Bilder im Stil alter Meister oder im Steam-Punk-Stil erzeugen. Viel mehr lässt sich nicht einstellen.

DeepAI bietet ausgefeilte Stilvorlagen (Screenshot)
DeepAI bietet ausgefeilte Stilvorlagen (Screenshot)

Das Besondere an diesem Generator: Mit ihm kann man Animationen erzeugen – allerdings handelt es sich dabei um die Ergebnisse einer Alpha-Version. Weil es so wenig einzustellen gibt, erweist sich die Bedienung als ausgesprochen intuitiv.

Perchance – der Übersichtliche

Beim „AI Photo Generator“ ist alles ganz einfach. Die schmucklose Website bietet ein Feld für den Prompt an sowie mehrere Dropdown-Listen für die Einstellungen. Schön ist, dass sich der Kamerawinkel auswählen lässt und mehrere Perspektiven angeboten werden. Außerdem kann die Farbstimmung und ein Effekt, wie man ihn von Malprogrammen her kennt, eingestellt werden.

Der AI-Photo-Generator von Perchance hat die mit Abstand simpelste Oberfläche (Screenshot)
Der AI-Photo-Generator von Perchance hat die mit Abstand simpelste Oberfläche (Screenshot)

Wie üblich kann einer von vielen Stilen auf das durch den Prompt erzeugte Bild angewendet werden. Alles ganz einfach, alles sehr schnell, und die Ergebnisse können überzeugen. Und: Dieser Generator ist vollkommen kostenlos.

Fazit

So richtig erfüllen die vier getesteten KI-Bild-Generatoren die Erwartungen nicht, denn am Prompt kommt man immer noch nicht vorbei. Das ist aber auch sinnvoll, weil sich die Fülle der Möglichkeiten, ein gewünschtes Bild zu beschreiben, nicht in einer Handvoll Kriterien fassen lässt. Dafür aber unterstützen die getesteten Anwendungen die Auswahl der Stile und diverser anderer Kriterien. Gefallen hat uns der AI-Generator von Perchance wegen seiner einfachen Bedienbarkeit. Rendernet konnte vor allem mit seinen Ergebnissen punkten.

Aber der beste Generator hilft nicht weiter, wenn man nicht formulieren kann, was das gewünschte Bild zeigen soll. Tipp: Am besten, man beschränkt sich auf die Beschreibung des eigentlichen Bildgegenstands sowie der Umgebung. Bei allen Modellen und den verschiedenen Generatoren kann der ursprüngliche Prompt jederzeit bearbeitet und/oder erweitert werden. So kann man sich an das Bild, das man im Kopf hat, herantasten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert