Inhaltsverzeichnis zu Was ist Stable Diffusion und wie funktioniert es?:
- Was ist Stable Diffusion?
- Schritt für Schritt Anleitung Stable Diffusion
- Vor- und Nachteile des AI-Bildgenerators Stable Diffusion
- Verwendung von Ki-generierten Inhalten
- Alternativen zu Stable Diffusion?
- Stable Diffusion vs. AI Midjourney
- Fazit
- FAQ
Was ist Stable Diffusion?
Stable Diffusion ist ein KI-Bildgenerator, der auf der Basis von Prompts, also Anweisungen in Textform, digitale Bilder generiert. Entwickelt wurde die Anwendung von Stability AI, einem in London basierten Start-up, das seit 2020 existiert.
An dem KI-Bildgenerator des Unternehmens haben Runway ML, EleutherAI, das deutsche Unternehmen LAION und eine Forschungsgruppe der LMU München mitgewirkt. Die erste Version des Tools kam im August 2022 heraus.
Es handelt sich um Open-Source-Software. Das bedeutet: Die Nutzer und Nutzerinnen können auf dem bestehenden Code aufbauen und ihn weiterentwickeln. Das Ganze fußt auf einem Deep Learning System, also auf einem tiefen neuronalen Netz aus mehreren Schichten, die es ermöglichen, komplexe Muster und Beziehungen in Datenmengen zu erkennen und zu "erlernen".
Bei diesem Tool kommen Bilderkennung und Spracherkennung zusammen: Die KI erkennt die Sprachbefehle, die Nutzer und Nutzerinnen eingeben, und sucht aus einer vorhandenen Bilddatenbank die Elemente heraus, die dazu passen.
Die KI wurde mit einer extrem hohen Zahl von Bildern trainiert, die jeweils mit einem passenden Begriff versehen und einem latenten Diffusionsmodellprozess unterzogen wurden. Unter Diffusion versteht man, dass von einem Muster ausgehend (Punkte oder Pixel) ein Bild entsteht, sowie das entsprechende Programm die festgelegten Aspekte des Bildes erkennt.
Die mehrere Millionen Bilder kamen aus dem LAION Aesthetics-Datensatz. Die KI kann ausschließlich auf bestehende Quellen zurückgreifen, um daraus "neue" Bilder zu generieren.
Schritt für Schritt Anleitung für Stable Diffusion
Stable Diffusion ist über verschiedene Wege zugänglich. Möglichkeit 1: Website von Stability AI öffnen und auf das Tool "Dream Studio" klicken. Möglichkeit 2: Über die Plattform Hugging Face Hub öffnen. Möglichkeit 3: Software auf das eigene Endgerät laden.
Schritt 1:
Öffne die Website von Stability AI.
Schritt 2:
Scrolle nach unten, bis du den Button "Dream Studio" siehst. Klicke darauf.
Schritt 3:
Suche auf der Seite, die sich daraufhin öffnet, nach dem Button "Get started" (kann auch als "Try me now" oder "Try for free" gekennzeichnet sein). Klicke darauf.
Schritt 4:
Registriere dich mit deiner E-Mail-Adresse in der Eingabemaske, die sich jetzt öffnen sollte.
Schritt 5:
Du erhältst eine Bestätigungsmail. Nutze den Link in der E-Mail, um auf die Front-End Applikation von Dream Studios zu gelangen.
Schritt 6:
Du siehst wieder eine Eingabemaske. Im ausgewiesenen Textfeld gibst du deinen Prompt, also den Textbefehl ein.
Wichtig zu wissen: Die Qualität des Prompts steht in einem direkten Zusammenhang mit der Qualität des Resultats. Je präziser du formulierst, desto exakter ist der Output, den du bekommst. Weil nicht jeder ein begnadeter Prompt Engineer ist, hat Stability AI einen Prompt-Guide veröffentlicht.
Die besten Ergebnisse erzielst du bei Stable Diffusion mit englischsprachigen Prompts. Das Tool kann zwar auch mit deutschen Anweisungen arbeiten. Aber es greift auf eine viel größere Datenbasis in englischer Sprache zurück. Die Prompts sollten so detailliert wie möglich ausfallen. Stichwörter werden besser verstanden als ausformulierte Sätze.
Hast du deinen Prompt eingegeben, stellt dir das Tool vier Bildvarianten zur Verfügung. Diese Varianten kannst du nutzen, um weiter damit zu arbeiten.
Vor- und Nachteile des AI-Bildgenerators Stable Diffusion
Zuerst einmal klingt es relativ einfach, mit diesem Tool brauchbare Bilder zu generieren. Und das ist es auch. Du solltest die englische Sprache halbwegs flüssig beherrschen und beschreiben können, was du von dem Tool erwartest. So kannst du dir kostenlos und mit einem überschaubaren Aufwand an Zeit Bildmaterial in ausreichender Auflösung generieren lassen.
Aber genau hier fangen auch die Probleme an: Das 3D Bildmaterial ist brauchbar, und die Auflösung ist gut. Es ist kein herausragendes Bildmaterial, und die Auflösung ist nicht hervorragend. Je spezifischer deine Ergebnisse werden sollen, desto aufwändiger wird es, das Material zu generieren. Ab einem gewissen Punkt ist der Zeitaufwand gar nicht mehr überschaubar.
Und dann bleibt immer noch das Problem, dass Stable Diffusion nur mit dem Bildmaterial arbeiten kann, mit dem die KI von LAION gefüttert wurde. Es ist also nicht möglich, etwas komplett Neues zu kreieren.
Die größten Vorteile sind die kostenlose Nutzung und die intuitive Bedienung des Tools.
Vorteile auf einem Blick:
- Einfache Bedienung
- Gute Auflösung (für die meisten Zwecke)
- Kostenlos verfügbar
Nachteile auf einem Blick:
- Kann zeitaufwendig sein
- Teilweise fehlerhafte Outputs
- Für einige Zwecke ist die Auflösung nicht hoch genug
- Rechtliche Bedenken
- Kann nur Bilder auf Grundlagen erstellen
Urheberrechten von Ki-generierten Inhalten
Wie sieht es mit den Urheberrechten und den Nutzungsrechten aus? Zuerst einmal variiert die Gesetzgebung in den verschiedenen Ländern, in denen das Tool zugänglich ist. Es gibt keine einheitliche Regelung.
Und dann ist insgesamt strittig, wem die Rechte an KI-generierten Inhalten gehören. Es gibt gute Argumente, dass die Urheberrechte bei denjenigen liegen, die die KI programmiert haben. Denn ohne diese Menschen könnten die Inhalte ja nicht geschaffen werden.
Aber ebenso logisch nachvollziehbar ist die Position, dass die Urheberrechte bei denjenigen liegen, die über die Eingabe maßgefertigter Prompts die KI dazu gebracht haben, genau diesen Inhalt zu erstellen. Diese Frage ist also nicht abschließend geklärt. Unklar ist auch, wer im Falle von problematischen Inhalten haftbar gemacht werden kann.
Anbetracht dessen ist es völlig verständlich, dass Unternehmen sehr zögern, KI-generierte Inhalte zu nutzen. Denn die Nutzungsrechte an künstlerischen und kreativen Inhalten kann nur derjenige vergeben, der das Urheberrecht hat. Und das ist, wie bereits erwähnt, nicht klar. Die geltenden Geschäftsbedingungen sollten auf jeden Fall gründlich überprüft werden, bevor Inhalte in welchem Umfang auch immer genutzt werden.
Alternativen zu Stable Diffusion?
Es gibt in der Tat einige KI-Bildgeneratoren, die du alternativ ausprobieren kannst. Artbreeder ist einer davon, DeepAI und DALL-E sind weitere Möglichkeiten. Auch Craiyon, NightCafe und Visionist eignen sich mehr oder weniger gut, um Bildmaterial zu generieren. Der vermutlich bekannteste Vertreter unter den KI-Bildgeneratoren ist allerdings AI Midjourney.
Stable Diffusion vs. AI Midjourney
Der erste auffällige Punkt ist: Stable Diffusion ist kostenlos nutzbar und die Auflösung ist gut genug im Vergleich mit AI Midjourney (höher als bei DALL-E). Geschwindigkeit und Umsetzung der Prompts sind zufriedenstellend, die Bildqualität ist vergleichbar.
Augenfällig ist jedoch, dass du über Dream Studio direkt Zugriff auf die Eingabemaske und die Ergebnisse des KI-Tools von Stability AI hast. AI Midjourney wird aktuell (Sommer 2023) noch über Discord genutzt. Discord muss installiert werden, du benötigst ein Nutzerkonto, oft genug ist die Datenübertragung überlastet. Dann wartest du auch bei relativ einfachen Aufgaben sehr lange auf die Bearbeitung deiner Prompts, was ärgerlich ist.
Der zweite Punkt ist die Privatsphäre. Bei AI Midjourney gehört dir der generierte Bildinhalt nicht. AI Midjourney behält sich vor, deine erstellten Materialien als Beispiel in der Galerie zu zeigen. Damit sind die 3D Bilder allen Interessierten zugänglich, die damit auch weiterarbeiten können. Willst du mehr als nur eine Handvoll Bilder generieren und die auch noch kommerziell nutzen, kommst du nicht um ein Abo herum. Auch Privatsphäre kostet.
Fazit
Bilder per KI generieren ist in den letzten Jahren sehr viel einfacher geworden. Die Technologie macht enorme Fortschritte. De facto ist die Entwicklung der Tools der Meinungsbildung in der Gesellschaft voraus - wir wissen heute einfach nicht, wie wir rechtlich und moralisch mit diesem Bildmaterial umgehen sollen.
Das Bildmaterial wird nicht kuratiert, weshalb es auch zu anstößigem Material kommen kann. Einzigartiges Bildmaterial, das auf deine Anwendung zugeschnitten ist, darfst du hier nicht erwarten.
Du darfst nicht einmal fehlerfreies Bildmaterial erwarten, denn Pferde mit fünf Beinen und ähnliche Fehlleistungen kommen immer wieder vor. Diversität in Sachen Hautfarben, Nationalitäten, Sprachen etc. darfst du auch nicht erwarten, hier kommt die algorithmic bias ins Spiel.
Reicht dir das Ergebnis trotzdem aus, spricht nichts gegen die Verwendung von Stable Diffusion oder einem vergleichbaren Tool.
KI-Bildgeneratoren werden nicht wieder verschwinden, sondern ihren Platz in den kreativen Branchen finden und halten. Es ist also an der Zeit, sich mit ihnen zu befassen - technisch, unter ethnischen Gesichtspunkten, aus Anwendersicht und in rechtlicher Hinsicht.
Wenn du jedoch komplett neue Bilder erstellen möchtest, zum Beispiel Produktbilder für dein Marketing, ist Stable Diffusion nicht die richtige Wahl. In diesem Fall können wir jedoch weiterhelfen: Unsere CGI Agentur Danthree Studio kann dir Produktvisualisierungen und Animationen von Home & Living Artikeln, Innenräumen und Möbeln erstellen, die vollkommen einzigartig und rechtlich unbedenklich sind. Kontaktiere uns für ein kostenloses Erstgespräch!