Inhaltsverzeichnis zu Was ist Stable Diffusion und wie funktioniert es?:
- Was ist Stable Diffusion?
- Schritt für Schritt Anleitung Stable Diffusion
- Vor- und Nachteile des AI-Bildgenerators Stable Diffusion
- Urheberrechte von KI-generierten Inhalten
- Alternativen zu Stable Diffusion?
- Stable Diffusion vs. AI Midjourney
- Fazit
- FAQ
Was ist Stable Diffusion?
Stable Diffusion ist ein KI-Bildgenerator, der auf der Basis von Prompts, also Anweisungen in Textform, digitale Bilder generiert. Entwickelt wurde die Anwendung von Stability AI, einem in London basierten Start-up, das seit 2020 existiert.
An dem KI-Bildgenerator des Unternehmens haben Runway ML, EleutherAI, das deutsche Unternehmen LAION und eine Forschungsgruppe der LMU München mitgewirkt. Die erste Version des Tools kam im August 2022 heraus.
Es handelt sich um eine Open-Source-Software. Das bedeutet: Die Nutzer und Nutzerinnen können auf dem bestehenden Code aufbauen und ihn weiterentwickeln. Das Ganze fußt auf einem Deep Learning System, also auf einem tiefen neuronalen Netz aus mehreren Schichten, die es ermöglichen, komplexe Muster und Beziehungen in Datenmengen zu erkennen und zu "erlernen".
Bei diesem Tool kommen Bilderkennung und Spracherkennung zusammen: Die KI erkennt die Sprachbefehle, die Nutzer und Nutzerinnen eingeben, und sucht aus einer vorhandenen Bilddatenbank die Elemente heraus, die dazu passen.
Die KI wurde mit einer extrem hohen Zahl von Bildern trainiert, die jeweils mit einem passenden Begriff versehen und einem latenten Diffusionsmodellprozess unterzogen wurden. Unter Diffusion versteht man, dass von einem Muster ausgehend (Punkte oder Pixel) ein Bild entsteht, sowie das entsprechende Programm die festgelegten Aspekte des Bildes erkennt.
Die KI erstellt also "neue" Bilder basierend auf Millionen von bekannten Bildern, mit denen das Tool gefüttert wird.
Verschiedene Modelle von Stable Diffusion 3.5
Die neueste Version von Stable Diffusion, Stable Diffusion 3.5, bietet Nutzern drei verschiedene Modelle an:
- Stable Diffusion 3.5 Large: 3.5 Large ist das Basismodell der neusten Stable Diffusion Version und erstellt Bilder mit hochwertiger Auflösung und einer Größe von einem Megapixel.
- Stable Diffusion 3.5 Large Turbo: Dieses Modell zeichnet sich mit schnellen Geschwindigkeiten aus und eignet sich am besten, wenn du Bilder in kurzer Zeit generieren willst. Es ist schneller als das Large-Modell, aber könnte an Qualität verlieren.
- Stable Diffusion 3.5 Medium: Das Mittelmaß zwischen schneller Umsetzung und qualitativen Ergebnissen findest du im Medium Modell.
Schritt-für-Schritt-Anleitung für Stable Diffusion
Wie kann ich auf Stable Diffusion zugreifen?
Stable Diffusion ist über verschiedene Wege zugänglich. Du kannst das Tool folgendermaßen aufrufen:
- Dream Studio: DreamStudio von Stability AI basiert auf Stable Diffusion und kann als Bildgenerierungstool benutzt werden. So kannst du einfach auf Stable Diffusion zugreifen, ohne die Software installieren oder mit einem Drittanbieter verbinden zu müssen. Die ersten 100 Credits sind kostenlos.
- Hugging Face Hub: Des Weiteren kannst du Stable Diffusion auch über Hugging Face kostenlos nutzen.
- Andere Drittanbieter: Es gibt auch noch weitere Drittanbieter, wie Feuerwerk-KI, DeepInfra, Stabilitäts-KI-API, die einen Zugang zu Stable Diffusion anbieten.
- API-basierte Nutzung: Wenn du dich mit Programmieren auskennst, kannst du die Stable Diffusion API mit einer Software oder einem Webservice verbinden, um das Bildgenerierungstool zu nutzen.
- Eigene Installation: Alternativ kannst du die Software auch von GitHub herunterladen und auf deinem Gerät installieren.
Wie funktioniert Stable Diffusion?
Wie du siehst, gibt es mehrere Möglichkeiten, Bilder mit Stable Diffusion zu generieren. Für diese Anleitung zeigen wir dir wie Stable Diffusion mit DreamStudio funktioniert.
Schritt 1:
Öffne Dream Studio.
Schritt 2:
Klicke auf "Try Dream Studio Beta".
Dream Studio StartseiteSchritt 3:
Registriere dich mit deiner E-Mail-Adresse. Anschließend erhältst du automatisch 100 kostenlose Credits. Wenn du möchtest, kannst du für eine monatliche Gebühr aber auch ein Abo abschließen, um mehr Bilder zu generieren.
Abo-Modelle von Dream StudioSchritt 4:
Nach der Registrierung deiner E-Mail-Adresse kannst du anfangen, Bilder zu generieren. Im ausgewiesenen Textfeld gibst du deinen Prompt, also den Textbefehl ein. Darunter kannst du auch angeben, wie viele Bilder generiert werden sollen und in welchen Maßen.
Texteingabe Schritt 5:
Wichtig zu wissen: Die Qualität des Prompts steht in einem direkten Zusammenhang mit der Qualität des Resultats. Je präziser du formulierst, desto exakter ist der Output, den du bekommst. Weil nicht jeder ein begnadeter Prompt Engineer ist, hat Stability AI einen Prompt-Guide veröffentlicht.
Wenn du Stable Diffusion über Dream Studio benutzt, solltest du zudem englischsprachige Prompts benutzen. Die Prompts sollten so detailliert wie möglich ausfallen. Stichwörter werden allerdings besser verstanden als ausformulierte Sätze.
Hast du deinen Prompt eingegeben, stellt dir das Tool vier Bildvarianten zur Verfügung. Diese Varianten kannst du nutzen, um weiter damit zu arbeiten.
Ergebnisse von Stable Diffusion
KI generiertes Bild von Danthree Studio
Vor- und Nachteile des AI-Bildgenerators Stable Diffusion
Zuerst einmal klingt es relativ einfach, mit diesem Tool brauchbare Bilder zu generieren. Und das ist es auch. Du solltest die englische Sprache halbwegs flüssig beherrschen und beschreiben können, was du von dem Tool erwartest. So kannst du dir kostenlos und mit einem überschaubaren Aufwand an Zeit Bildmaterial in ausreichender Auflösung generieren lassen.
Aber genau hier fangen auch die Probleme an: Das 3D Bildmaterial ist brauchbar, und die Auflösung ist gut. Es ist kein herausragendes Bildmaterial, und die Auflösung ist nicht hervorragend. Je spezifischer deine Ergebnisse werden sollen, desto aufwändiger wird es, das Material zu generieren. Ab einem gewissen Punkt ist der Zeitaufwand gar nicht mehr überschaubar.
Und dann bleibt immer noch das Problem, dass Stable Diffusion nur mit dem Bildmaterial arbeiten kann, mit dem die KI gefüttert wurde. Es ist also nicht möglich, etwas komplett Neues zu kreieren.
Die größten Vorteile sind die kostenlose Nutzung und die intuitive Bedienung des Tools.
Vorteile auf einem Blick:
- Einfache Bedienung
- Gute Auflösung (für die meisten Zwecke)
- Kostenlos verfügbar
Nachteile auf einem Blick:
- Kann zeitaufwendig sein
- Teilweise fehlerhafte Outputs
- Für einige Zwecke ist die Auflösung nicht hoch genug
- Rechtliche Bedenken
- Kann nur Bilder auf Grundlagen erstellen
Urheberrechte von KI-generierten Inhalten
Wie sieht es mit den Urheberrechten und den Nutzungsrechten aus? Zuerst einmal variiert die Gesetzgebung in den verschiedenen Ländern, in denen das Tool zugänglich ist. Es gibt keine einheitliche Regelung. In Deutschland heißt es momentan, dass du kein Urheberrecht hast, wenn du ausschließlich KI benutzt, um ein Ergebnis zu generieren.
Anbetracht dessen ist es völlig verständlich, dass Unternehmen sehr zögern, KI-generierte Inhalte zu nutzen. Denn die Nutzungsrechte an künstlerischen und kreativen Inhalten kann nur derjenige vergeben, der das Urheberrecht hat.
Und das ist, wie bereits erwähnt, momentan nicht so. Allerdings bieten einige KI-Tools Lizenzberechtigungen für die kommerzielle Nutzung an. Ob dies wirklich rechtens ist, ist jedoch auch unklar. Problematisch wird es, wenn die KI Bilder generiert, die zu sehr an bestehende Inhalte erinnern. In diesem Fall könnte es zu einem Urheberrechtsstreit kommen.
Um rechte Probleme zu vermeiden, raten wir dir, die Ergebnisse noch einmal manuell zu bearbeiten und die Bilder nicht genauso zu verwenden, wie die KI sie ausspuckt. Die Bearbeitung könnte natürlich etwas mehr Aufwand erfordern und ist nicht ganz so einfach. Unsere CGI-Agentur kann dir aber gerne dabei helfen!
Alternativen zu Stable Diffusion
Es gibt in der Tat einige KI-Bildgeneratoren, die du alternativ ausprobieren kannst. Artbreeder ist einer davon, DeepAI und DALL-E sind weitere Möglichkeiten. Auch Craiyon, NightCafe und Visionist eignen sich mehr oder weniger gut, um Bildmaterial zu generieren. Der vermutlich bekannteste Vertreter unter den KI-Bildgeneratoren ist allerdings AI Midjourney.
Stable Diffusion vs. AI Midjourney
Der erste auffällige Punkt ist: Stable Diffusion ist kostenlos nutzbar, was bei Midjourney AI v.61 nicht der Fall ist. Für Midjourney musst du nämlich ein monatliches Abo abschließen, das je nach Umfang 8 bis 120 USD kostet.
Dafür überzeugt Midjourney AI mit einer einfachen Handhabung und einer qualitativ hochwertigen Auflösung. Während Midjourney automatisch auf detaillierte Texturen, Beleuchtung und weitere Details setzt, sind bei Stable Diffusion genauere Prompts nötig, um eine vergleichbare Auflösung zu erhalten. Dafür hast du mit Stable Diffusion hingegen mehr Kontrolle über den Generierungsprozess und kannst zwischen verschiedenen Modi wählen.
Ein weiterer wichtiger Punkt ist Privatsphäre. Bei AI Midjourney gehört dir der generierte Bildinhalt nicht. AI Midjourney behält sich vor, deine erstellten Materialien als Beispiel in der Galerie zu zeigen. Damit sind die 3D Bilder allen Interessierten zugänglich, die damit auch weiterarbeiten können. Willst du mehr als nur eine Handvoll Bilder generieren und die auch noch kommerziell nutzen, kommst du um eines der teureren Abos nicht herum. Auch Privatsphäre kostet.
Fazit
Bilder per KI generieren ist in den letzten Jahren sehr viel einfacher geworden. Die Technologie macht enorme Fortschritte. De facto ist die Entwicklung der Tools der Meinungsbildung in der Gesellschaft voraus - wir wissen heute einfach nicht, wie wir rechtlich und moralisch mit diesem Bildmaterial umgehen sollen.
Das Bildmaterial wird nicht kuratiert, weshalb es auch zu anstößigem Material kommen kann. Einzigartiges Bildmaterial, das auf deine Anwendung zugeschnitten ist, darfst du hier nicht erwarten.
Du darfst nicht einmal fehlerfreies Bildmaterial erwarten, denn Pferde mit fünf Beinen und ähnliche Fehlleistungen kommen immer wieder vor. Auch die Diversität in Sachen Hautfarben, Nationalitäten, Sprachen etc. lässt zu wünschen übrig, hier kommt die algorithmic bias ins Spiel.
Reicht dir das Ergebnis trotzdem aus, spricht nichts gegen die Verwendung von Stable Diffusion oder einem vergleichbaren Tool.
KI-Bildgeneratoren werden nicht wieder verschwinden, sondern ihren Platz in den kreativen Branchen finden und halten. Selbstverständlich erkennen auch die Programmierer der KI-Tools die derzeitigen Probleme und arbeiten daran, die Ergebnisse zu verbessern. Es ist also an der Zeit, sich mit KI-Tools zu befassen - technisch, unter ethnischen Gesichtspunkten, aus Anwendersicht und in rechtlicher Hinsicht.
Wenn du jedoch komplett neue Bilder erstellen möchtest, zum Beispiel Produktbilder für dein Marketing, ist Stable Diffusion nicht die richtige Wahl. In diesem Fall können wir jedoch weiterhelfen: Unsere CGI Agentur Danthree Studio kann dir Produktvisualisierungen und Animationen von Home & Living Artikeln, Innenräumen und Möbeln erstellen, die vollkommen einzigartig und rechtlich unbedenklich sind. Kontaktiere uns für ein kostenloses Erstgespräch!