Innehållsförteckning för Vad är stabil diffusion och hur fungerar det?..:
- Vad är stabil diffusion?
- Steg för steg-guide Stabil diffusion
- Fördelar och nackdelar med AI-bildgeneratorn Stable Diffusion
- Användning av Ki-genererat innehåll
- Alternativ till stabil diffusion?
- Stabil Diffusion vs. AI Midjourney
- Slutsats
- VANLIGA FRÅGOR
Vad är stabil diffusion?
Stable Diffusion är en AI-bildgenerator som genererar digitala bilder baserat på prompts, dvs. instruktioner i textform. Applikationen har utvecklats av Stability AI, ett Londonbaserat startup-bolag som har funnits sedan 2020.
Runway ML, EleutherAI, det tyska företaget LAION och en forskargrupp från LMU München bidrog till företagets AI-bildgenerator. Den första versionen av verktyget lanserades i augusti 2022.
Det är en programvara med öppen källkod. Det innebär att användare kan bygga vidare på den befintliga koden och utveckla den ytterligare. Det hela bygger på ett djupinlärningssystem, dvs. ett djupt neuralt nätverk som består av flera lager som gör det möjligt att känna igen och "lära sig" komplexa mönster och relationer i datamängder.
Detta verktyg kombinerar bildigenkänning och taligenkänning: AI:n känner igen de röstkommandon som användarna anger och väljer ut matchande element från en befintlig bilddatabas.
AI:n tränades med ett mycket stort antal bilder, som var och en märktes med en lämplig term och genomgick en process med en latent diffusionsmodell. Diffusion innebär att en bild skapas av ett mönster (prickar eller pixlar) och att motsvarande program känner igen de definierade aspekterna av bilden.
De flera miljoner bilderna kommer från LAION Aesthetics dataset. AI:n kan bara använda befintliga källor för att generera "nya" bilder.
Steg-för-steg-guide för stabil diffusion
Stable Diffusion kan nås på flera sätt. Alternativ 1: Öppna Stability AI:s webbplats och klicka på verktyget "Dream Studio". Alternativ 2: Öppna Hugging Face Hub via plattformen. Alternativ 3: Ladda ner programvaran till din egen enhet.
Steg 1:
Öppna webbplatsen Stability AI.
Steg 2:
Scrolla ner tills du ser knappen "Dream Studio". Klicka på den.
Steg 3:
På sidan som öppnas letar du efter knappen "Kom igång" (kan också vara markerad som "Prova mig nu" eller "Prova gratis"). Klicka på den.
Steg 4:
Registrera dig med din e-postadress i den inmatningsmask som nu öppnas.
Steg 5:
Du kommer att få ett bekräftelsemeddelande. Använd länken i e-postmeddelandet för att komma åt Dream Studios front-end-applikation.
Steg 6:
Du kommer att se en annan inmatningsskärm. Skriv in din prompt, dvs. textkommandot, i det textfält som visas.
Viktigt att veta: Frågans kvalitet är direkt relaterad till resultatets kvalitet. Ju mer exakt du formulerar dig, desto mer exakt blir resultatet. Eftersom alla inte är begåvade prompt-ingenjörer har Stability AI publicerat en prompt-guide.
Du får bäst resultat med Stable Diffusion om du använder engelska anvisningar. Verktyget kan också fungera med tyska instruktioner. Men det bygger på en mycket större databas på engelska. Anvisningarna bör vara så detaljerade som möjligt. Nyckelord förstås bättre än fullständigt formulerade meningar.
När du har angett din uppmaning ger verktyget dig fyra bildvarianter. Du kan använda dessa varianter för att fortsätta arbeta med det.
Fördelar och nackdelar med AI-bildgeneratorn Stable Diffusion
Först och främst låter det relativt enkelt att skapa användbara bilder med det här verktyget. Och det är det också. Du bör behärska engelska någorlunda väl och kunna beskriva vad du förväntar dig av verktyget. På så sätt kan du skapa bildmaterial i tillräcklig upplösning gratis och med en hanterbar tidsåtgång.
Men det är här problemen börjar: 3D-materialet är användbart och upplösningen är bra. Det är inte ett enastående bildmaterial och upplösningen är inte utmärkt. Ju mer specifika resultat man vill ha, desto mer tidskrävande blir det att generera materialet. Vid en viss punkt är tidsåtgången inte längre hanterbar.
Och så finns det fortfarande problemet med att Stable Diffusion bara kan arbeta med det bildmaterial som matades in i LAION AI. Det är därför inte möjligt att skapa något helt nytt.
De största fördelarna är att verktyget är gratis att använda och intuitivt att använda.
Fördelar vid en överblick:
- Enkel användning
- Bra upplösning (för de flesta användningsområden)
- Tillgänglig kostnadsfritt
Nackdelar vid en överblick:
- Kan vara tidskrävande
- Delvis felaktiga utgångar
- Upplösningen är inte tillräckligt hög för vissa ändamål
- Juridiska frågor
- Kan bara skapa bilder på grunderna
Upphovsrätt för Ki-genererat innehåll
Hur är det med upphovsrätt och användningsrättigheter? Först och främst varierar lagstiftningen i de olika länder där verktyget finns tillgängligt. Det finns ingen standardiserad reglering.
Och sedan är det i allmänhet omtvistat vem som äger rättigheterna till AI-genererat innehåll. Det finns goda argument för att upphovsrätten tillhör dem som har programmerat AI:n. Innehållet skulle trots allt inte kunna skapas utan dessa personer.
Det är dock lika logiskt att anta att upphovsrätten tillhör dem som har fått AI att skapa just detta innehåll genom att ange anpassade uppmaningar. Denna fråga är därför inte slutgiltigt avgjord. Det är också oklart vem som kan hållas ansvarig vid problematiskt innehåll.
Med tanke på detta är det helt förståeligt att företag är mycket tveksamma till att använda AI-genererat innehåll. Rättigheterna att använda konstnärligt och kreativt innehåll kan ju bara beviljas av den som har upphovsrätten. Och det är, som redan nämnts, inte självklart. I vilket fall som helst bör de tillämpliga villkoren kontrolleras noggrant innan innehållet används i någon utsträckning.
Alternativ till stabil diffusion?
Det finns faktiskt några AI-bildgeneratorer som du kan prova som ett alternativ. Artbreeder är en av dem, DeepAI och DALL-E är andra möjligheter. Craiyon, NightCafe och Visionist är också mer eller mindre lämpliga för att generera bildmaterial. AI Midjourney är dock förmodligen den mest kända representanten bland AI-bildgeneratorer.
Stabil Diffusion vs. AI Midjourney
Det första som märks är att Stable Diffusion är gratis att använda och att upplösningen är tillräckligt bra jämfört med AI Midjourney (högre än DALL-E). Hastigheten och genomförandet av anvisningarna är tillfredsställande och bildkvaliteten är jämförbar.
Det som är slående är dock att du har direkt tillgång till inmatningsskärmen och resultaten från Stability AI-verktyget via Dream Studio. AI Midjourney används för närvarande (sommaren 2023) fortfarande via Discord. Discord måste installeras, du behöver ett användarkonto och dataöverföringen är ofta överbelastad. Sedan får man vänta väldigt länge på att ens uppmaningar ska behandlas, även för relativt enkla uppgifter, vilket är irriterande.
Den andra punkten är integritet. Med AI Midjourney tillhör inte det genererade bildinnehållet dig. AI Midjourney förbehåller sig rätten att visa ditt genererade material som ett exempel i galleriet. Det innebär att 3D-bilderna är tillgängliga för alla intresserade, som också kan fortsätta att arbeta med dem. Om du vill generera mer än bara en handfull bilder och använda dem kommersiellt behöver du ett abonnemang. Sekretess kostar också pengar.
Slutsats
Att generera bilder med hjälp av AI har blivit mycket enklare de senaste åren. Tekniken gör enorma framsteg. Faktum är att utvecklingen av verktygen ligger före opinionsbildningen i samhället - vi vet helt enkelt inte idag hur vi ska hantera detta bildmaterial juridiskt och moraliskt.
Bildmaterialet är inte kurerat, varför det även kan förekomma stötande material. Du ska inte förvänta dig ett unikt bildmaterial som är anpassat till din ansökan.
Man kan inte ens förvänta sig felfria bilder, eftersom hästar med fem ben och liknande misstag inträffar hela tiden. Du ska inte heller förvänta dig mångfald när det gäller hudfärg, nationaliteter, språk etc. - det är här algoritmisk partiskhet kommer in i bilden.
Om resultatet ändå är tillräckligt för dig finns det inget som talar emot att använda Stable Diffusion eller ett jämförbart verktyg.
AI-bildgeneratorer kommer inte att försvinna igen, utan kommer att hitta och behålla sin plats i de kreativa branscherna. Det är därför dags att titta närmare på dem - ur ett tekniskt, etniskt, användarmässigt och juridiskt perspektiv.
Om du däremot vill skapa helt nya bilder, t.ex. produktbilder för din marknadsföring, är Stable Diffusion inte rätt val. I det här fallet kan vi dock hjälpa till: Vår CGI-byrå Danthree Studio kan skapa produktvisualiseringar och animationer av hem- och bostadsartiklar, interiörer och möbler som är helt unika och juridiskt invändningsfria. Kontakta oss för en kostnadsfri inledande konsultation!