Table des matières de Qu'est-ce que la diffusion stable et comment fonctionne-t-elle ?
- Qu'est-ce que la diffusion stable ?
- Guide pas à pas Diffusion stable
- Avantages et inconvénients du générateur d'images AI Stable Diffusion
- Utilisation de contenus générés par Ki
- Alternatives à Stable Diffusion ?
- Stable Diffusion vs. AI Midjourney
- Conclusion
- FAQ
Qu'est-ce que la diffusion stable ?
Stable Diffusion est un générateur d'images d'IA qui génère des images numériques sur la base de messages-guides, c'est-à-dire d'instructions sous forme de texte. L'application a été développée par Stability AI, une start-up basée à Londres qui existe depuis 2020.
Runway ML, EleutherAI, l'entreprise allemande LAION et un groupe de recherche de la LMU de Munich ont contribué au générateur d'images d'IA de l'entreprise. La première version de l'outil est sortie en août 2022.
Il s'agit d'un logiciel open source. Cela signifie que les utilisateurs et utilisatrices peuvent se baser sur le code existant et le développer. L'ensemble repose sur un système d'apprentissage profond, c'est-à-dire sur un réseau neuronal profond composé de plusieurs couches qui permettent de reconnaître et d'"apprendre" des modèles et des relations complexes dans des quantités de données.
Cet outil associe la reconnaissance d'images et la reconnaissance vocale : L'IA reconnaît les commandes vocales saisies par les utilisateurs et les utilisatrices et recherche les éléments correspondants dans une banque d'images existante.
L'IA a été entraînée à l'aide d'un nombre extrêmement élevé d'images, chacune d'entre elles étant associée à un terme approprié et soumise à un processus de modèle de diffusion latent. Par diffusion, on entend qu'une image est créée à partir d'un modèle (points ou pixels) et que le programme correspondant reconnaît les aspects définis de l'image.
Les plusieurs millions d'images provenaient du jeu de données LAION Aesthetics. L'IA peut uniquement se baser sur des sources existantes pour générer de "nouvelles" images.
Guide pas à pas de la diffusion stable
Stable Diffusion est accessible de différentes manières. Possibilité 1 : ouvrir le site web de Stability AI et cliquer sur l'outil "Dream Studio". Possibilité 2 : ouvrir Hugging Face Hub via la plateforme. Possibilité 3 : télécharger le logiciel sur son propre terminal.
Étape 1 :
Ouvre le site web de Stability AI.
Étape 2 :
Fais défiler la page vers le bas jusqu'à ce que tu voies le bouton "Dream Studio". Clique dessus.
Étape 3 :
Sur la page qui s'ouvre, cherche le bouton "Get started" (qui peut aussi être marqué "Try me now" ou "Try for free"). Clique dessus.
Étape 4 :
Inscris-toi avec ton adresse e-mail dans le masque de saisie qui devrait s'ouvrir.
Étape 5 :
Tu recevras un e-mail de confirmation. Utilise le lien dans l'e-mail pour accéder à l'application front-end de Dream Studios.
Étape 6 :
Tu vois à nouveau un masque de saisie. Dans le champ de texte indiqué, tu saisis ton prompt, c'est-à-dire la commande de texte.
Il est important de savoir : La qualité du prompt est directement liée à la qualité du résultat. Plus tu es précis dans ta formulation, plus le résultat que tu obtiendras sera exact. Comme tout le monde n'est pas un ingénieur prompt doué, Stability AI a publié un guide du prompt.
Tu obtiendras les meilleurs résultats avec Stable Diffusion en utilisant des invites en anglais. L'outil peut certes aussi travailler avec des instructions en allemand. Mais il s'appuie sur une base de données beaucoup plus importante en anglais. Les messages-guides doivent être aussi détaillés que possible. Les mots clés sont mieux compris que les phrases rédigées.
Une fois que tu as saisi ton invite, l'outil te propose quatre variantes d'images. Tu peux utiliser ces variantes pour continuer à travailler avec.
Avantages et inconvénients du générateur d'images AI Stable Diffusion
Tout d'abord, il semble relativement simple de générer des images utilisables avec cet outil. Et c'est le cas. Tu dois maîtriser l'anglais avec une certaine fluidité et pouvoir décrire ce que tu attends de l'outil. Tu peux ainsi générer gratuitement des images d'une résolution suffisante, en y consacrant un temps raisonnable.
Mais c'est là que les problèmes commencent : Les images 3D sont utilisables et la résolution est bonne. Ce n'est pas un visuel exceptionnel et la résolution n'est pas excellente. Plus tes résultats doivent être spécifiques, plus la génération du matériel prend du temps. A partir d'un certain point, le temps nécessaire n'est plus du tout gérable.
Et puis, il reste toujours le problème que Stable Diffusion ne peut travailler qu'avec les images dont l'IA de LAION a été nourrie. Il n'est donc pas possible de créer quelque chose de complètement nouveau.
Les principaux avantages sont la gratuité et l'utilisation intuitive de l'outil.
Les avantages en un coup d'œil :
- Simplicité d'utilisation
- Bonne résolution (pour la plupart des usages)
- Disponible gratuitement
Aperçu des inconvénients :
- Peut prendre du temps
- Sorties partiellement erronées
- Pour certains usages, la résolution n'est pas assez élevée
- Préoccupations juridiques
- Ne peut créer des images que sur des bases
Droits d'auteur du contenu généré par Ki
Qu'en est-il des droits d'auteur et des droits d'utilisation ? Tout d'abord, la législation varie selon les pays où l'outil est accessible. Il n'existe pas de réglementation uniforme.
Et puis, dans l'ensemble, la question de savoir à qui appartiennent les droits sur les contenus générés par l'IA est controversée. Il y a de bons arguments pour dire que les droits d'auteur appartiennent aux personnes qui ont programmé l'IA. Car sans ces personnes, les contenus ne pourraient pas être créés.
Mais la position selon laquelle les droits d'auteur appartiennent à ceux qui, en saisissant des invites sur mesure, ont amené l'IA à créer précisément ce contenu, est tout aussi logiquement compréhensible. Cette question n'est donc pas définitivement résolue. Il n'est pas non plus clair de savoir qui peut être tenu pour responsable en cas de contenu problématique.
Compte tenu de ce qui précède, il est tout à fait compréhensible que les entreprises soient très réticentes à utiliser des contenus générés par l'IA. En effet, les droits d'utilisation des contenus artistiques et créatifs ne peuvent être accordés qu'à celui qui détient les droits d'auteur. Et cela, comme nous l'avons déjà mentionné, n'est pas clair. En tout état de cause, il convient de vérifier minutieusement les conditions commerciales en vigueur avant d'utiliser des contenus, quelle que soit leur ampleur.
Alternatives à Stable Diffusion ?
Il existe en effet quelques générateurs d'images d'IA que tu peux essayer alternativement. Artbreeder en est un, DeepAI et DALL-E sont d'autres possibilités. Craiyon, NightCafe et Visionist se prêtent également plus ou moins bien à la génération d'images. Le représentant le plus connu parmi les générateurs d'images d'IA est toutefois probablement AI Midjourney.
Stable Diffusion vs. AI Midjourney
Le premier point frappant est le suivant : Stable Diffusion est utilisable gratuitement et la résolution est suffisamment bonne par rapport à AI Midjourney (plus élevée que celle de DALL-E). La vitesse et la réalisation des invites sont satisfaisantes, la qualité des images est comparable.
Il est toutefois frappant de constater que tu as directement accès au masque de saisie et aux résultats de l'outil d'IA de Stability AI via Dream Studio. AI Midjourney est actuellement (été 2023) encore utilisé via Discord. Discord doit être installé, tu as besoin d'un compte d'utilisateur et la transmission des données est souvent surchargée. Ensuite, même pour des tâches relativement simples, tu attends très longtemps que tes messages-guides soient traités, ce qui est ennuyeux.
Le deuxième point est la vie privée. Chez AI Midjourney, le contenu visuel généré ne t'appartient pas. AI Midjourney se réserve le droit de montrer les matériaux que tu as créés comme exemple dans la galerie. Les images 3D sont ainsi accessibles à toutes les personnes intéressées, qui peuvent également continuer à travailler avec. Si tu veux générer plus qu'une poignée d'images et les utiliser à des fins commerciales, tu ne peux pas éviter de souscrire un abonnement. La sphère privée a également un coût.
Conclusion
La génération d'images par IA est devenue beaucoup plus facile ces dernières années. La technologie fait d'énormes progrès. De facto, le développement des outils est en avance sur la formation de l'opinion dans la société - aujourd'hui, nous ne savons tout simplement pas comment traiter ces images d'un point de vue légal et moral.
Les images ne sont pas gérées par un curateur, ce qui peut entraîner la présence d'images choquantes. Il ne faut pas s'attendre à des visuels uniques adaptés à ton application.
Tu ne dois même pas t'attendre à des images sans défaut, car les chevaux à cinq pattes et autres erreurs similaires sont fréquentes. Ne t'attends pas non plus à une diversité de couleurs de peau, de nationalités, de langues, etc.
Si le résultat te suffit malgré tout, rien ne s'oppose à l'utilisation de Stable Diffusion ou d'un outil comparable.
Les générateurs d'images d'IA ne disparaîtront pas à nouveau, mais trouveront et garderont leur place dans les industries créatives. Il est donc temps de s'y intéresser - techniquement, d'un point de vue ethnique, du point de vue de l'utilisateur et d'un point de vue juridique.
Mais si tu veux créer des images entièrement nouvelles, par exemple des images de produits pour ton marketing, Stable Diffusion n'est pas le bon choix. Dans ce cas, nous pouvons toutefois t'aider : Notre agence CGI Danthree Studio peut te créer des visualisations de produits et des animations d'articles Home & Living, d'intérieurs et de meubles qui sont totalement uniques et sans risque juridique. Contacte-nous pour un premier entretien gratuit !