Indice dei contenuti di Che cos'è un ingegnere AI Midjourney Prompt?..:
- Prompt Engineer: creazione di CGI (2D/3D), strumenti di programmazione
- Che cos'è l'AI Midjourney? - spiegato in modo conciso
- Strumenti AI per la CGI nel settore professionale?
- Che cos'è un Prompt Engineer?
- Il Prompt Engineer - Artista o nerd del computer?
- Gli strumenti di IA sono creativi?
- I più utili suggerimenti per l'IA a metà viaggio
- FAQ
Prompt Engineer: creazione di CGI (2D/3D), strumenti di programmazione
L'arte deriva dall'abilità, naturalmente. E un programmatore programma. Se si combinano codifica e creatività, si finisce per diventare un prompt engineer. Ma è davvero ancora una professione creativa o può scomparire in futuro?
Oggi non si riesce più a capire da dove provenga esattamente l'affermazione "Questa è arte o può andare?". In generale, la questione viene sollevata quando si parla di arte contemporanea. Come si presenta allora il materiale visivo creato al computer? L'ingegnere pronto ha diritto di esistere?
Che cos'è l'AI Midjourney? - spiegato in modo conciso
AI Midjourney è uno dei tanti programmi che permettono di creare immagini generate al computer (CGI) utilizzando l'intelligenza artificiale.
In parole povere: si inserisce in una finestra di chat una breve istruzione sul tipo di immagine che si desidera. L'intelligenza artificiale genera l'immagine. L'AI Midjourney viene utilizzata tramite Discord, uno strumento di chat.
L'intelligenza artificiale fornisce quattro suggerimenti in un breve lasso di tempo, si seleziona un'immagine e si continua a lavorarci. Di norma, i risultati si avvicinano alle idee iniziali, ma non sono quelli desiderati. Fin qui, tutto banale. Lo ammettiamo: È divertente vedere cosa creano gli strumenti a partire da semplici istruzioni.
Ma: siete umani e siete abituati a comunicare con le persone. Gli esseri umani comprendono il linguaggio non solo attraverso le parole pronunciate, ma tengono conto anche dell'intonazione e del tono della voce, della velocità e della melodia del discorso, delle pause, delle espressioni facciali e dei gesti. L'intelligenza artificiale non fa questo, per cui gran parte delle vostre istruzioni vanno perse. All'inizio non è un problema, si può sempre approfondire e migliorare.
Strumenti AI per la CGI nel settore professionale?
Se siete alla ricerca di un'espressione speciale, se volete trovare il linguaggio del vostro design nelle visualizzazioni 3D e nelle immagini generate al computer, raggiungerete rapidamente i limiti della comunicazione con gli strumenti. Non fraintendete: Naturalmente, noi di Danthree Studio non lavoriamo (esclusivamente) con carta e penna. La CGI si crea al computer, questo è chiaro. Non è possibile farlo senza il giusto software 3D. E oggi questo è spesso dotato di un'intelligenza artificiale almeno rudimentale.
Il problema non sono gli strumenti: la generazione di immagini assistita dall'intelligenza artificiale non solo è possibile, ma è anche piuttosto buona. Ma come si fa a far sì che gli strumenti producano esattamente ciò che si desidera? I programmi non possono fare la vera creatività, che è un vero talento umano. Creare qualcosa di nuovo, creare un'espressione visiva con un'affermazione specifica: solo le persone possono farlo. Programmi come AI Midjourney sono per un fotografo quello che è una macchina fotografica per un fotografo.
Che cos'è un Prompt Engineer?
La professione di prompt engineer esiste da tempo. Un prompt engineer crea i prompt, cioè i comandi vocali che rendono possibile il lavoro con un'intelligenza artificiale.
Se avete già trascorso un po' di tempo con Midjourney, ChatGPT o strumenti simili, lo saprete: Non è facile. Gli strumenti non parlano la vostra lingua. Per ottenere risultati utili dai programmi, una conoscenza di base della programmazione è un vantaggio. Perché, in senso stretto, i prompt sono programmazione.
Ma ciò che un ingegnere di pronto intervento deve essere in grado di fare dipende anche dallo strumento che deve utilizzare e dal risultato che deve ottenere.
Un ingegnere che si occupa di prompt dovrebbe ovviamente avere familiarità con l'uso dei cosiddetti LLM, Large Language Models. Dopo tutto, è proprio per questo che i prompt vengono creati. Gli ingegneri lavorano in team con marketer, designer, copywriter e altre persone.
Suddiviso in singole fasi o stazioni, il lavoro del Prompt Engineer si presenta in questo modo:
- Avere un'idea creativa di come un'affermazione possa essere trasmessa visivamente - Tradurre l'idea in linguaggio umano e discuterla in un team con specialisti creativi - Tradurre il risultato in messaggi comprensibili dall'intelligenza artificiale - Discutere ciò che il programma ha creato nel team e migliorarlo attraverso ulteriori messaggi in modo che si adatti a un certo punto
Sembra complicato? Certo, è arte!
Inserimento di un prompt in AI Midjourney:
Prompt per il viaggio intermedio di AI
Il Prompt Engineer - Artista o nerd del computer?
In qualità di agenzia 3D, possiamo affermare per esperienza personale che i nostri specialisti nella creazione di prompt sono entrambi.
Naturalmente, per creare visualizzazioni o animazioni 3D di alta qualità è necessaria un'enorme creatività. Senza creatività non funziona nulla, anche se l'intelligenza artificiale alla fine converte le istruzioni testuali in un'immagine 3D. Ma senza una conoscenza specifica dei programmi e senza la consueta affinità con la programmazione dei nerd informatici, non è possibile.
Gli strumenti di IA sono creativi?
Strumenti come ChatGPT di Open AI o Midjourney creano l'illusione di essere effettivamente creativi. Tuttavia, ciò avviene solo in parte. In realtà, questi programmi accedono solo a giganteschi database e ricombinano le informazioni in essi contenute.
In termini estremamente semplificati: lo strumento è in grado di assemblare un volto a partire da una serie di occhi esistenti, un naso, una bocca e due orecchie. Può sostituire gli occhi con un altro paio di occhi di colore diverso, aggiungere capelli alla testa o cambiare il colore delle labbra secondo criteri predefiniti.
L'intelligenza artificiale non può creare un volto completamente nuovo. Lo strumento non è nemmeno in grado di giudicare se l'immagine composita risulti credibile per gli esseri umani o se trasmetta il messaggio desiderato. L'intelligenza artificiale è stupida e non creativa.
ChatGPT può scrivere codice. E l'intelligenza artificiale può ovviamente creare messaggi per altri strumenti di intelligenza artificiale. Dopo tutto, un prompt è anche qualcosa di simile a un piccolo programma. Ma ancora una volta, l'IA è stupida e non creativa. I prompt vengono assemblati a partire dai comandi disponibili nel database. Per un risultato approssimativamente adeguato, un prompt generato dall'IA può essere sufficiente, ma per il lavoro di precisione è necessario che l'uomo controlli e regoli il rispettivo risultato.
Nei prossimi anni e forse anche decenni, ci sarà sempre bisogno di una persona creativa in grado di creare CGI utilizzando tali strumenti. Che si tratti di 3D o di 2D, c'è bisogno di un ingegnere di produzione! Attualmente, gli ingegneri di produzione non sono solo molto richiesti, ma anche molto ben pagati.
I più utili suggerimenti per l'IA a metà viaggio
Certo: Se giocate abbastanza a lungo con AI Midjourney o con strumenti simili, vi renderete conto da soli quali sono i comandi particolarmente utili. Vogliamo risparmiarvi il lavoro e rivelarvi qui i comandi più utili:
- /image: genera un'immagine basata sul prompt - /private: imposta i prompt come privati, in modo che altri utenti non possano vederli o remixarli (a pagamento) - /show: richiama i prompt più vecchi - -no: parametri per gli elementi da rimuovere dall'immagine - -stylise: valore più basso per valutare i prompt in modo più rigoroso, valore più alto per una più libera interpretazione del prompt - /describe:
Carica l'immagine, usa il prompt e lo strumento crea un suggerimento di prompt adatto con parametri a volte piuttosto complessi - -aspect (in alternativa -ar): specifica il rapporto di aspetto dell'immagine - -chaos XX: valore esatto del grado di astrazione (usare numeri da 0 a 100 per XX) - ::X:
definisce il peso dei componenti dell'immagine (X determina la ponderazione) - -video: salva l'avanzamento come video time-lapse - -q e -hd: definisce la risoluzione, si usano anche termini come "fotorealistico", "ultra dettagliato" o "8K" - /image prompt: (URL dell'immagine) (descrizione del testo): L'immagine viene creata secondo il modello dell'immagine collegata e sulla base del testo
È esattamente ciò che si specifica per determinati stili o tipi di design. "Stile Anime giapponese" è un'opzione, "Stile Steam Punk" un'altra. Per gli stati d'animo e gli effetti di luce, si descrivono esattamente questi, ad esempio "Illuminazione natalizia" o "Illuminazione cinematografica".