Midjourney 5 migliora quasi ogni aspetto delle immagini generate dall'intelligenza artificiale
Migliorare: Con tutte le notizie recenti che ruotano attorno a ChatGPT e ad altri grandi modelli linguistici, è facile dimenticare che i loro cugini, i generatori di immagini AI, stanno ancora migliorando. Si potrebbe aver capito come rendere gli occhi e le mani senza far sembrare il soggetto uscito da un incubo. tuttavia, i risultati spaventano ancora alcune persone.
All'inizio di questa settimana, il laboratorio di ricerca Midjourney ha rilasciato una beta per la versione 5 del suo omonimo software di imaging AI. Secondo l'annuncio via Twitter, l'ultima versione aggiunge una qualità dell'immagine più elevata, risultati più "diversi", una gamma più ampia di stili, texture senza soluzione di continuità e molto altro.
Da oggi la nostra community può testare Midjourney V5. Ha una qualità dell'immagine molto più elevata, output più diversificati, una gamma stilistica più ampia, supporto per texture senza soluzione di continuità, proporzioni più ampie, migliore suggerimento delle immagini, gamma dinamica più ampia e altro ancora. Esploriamo!
Gli utenti hanno già pubblicato centinaia di risultati sorprendenti e i sentimenti riguardo ai miglioramenti sono contrastanti. La maggior parte è colpita perché l’intelligenza artificiale per l’imaging ha faticato a produrre aspetti come ombre, riflessi, occhi e mani. Di seguito è riportata un'immagine che abbiamo creato con Dall-E di OpenAI come esempio di dove la macchina ha problemi.
La composizione è un po' fuori dal comune e l'atmosfera generale è da cartone animato. L'illuminazione è tutta sbagliata. Gli occhi e le mani sono gravemente deformati. Le gambe sono sporche di artefatti, così come il contenitore dei popcorn e il sedile accanto al soggetto. Questo risultato è uno dei quattro con problemi simili a vari livelli.
La versione 5 di Midjourney sembra essere migliorata sotto questo aspetto, almeno dagli esempi condivisi da altri. I risultati ottenuti da semplici istruzioni rasentano l'inquietante valle: abbastanza realistici da passare come foto professionali in molti casi, ma con quella strana qualità che non riesci a individuare. Sebbene incredibilmente realistiche, molti hanno descritto le immagini come inquietanti.
Midjourney v5 è qui! (per davvero questa volta, lol) Ecco alcuni affiancamenti dei miei suggerimenti, v4 contro v5, oltre ad alcuni nuovi suggerimenti e scatti della folla. Aggiungerò altro a questo mentre sperimento.ð§μ pic.twitter.com/qSEZWQBXou
Il nostro Kishalaya Kundu ha detto: "A dire il vero, sono più spaventato che impressionato", dopo aver visto una serie di foto quasi impeccabili di Midjourney V5. Il timore è che si possa facilmente creare un'immagine falsa e spacciarla per autentica.
Fattore di creep a parte, rispetto al V4, Midjourney V5 ha una qualità notevolmente migliorata. La graphic designer Julie Wieland utilizza da tempo Midjourney V4 (pubblicato lo scorso novembre) e afferma che la versione 5 ha texture della pelle "incredibilmente realistiche". Anche gli effetti di luce sono molto migliori, inclusi riflessi, bagliori e ombre. Forse la cosa più importante è che l’intelligenza artificiale genera mani e occhi che appaiono naturali per la maggior parte del tempo.
�"� Consiglio di MJ: gli scatti attraverso una finestra sono finalmente possibili con la V5! Desideravo l'estetica "My Blueberry Nights" da quando ho provato Dalle2 per la prima volta (e ha funzionato bene), ma la v5 è sbalorditivo!�' trova il prompt nel testo ALT delle immagini #synthography #midjourneyv5 pic.twitter.com/kAOagopucG
"Gli occhi sono quasi perfetti e non sono più traballanti", ha detto Wieland ad Ars Technica. "Le mani sono corrette per la maggior parte del tempo, con cinque dita invece di 7-10 su una mano. Attualmente MJ v5 mi sembra di avere finalmente gli occhiali dopo aver ignorato i problemi di vista per un po' troppo tempo. All'improvviso vedi tutto in 4K; sembra stranamente travolgente ma anche sorprendente."
Foto di street style degli anni '60 di una giovane donna, seduta, barca a vela, abito verde Dior, abito verde di seta, abito verde, seta, collana di perle, perle di Tiffany, collana di perle di Tiffany, tramonto, oceano, scattata con Agfa Vista 200, 4k --ar 16:9v4 (sinistra) v5 (destra) pic.twitter.com/wz7GbI3fvA
Midjourney ha anche migliorato la risoluzione nativa da 512x512px a 1024x1024px. L'aumento lo allinea con Dall-E. Tuttavia, la versione 4 potrebbe sovracampionare per raddoppiare la risoluzione nativa. Non è irragionevole aspettarsi che V5 utilizzi la stessa tecnica per produrre immagini 2048x2048, ma si tratta di un aggiornamento più avanti.