Google ha introdotto un nuovo strumento di intelligenza artificiale, Whisk, progettato per semplificare la creazione di immagini basate su altre fotografie senza la necessità di scrivere complicati prompt. Generare immagini tramite AI può spesso risultare impegnativo, con risultati che richiedono modifiche ripetute. Whisk mira a rendere questo processo intuitivo e accessibile a tutti, sfruttando la potenza di Gemini AI per combinare immagini e stili con facilità.
Come Funziona Whisk
Attualmente disponibile negli Stati Uniti tramite Google Labs, Whisk permette di accedere tramite un account Google e offre tre modalità di generazione di immagini:
- Adesivo: crea immagini piatte, simili a emoji o sticker per app di messaggistica.
- Spilla smaltata: aggiunge profondità e dettagli.
- Peluche: genera immagini tridimensionali, ideali per rappresentazioni realistiche.
Dopo aver scelto un modello, è possibile selezionare un’immagine preesistente o caricarne una propria. Whisk utilizza il motore di Gemini AI per analizzare stile e soggetto, combinandoli per produrre un risultato unico. Per un maggiore controllo, è possibile avviare il processo da zero, caricando immagini per scena, soggetto e stile o utilizzando un prompt descrittivo.
Creatività Senza Limiti
Whisk non si limita a replicare le immagini sorgente ma ne cattura l’essenza, consentendo di remixare soggetti e stili in modi completamente nuovi. Il sistema utilizza Imagen 3, l’ultimo modello di generazione di immagini di Google, per tradurre le descrizioni delle immagini in creazioni originali. Se i risultati non soddisfano, è possibile modificare il prompt o cambiare le immagini sorgente per ottenere un output differente.
Esplorazione Visiva e Download Semplici
Le immagini generate vengono automaticamente salvate nella libreria personale di Whisk. Da qui, è possibile eliminare quelle indesiderate o scaricare i file in formato JPG, pronti per essere utilizzati con altre applicazioni e piattaforme.
Secondo Thomas Iljic, direttore della gestione prodotti di Google, Whisk non è pensato come un editor di immagini tradizionale, ma come uno strumento creativo per esplorare idee visive rapidamente. “Questo approccio consente di generare decine di opzioni e trovare quelle più adatte ai propri progetti, senza la necessità di modifiche pixel-perfect”.
Conclusione
Whisk rappresenta una soluzione innovativa per artisti, creativi e chiunque voglia esplorare nuovi modi di generare immagini con l’intelligenza artificiale. Grazie a funzionalità intuitive e alla potenza di Gemini AI, Google punta a ridefinire il processo creativo, rendendolo accessibile e stimolante per tutti.