Durante il Google I/O 2025, la casa di Mountain View ha alzato il sipario su Imagen 4, la nuova versione del suo modello di generazione di immagini con intelligenza artificiale. Tra le novità più rilevanti spicca una capacità significativamente migliorata nella scrittura di testi leggibili sulle immagini, da sempre uno degli ostacoli principali delle IA generative.

Imagen 4: il nuovo generatore di immagini IA di Google scrive anche correttamente
Con Imagen 4, Google promette un livello di qualità visiva mai raggiunto prima nei suoi modelli generativi. Secondo Eli Collins, Vicepresidente di prodotto presso Google DeepMind, questa nuova versione rappresenta non solo un progresso estetico, ma anche una soluzione tecnica concreta per applicazioni che richiedono testi leggibili e accurati nelle immagini.
Tra i miglioramenti più evidenti ci sono la precisione nella riproduzione di dettagli fini, come la trama dei tessuti, la trasparenza di liquidi, e la realistica resa del pelo animale. Il sistema si dimostra estremamente versatile, passando con facilità da immagini fotorealistiche a composizioni artistiche o astratte, mantenendo alta fedeltà visiva.

Le immagini mostrate da Google includono esempi spettacolari: una megattera che emerge dall’asfalto con un effetto iperrealista e una confezione di uova su cui è perfettamente leggibile del testo stampato. Quest’ultimo dettaglio segnala un netto miglioramento nella gestione della tipografia, aspetto critico in molte applicazioni commerciali e creative.
Imagen 4 non è solo un generatore di immagini più potente, ma anche uno strumento che si avvicina sempre di più alla comprensione e riproduzione coerente del linguaggio visivo e scritto. Con il lancio simultaneo anche di Google Flow, il nuovo strumento AI per la generazione di video, il colosso tech conferma la sua ambizione di dominare il settore delle intelligenze artificiali creative.