Negli ultimi anni, l’intelligenza artificiale (IA) ha compiuto passi da gigante, trasformando il modo in cui interagiamo con i nostri dispositivi tecnologici, ed una delle innovazioni più recenti e significative in questo campo è rappresentata da Gemini Live, una funzionalità avanzata sviluppata da Google che integra capacità di condivisione in tempo reale della fotocamera e dello schermo sui dispositivi Android.
Questa tecnologia promette di rivoluzionare l’esperienza utente, offrendo interazioni più intuitive e immediate con l’IA.

Gemini Live è il risultato del progetto Astra di Google, un’iniziativa volta a creare un agente IA universale capace di assistere gli utenti nella vita quotidiana; annunciato per la prima volta durante il Google I/O 2024, Astra ha posto le basi per lo sviluppo di funzionalità avanzate che permettono all’IA di interpretare e rispondere in tempo reale alle informazioni visive e contestuali fornite dagli utenti.
Questo approccio rappresenta un significativo passo avanti rispetto alle tradizionali interazioni basate esclusivamente su input testuali o vocali.
La caratteristica distintiva di Gemini Live è la sua capacità di utilizzare la fotocamera del dispositivo per “vedere” ciò che l’utente sta osservando, offrendo assistenza e informazioni pertinenti in tempo reale, per esempio, puntando la fotocamera verso un oggetto o una scena, l’IA può fornire dettagli, suggerimenti o rispondere a domande specifiche relative a ciò che viene inquadrato.
Questa funzionalità apre nuove possibilità in vari ambiti, dalla consulenza nella scelta di un abbigliamento adeguato, all’organizzazione di spazi domestici, fino alla pianificazione di pasti basati sugli ingredienti disponibili.
Oltre all’uso della fotocamera, Gemini Live introduce anche la condivisione dello schermo, permettendo all’IA di analizzare e interagire con i contenuti visualizzati sul dispositivo, una funzione che è particolarmente utile per ottenere assistenza su applicazioni, documenti o pagine web, facilitando la comprensione e l’utilizzo di software complessi o l’accesso a informazioni specifiche.
Il rollout di queste funzionalità ha avuto inizio nel marzo 2025, con una distribuzione graduale che ha coinvolto inizialmente i dispositivi Pixel 9 di Google e la serie Galaxy S25 di Samsung, e secondo quanto riportato da 9to5Google, queste capacità sono state rese disponibili a tutti gli utenti dell’app Gemini su questi dispositivi, rappresentando una delle principali novità introdotte con il Pixel Feature Drop di aprile 2025.
Le funzionalità avanzate di Gemini Live: molto più di un semplice assistente

Per accedere a Gemini Live, gli utenti possono attivare l’assistente premendo il pulsante laterale del proprio dispositivo e selezionando l’opzione appropriata, una volta attivata, l’IA è in grado di fornire assistenza basata su ciò che viene visualizzato attraverso la fotocamera o sullo schermo del dispositivo.
Per avere un’idea del suo funzionamento nella vita quotidiana, puntando la fotocamera verso il contenuto del frigorifero, l’IA può suggerire ricette basate sugli ingredienti disponibili, o fornire consigli su come organizzare al meglio uno spazio disordinato.
L’integrazione di queste funzionalità rappresenta un significativo passo avanti nell’evoluzione degli assistenti virtuali, rendendo l’interazione con l’IA più naturale e contestuale, e sicuramente la possibilità di combinare input visivi e vocali permette un livello di assistenza più profondo e personalizzato, adattandosi alle esigenze specifiche di ciascun utente.
Ciononostante, è importante notare che l’accesso completo a queste funzionalità richiede un abbonamento a Gemini Advanced, disponibile tramite il piano Google One AI Premium al costo di 19,99 dollari al mese. Questo abbonamento offre accesso a funzionalità IA avanzate, inclusa la condivisione in tempo reale della fotocamera e dello schermo, ampliando le capacità dell’assistente virtuale e migliorando l’esperienza utente complessiva.
Gemini Live non è semplicemente un’estensione vocale del classico assistente digitale: è un sistema dinamico e reattivo, capace di contestualizzare, elaborare e suggerire azioni sulla base di ciò che l’utente mostra alla fotocamera o visualizza sullo schermo, e non si limita a rispondere a comandi: osserva, comprende, interagisce.
Questa novità trasforma ogni interazione in un’esperienza multimodale, dove voce, immagine e testo si fondono per costruire un dialogo autentico tra utente e IA. Ecco alcune delle capacità che Gemini Live è in grado di mettere in campo:

1. Comprensione visiva contestuale
Puntando la fotocamera su un oggetto, una situazione o un ambiente, Gemini può offrire informazioni pertinenti e contestuali:
- se inquadri una pianta d’appartamento, può dirti che specie è e come curarla;
- se mostri il contenuto di una borsa della spesa, può suggerirti cosa cucinare;
- se scatti a un oggetto tecnologico, può fornirti specifiche tecniche o guide per l’uso.
2. Aiuto in tempo reale con app e contenuti digitali
Condividendo lo schermo del proprio smartphone, Gemini può aiutare a:
- navigare tra le impostazioni del dispositivo;
- capire una schermata complicata (es. errori di sistema o interfacce sconosciute);
- trovare funzioni nascoste in app complesse;
- tradurre contenuti, riassumere documenti, semplificare testi tecnici.
In pratica, è come avere un esperto al tuo fianco, pronto a offrirti supporto tecnico o pratico in qualsiasi momento.
3. Interazione naturale e continua
Una delle caratteristiche più sorprendenti è la fluidità dell’interazione, Gemini Live infatti mantiene un contesto attivo, quindi puoi passare da un’inquadratura all’altra, cambiare argomento, fare domande successive, senza dover ogni volta spiegare tutto da capo.
Questa forma di interazione continua ricorda il modo in cui comunichiamo con un essere umano: si crea un dialogo, e non una sequenza di richieste isolate.
In sintesi, l’introduzione di Gemini Live segna un momento cruciale nell’integrazione dell’intelligenza artificiale nella vita quotidiana e grazie alla capacità di interpretare e rispondere a input visivi e contestuali, questa tecnologia offre un livello di assistenza senza precedenti, aprendo la strada a nuove possibilità di interazione tra l’uomo e la macchina.
Se sei attratto dalla scienza o dalla tecnologia, continua a seguirci, così da non perderti le ultime novità e news da tutto il mondo!