All'I/O 2024, Google ha presentato nuove funzioni per la sua piattaforma Gemini AI, che ora stanno diventando gradualmente disponibili. Con GEMS, un sistema di assistenti AI basati su argomenti, e Imagen 3, un generatore di immagini avanzato, Google mostra come l'intelligenza artificiale possa essere utilizzata in modo personalizzato ed eticamente responsabile. In questo articolo diamo uno sguardo più da vicino alle nuove funzioni, ai loro ambiti di applicazione e alle sfide associate.
GEMS: chatbot AI mirati per esigenze individuali
I GEMS sono versioni speciali dell'assistente AI Gemini. Consentono agli utenti di creare esperti per argomenti o compiti specifici, adattati esattamente alle loro esigenze. Potete definire voi stessi questi chatbot personalizzati, che ricordano ciò di cui avete già parlato e in quale contesto. In questo modo possono supportare l'utente in compiti ricorrenti. Il concetto è sostanzialmente simile a quello dei GPT di Open AI e dei progetti di Anthropic.
GEMS è disponibile per gli utenti Gemini che utilizzano Advanced, Business o Enterprise. Gli utenti possono definire le specifiche, ad esempio gli obiettivi, le regole di comportamento e gli scopi dell'applicazione. Ci sono anche alcune Gemme già pronte per iniziare, ad esempio come aiuto all'apprendimento, partner creativo, consulente di carriera, assistente di scrittura o partner di codifica. Queste Gemme già pronte possono essere utilizzate direttamente e facilitano la familiarizzazione con gli assistenti AI basati su argomenti.
Imagen 3: generazione avanzata di immagini supportata dall'intelligenza artificiale
Imagen 3 segna il ritorno del generatore di immagini AI di Google, che ora può creare anche immagini di persone (di nuovo), anche se con alcune limitazioni. Imagen 3 genera ora immagini in modo molto migliore e più vario. Inoltre, l'IA può ora creare immagini in diversi stili, da rappresentazioni molto realistiche a interpretazioni artistiche. Questa funzione è disponibile in tutte le lingue supportate da Google e si basa sulla tecnologia di filigrana SynthID di Google. Ciò significa che si può essere certi che i contenuti generati dall'IA provengano davvero da essa.
Vale la pena notare che Google ha reintrodotto la generazione di immagini delle persone dopo i problemi riscontrati in precedenza.
Tuttavia, per il momento solo in inglese. Ciò significa che la versione gratuita di Gemini può accedere anche alla generazione di immagini generali, ma senza le funzioni estese per le immagini umane.
Nelle versioni precedenti, ad esempio, l'IA raffigurava personaggi storici in modo errato. Con Imagen 3, Google intende correggere tali imprecisioni. Non sono più vietate le rappresentazioni di personaggi famosi o di minori, né le rappresentazioni eccessive di violenza o di contenuti inappropriati.
Gemini Live: il futuro delle interazioni AI in tempo reale
Anche se Gemini Live è attualmente disponibile solo in inglese e come modello di abbonamento, Google ha superato la variante Chatgpt, che è bloccata in fase di test alfa, e ha fatto pressione sull'Open Ai per poter interagire con l'IA in tempo reale attraverso la voce. Con Gemini Live, in futuro le risposte dovrebbero essere ancora più dinamiche e contestualizzate.
Inoltre, il confine tra macchina e comunicazione umana è ancora più labile. Questa funzione potrebbe essere particolarmente utile quando si tratta di rispondere rapidamente alle richieste, ad esempio nel servizio clienti o negli ambienti di apprendimento.
Prezzi e disponibilità
La maggior parte delle nuove funzioni è attualmente disponibile solo con un abbonamento a pagamento: Gemini Advanced costa 20 dollari al mese, mentre la versione Enterprise costa 30 dollari.
Conclusione: IA personalizzata per la vita di tutti i giorni e oltre
Le nuove funzioni della piattaforma Gemini dimostrano come Google voglia rendere l'uso dell'IA accessibile a un'ampia base di utenti. GEMS e Imagen 3 offrono un supporto personalizzato in un'ampia gamma di scenari e mostrano ciò che è già possibile fare oggi con l'intelligenza artificiale. Google sta adottando un approccio attento, in cui innovazione e responsabilità vanno di pari passo. Misure di protezione come SynthID, che riconosce i contenuti generati dall'intelligenza artificiale, sono particolarmente importanti.
Con questi sviluppi, Google dimostra che il futuro dell'IA risiede in soluzioni personalizzate, responsabili ma potenti, in grado di soddisfare le esigenze degli utenti e di superare i limiti delle applicazioni tradizionali. Al di là di questi dati di base, resta emozionante vedere quali modelli sono e saranno più utili in quali situazioni.