GPT-4o si evolve: ChatGpt più potente e versatile
OpenAI ha ufficialmente annunciato un aggiornamento per il modello GPT-4o, la base di ChatGPT, con il messaggio “C’è un nuovo modello Gpt-4o in ChatGpt. Pensiamo che vi piacerà”. L’azienda non ha rilasciato dettagli specifici sulle novità, ma gli utenti hanno notato un cambio di comportamento del chatbot, con un’apparente maggiore velocità di risposta e capacità di generazione di immagini di qualità superiore. Come sottolineato da diversi utenti su X, tra cui l’account @AI For Humans Show, il nuovo GPT-4o sembra essere in grado di intervenire sulle scritte delle immagini generate con una precisione maggiore rispetto ai software di IA tradizionali, evitando gli errori visivi comuni. OpenAI ha confermato che l’aggiornamento è il frutto del feedback degli utenti e di una serie di esperimenti, sottolineando che non si tratta di un nuovo modello, ma di un miglioramento del precedente. Il GPT-4o, conosciuto anche come “omnia”, possiede capacità multimodali, ovvero può comprendere e generare contenuti vocali, oltre a testi e immagini.
Google replica con Gemini Live: l’interazione vocale arriva nel chatbot
A pochi giorni dall’annuncio di OpenAI, Google ha presentato Gemini Live, un aggiornamento del suo chatbot che introduce la possibilità di interazione vocale. Il nuovo Gemini Live sarà disponibile inizialmente solo negli Stati Uniti e in inglese, a partire dagli smartphone Pixel. Google ha annunciato che in futuro Gemini Live sarà esteso ad altre lingue e dispositivi. L’introduzione dell’interazione vocale rappresenta un passo importante per Google nel campo dei chatbot, avvicinando la tecnologia alla conversazione naturale e aprendo nuove possibilità di interazione con gli utenti.
La corsa all’intelligenza artificiale: un futuro di interazione multimodale
L’annuncio di OpenAI e la risposta di Google dimostrano la crescente competizione nel campo dell’intelligenza artificiale generativa. Entrambe le aziende stanno investendo nello sviluppo di chatbot sempre più sofisticati e versatili, con l’obiettivo di fornire agli utenti un’esperienza di interazione più naturale e intuitiva. L’introduzione di capacità multimodali, come la generazione di immagini e l’interazione vocale, rappresenta un passo importante verso un futuro in cui l’intelligenza artificiale sarà in grado di comprendere e generare contenuti in diverse forme, avvicinandosi sempre di più al modo in cui gli esseri umani comunicano.