GPT-4o: come funziona il processo di codifica e riconoscimento delle immagini

GPT-4o: come funziona il processo di codifica e riconoscimento delle immagini
Altri dettagli:

Le applicazioni di visione artificiale non sono nuove ma con l’avvento dei modelli più evoluti, basati sull’intelligenza artificiale generativa, esse diverranno sempre più performanti e “all’ordine del giorno”. GPT-4o (la “o” finale sta per “omni”) è il più avanzato modello di linguaggio multimodale sviluppato da OpenAI e presentato il 13 maggio 2024. Si tratta di un’evoluzione significativa rispetto alle versioni precedenti, in grado di gestire e integrare input e output di testo, audio e immagini in tempo reale. (IlSoftware.it)

Ne parlano anche altri giornali

L'azienda aveva inizialmente previsto di introdurre la nuova feature per alcuni abbonati paganti alla fine di giugno, ma ha deciso di posticipare il rilascio iniziale di un mese (Adnkronos)

OpenAI aveva annunciato per questo fine mese di giugno il rilascio di ChatGPT vocale, ma alcune verifiche di sicurezza hanno portato l’azienda a rivedere il progetto imminente e a decidere di rimandarlo. (Lega Nerd)

"Ma se tutti sanno come accedere a ChatGPT e chiedere informazioni di ogni tipo usando il linguaggio naturale, molti non sanno che una delle innovazioni più significative in questo campo è rappresentata dal fatto che basandosi sulla potente architettura GPT (che sta per Generative Pre-trained Transformer, ndr. (Focus)

ChatGPT : la app desktop è disponibile per macOS

OpenAI ha deciso di posticipare il rilascio della tanto attesa funzionalità di assistente vocale per ChatGPT per garantire che possa elaborare le richieste degli utenti in modo sicuro ed efficace. (Key4biz.it)

Servirà ancora un po' di pazienza prima di poter conversare con le ultime evoluzioni delle voci ChatGPT mostrate un mese fa in occasione del lancio del nuovo modello GPT-4o. (WIRED Italia)

Alla base di ChatGPT per macOS c’è il nuovo modello GPT-4o grazie al quale è possibile interagire col chatbot anche usando la voce con un futuro aggiornamento. L’app era stata presentata all’inizio dell’anno insieme ad altri aggiornamenti all’intelligenza artificiale, ma solo oggi, finalmente, è disponibile per tutte le tipologie di utenti, paganti e non. (Webnews)