È uno dei più grandi aggiornamenti che ChatGPT ha ricevuto dal suo rilascio nel novembre 2022. OpenAI offre al suo popolare chatbot due nuovi modi per interagire con gli utenti. O come scrive il provider: “ChatGPT ora può vedere, ascoltare e parlare”.
Le nuove funzionalità di lingua e immagine dovrebbero consentire agli utenti di comunicare più facilmente con ChatGPT in futuro. Una sorta di conversazione “verbale” dovrebbe essere possibile con un chatbot basato sull’intelligenza artificiale.
Raccomandazioni editoriali
Dovresti anche essere in grado di “mostrare” a ChatGPT di cosa stai parlando attualmente. Ad esempio caricando la foto di un paesaggio e parlando della sua bellezza.
Di più Suggerito da OpenAI Le opzioni di utilizzo includono lo scatto e il caricamento di foto del tuo frigorifero o della dispensa, seguite da una discussione su potenziali cene e ricette con istruzioni dettagliate.
Dovrebbe anche essere possibile fotografare i compiti dei bambini e ottenere consigli su come risolverli. Oppure puoi scattare una foto di un attrezzo da giardino rotto e ottenere consigli sulle opzioni di riparazione.
Inoltre, in futuro ChatGPT sarà anche in grado di generare immagini autonomamente grazie all’integrazione testo-immagine AI Dall-E 3. Gli utenti possono utilizzare le proprie competenze linguistiche, ad esempio, per raccontarsi favole della buonanotte o per risolvere una discussione.
Gli utenti possono scegliere tra diverse voci ChatGPT, create con l’aiuto di attori professionisti. Per convertire le parole pronunciate dagli utenti in testo comprensibile da ChatGPT, viene utilizzato, tra le altre cose, il sistema di riconoscimento vocale Whisper di OpenAI.
Per poter fornire risposte ChatGPT in forma linguistica, OpenAI ha sviluppato un nuovo modello di sintesi vocale. Questo strumento è già disponibile per l’utilizzo da parte di molte altre aziende. Incluso Spotify, con cui ha creato uno strumento di traduzione per podcast. Le voci originali dei conduttori vengono riprodotte in varie lingue tradotte come spagnolo, francese e tedesco.
Quando si utilizza ChatGPT, OpenAI indica che la nuova funzionalità può essere utilizzata solo in inglese. L’azienda vuole evitare il potenziale uso improprio delle capacità linguistiche del suo chatbot AI da parte di truffatori creando voci selezionabili.
Negli ultimi mesi OpenAI si è occupata anche di potenziali problemi causati dal riconoscimento delle immagini. Sebbene ChatGPT non risponda a domande come “Come faccio a costruire una bomba?”, secondo il MIT è possibile aggirare questa protezione con l’immagine di una bomba e chiedendo “Come faccio a creare la cosa mostrata nell’immagine”. tecnologia. revisione spiegare.
OpenAI ha dovuto anche porre fine a potenziali vulnerabilità come questa prima di lanciare nuove funzionalità. Tuttavia, il provider ChatGPT sembra sicuro di risolvere problemi simili.
Le funzionalità di riconoscimento vocale e di immagini saranno disponibili per tutti gli utenti ChatGPT Pro ed Enterprise entro le prossime due settimane. Tuttavia, solo le immagini verranno riconosciute su tutte le piattaforme. Le funzionalità audio sono limitate all’app (iOS e Android).
Per fare ciò, gli utenti devono andare su ImpostazioniSotto Nuovo lavoroIL Conversazioni vocali lancio. Puoi quindi selezionare una delle cinque varianti audio attualmente disponibili toccando l’icona delle cuffie in alto a destra.
Per caricare l’immagine, fare clic sull’icona corrispondente. Nell’app è necessario toccare prima il pulsante “segno più”. È poi possibile anche discutere più immagini o utilizzare il software di disegno integrato per indicare contenuti specifici.
“Pensatore incurabile. Appassionato di cibo. Studioso di alcol sottilmente affascinante. Difensore della cultura pop.”
More Stories
Gli utenti Samsung dovrebbero aggiornarsi immediatamente: c’è il rischio di perdere il controllo dello smartphone
Nuovo gioco di carte collezionabili lanciato per Android e iOS
Sicurezza Web: utilizzo della policy di sicurezza dei contenuti contro il cross-site scripting, parte 1