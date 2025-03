La maggiore velocità e le multimodali funzionalità di GPT-4o gli consentono di interagire in modo conversazionale e tradurre le lingue a un ritmo più umano rispetto a GPT-4 Turbo. In un video dimostrativo come parte dell'annuncio di rilascio1, è stato mostrato ChatGPT-4o mentre traduceva in tempo reale tra anglofoni e spagnoli. GPT-4o offre il supporto vocale dei chatbot in oltre 50 lingue.

Poiché è in grado di elaborare gli input audio da solo, GPT-4o ha una latenza inferiore, il tempo necessario per produrre l'output dal momento in cui viene ricevuto un input, rispetto ai modelli precedenti. Risponde all'input audio in 320 millisecondi, paragonabile al tipico tempo di risposta umano di 210 millisecondi.

Le

precedenti iterazioni di GPT-4 richiedevano più modelli assemblati in una pipeline per fornire un servizio simile, aumentandone la latenza a 5,4 secondi. Prima di GPT-4o, l'API Whisper di OpenAI convertiva i prompt audio in testo, li inviava a GPT-4 Turbo, poi i servizi di Text to Speech (TTS) riconvertivano le risposte di GPT in audio.

GPT-4 Turbo era anche un modello più lento in generale. Nei test di benchmark dell'organizzazione di valutazione dell'intelligenza artificiale Artificial Analysis2, GPT-4o ha dimostrato una velocità di 110 token al secondo, circa tre volte più veloce di GPT-4 Turbo. Nello stesso test, GPT-4o ha anche superato molti concorrenti, tra cui Claude 3 Opus e Gemini 1.5 Pro.