Cos'è Watson Speech to Text?

Il servizio Speech to Text fornisce un'API per aggiungere funzionalità di trascrizione di contenuto vocale alle applicazioni. Questo servizio combina informazioni sulla struttura linguistica con la composizione del segnale audio.

Funzioni di Watson Speech to Text

Potente riconoscimento vocale in tempo reale

Esegui una trascrizione automatica di audio da 7 lingue, in tempo reale. Identifica e trascrivi rapidamente ciò di cui si sta discutendo, anche da audio di scarsa qualità, in una varietà di formati audio e interfacce di programmazione (HTTP REST, Websocket, Asynchronous HTTP).

Motore vocale estremamente accurato

Personalizza il tuo modello per una maggiore accuratezza della lingua e dei contenuti più importanti, come ad esempio i nomi dei prodotti, gli argomenti sensibili o i nomi di individui. Riconosci diversi oratori nel tuo contenuto audio e individua parole chiave specificate in tempo reale, con estrema precisione e sicurezza.

Creato per supportare vari casi di utilizzo

Trascrivi contenuto audio per vari casi d'utilizzo che vanno dalla trascrizione in tempo reale per contenuto audio da un microfono, all'analisi di migliaia di registrazione audio provenienti dal call center, per fornire risultati di analytics significativi.

Inizia a utilizzare Watson Speech to Text in pochi minuti

Introduzione a Watson Speech to Text