¿Qué es Text to Speech (TTS)?

Speech synthesis o text to speech (TTS) es una producción artificial del habla humana. Al sistema utilizado para este propósito se le llama ‘’speech computer’’ o ‘’speech synthesizer’’. Un sistema text to speech (TTS) se usa básicamente para convertir el texto a voz.

Watson Text to Speech puede sintetizar texto a audio en muchos formatos, puede producir voces masculinas y femeninas para varios idiomas y dialectos. Ofrece voces neuronales concatenativas y mejoradas. El servicio acepta texto sin formato y texto anotado con lenguaje marcado de síntesis de voz (SSML) basado en XML. Extiende SSML para permitir la entonación expresiva y proporcionar capacidades de transformación de voz que pueden ampliar la gama de voces posibles controlando aspectos como el tono, la velocidad y el timbre. También proporciona una interfaz de personalización que puede usar para especificar cómo el servicio pronuncia las palabras inusuales que ocurren en su entrada. Puede definir pronunciaciones con el Alfabeto Fonético Internacional (IPA por si singlas en inglés) o la Representación Fonética Simbólica de IBM (SPR).

Características de Watson Text to Speech

Permita que los sistemas "hablen"

Desarrolle productos interactivos para la educación, automatice las interacciones con el centro de atención al cliente, comunique direcciones con las manos libres, construya juguetes interesantes para niños, etc.

Personalice la pronunciación

Proporcione una interacción impecable por voz que satisfaga a su audiencia con control sobre cada palabra.

Cruce idiomas y voces

Convierta en inglés, francés, alemán, italiano, japonés, español y portugués de Brasil. Detecta distintos dialectos como, por ejemplo, inglés de Estados Unidos y de Reino Unido, y español castellano, latinoamericano y de América del Norte.

Comience con Watson Text to Speech en minutos

Averigüe qué puede hacer Text to Speech por sus comunicaciones. Pruébelo gratis.