Cedat 85
Convertir la voz en un activo digital con soluciones Speech to Text basadas en una potente tecnología cognitiva
Dos hombres hablando en una calle con pequeños edificios al fondo

Acentos, dialectos, idiomas, voces: transformar esta información en un activo digital mediante el reconocimiento automático de voz es la misión de Cedat 85, que desarrolla soluciones que capturan el valor de la palabra hablada. Utilizando los servidores IBM Power Systems AC922, la empresa aceleró el entrenamiento de modelos de redes neuronales, reduciendo drásticamente el tiempo de comercialización de sus soluciones.

Reto empresarial

Con tantos matices en el habla, convertirlo en texto analizable es un gran desafío técnico. ¿Cómo podría Cedat 85 fortalecer su posición a la vanguardia de la tecnología de reconocimiento de voz?

Transformación

Cedat 85 aprovechó la potencia de los servidores acelerados de IBM para agilizar el entrenamiento de modelos de redes neuronales, lo que permitió a la empresa asumir más proyectos y ofrecer resultados antes.

Resultados El entrenamiento 2,4 veces más rápido de los modelos
reduce el tiempo de comercialización y aumenta la precisión de las soluciones
Incremento de los
ingresos al aumentar el alcance de nuevos proyectos y experimentos
Reconocimiento de miles de millones de palabras/día:
nuevas aplicaciones para el reconocimiento de voz
Historia de un desafío empresarial
Descubrir los secretos del habla

Durante más de cientos y miles de años, los humanos han utilizado el discurso para comunicar ideas y emociones complejas de forma rápida y eficaz. Sin embargo, el discurso por sí solo es muy difícil de analizar sin elaborar antes un registro escrito, lo que requiere tiempo y recursos.

La tecnología de reconocimiento de voz tiene como objetivo cambiarlo convirtiendo automáticamente la voz en texto escrito que se pueda analizar. Durante más de tres décadas, Cedat 85 ha estado haciendo avances en soluciones de voz a texto y ayudando a los clientes en medios de comunicación, gobierno, servicios financieros, seguros, tecnología, departamentos de marketing y contact centers para satisfacer demandas cada vez más complejas.

Enrico Giannotti, director general de Cedat 85, explica: "El discurso es un fenómeno muy sofisticado. Hablamos usando diferentes idiomas, dialectos y modelos lingüísticos. Dado que el habla es tan dinámico, en el que se inventan nuevas frases y las palabras existentes cambian de significado cada día, desarrollar soluciones de reconocimiento de voz puede ser como dar con un objetivo en movimiento".

Desde 2002, Cedat 85 ha construido sofisticadas redes neuronales para respaldar sus soluciones de voz a texto, y sus algoritmos se han vuelto más complejos y precisos con el tiempo. Para dar el siguiente salto en el desarrollo, la empresa quería acelerar los ciclos de formación de modelos. Antes, las limitaciones de infraestructura hacían que Cedat 85 tardara semanas o incluso meses en entrenar un modelo de red neuronal. Este proceso era arriesgado y llevaba mucho tiempo, ya que no se podía conocer la precisión del modelo hasta que se completaba el entrenamiento.

"Entrenamos nuestros modelos usando grandes cantidades de datos", comenta Giannotti. "Aunque aumentamos nuestra infraestructura con GPU para acelerar el procesamiento, todavía se tardó mucho en obtener resultados. Cada proyecto requería tanto tiempo y recursos que tuvimos que posponer oportunidades. Con la creciente popularidad de las soluciones analíticas y de voz, cada vez surgen nuevos mercados para la conversión de voz a texto. Para asegurarnos de no perder competencia, estábamos decididos a avanzar más rápido”.

Con los servidores IBM Power Systems AC922, podemos entrenar modelos de red neuronal 2,4 veces más rápido. Y, lo que es más importante, este ahorro de tiempo no se produce a costa de la precisión. Enrico Giannotti Director general Cedat 85
Historia de transformación
Conociendo las últimas innovaciones

Cuando Cedat 85 se enteró de los servidores IBM Power Systems AC922, que están diseñados para soportar la IA empresarial, aprovechó la oportunidad para compararlos con su infraestructura actual acelerada por GPU.

Giannotti recuerda: "Nos interesaba saber si IBM podía cumplir la promesa de un rendimiento sin precedentes para las cargas de trabajo de IA con su última generación de servidores Power Systems. Probamos la tecnología y pronto descubrimos que la respuesta era sí; superaban significativamente a nuestro entorno anterior".

Cedat 85 recurrió al socio comercial de IBM, Computer Gross Italia, para que le ayudara con la instalación y, en un par de días, la plataforma ya estaba en funcionamiento. Poco después, Cedat 85 ganó el concurso para un proyecto emblemático: “Save our Sounds”, una iniciativa de la Biblioteca Británica para preservar el patrimonio sonoro del Reino Unido. Cedat 85 se comprometió a ayudar a establecer un archivo de radio nacional, protegiendo el capital de audio de transmisiones de radio pasadas y futuras de estaciones de todo el Reino Unido mediante la transcripción del discurso a texto.

"Save our Sounds representa un gran hito para Cedat 85", dice Giannotti. "Para entregar el proyecto, necesitábamos enriquecer nuestros modelos. Por ejemplo, tenían que reconocer la rica variedad de acentos y dialectos que existen en el Reino Unido y capturar términos coloquiales. La nueva y más potente infraestructura de IBM llegó en el momento adecuado para respaldar estos esfuerzos".

Con el apoyo de la infraestructura de IBM, producimos miles de millones de palabras de texto de voz para nuestros clientes cada día. Al implementar los últimos servidores IBM Power Systems, nos aseguramos de seguir liderando el desarrollo de soluciones de voz a texto. Enrico Giannotti Director general Cedat 85
Historia de resultados
Hablar el lenguaje de la IA

Cedat 85 está aprovechando los servidores IBM Power Systems de datos y de computación intensiva para proporcionar resultados a los clientes a gran velocidad y calidad. Al reducir el tiempo de comercialización de sus soluciones, la infraestructura de IBM contribuye a una ventaja competitiva vital para la empresa.

"Con los servidores IBM Power Systems AC922, podemos entrenar modelos de red neuronal 2,4 veces más rápido", comenta Giannotti. “Y lo más importante es que este ahorro de tiempo no se produce a costa de la precisión. Hace poco ejecutamos un proyecto piloto para un cliente gubernamental donde necesitábamos adaptar nuestros modelos para adaptarse a diferentes acentos regionales y dialectos. En pocas semanas, aumentamos la precisión de nuestro modelo en inglés en casi un 10 por ciento cuando lo aplicamos a su caso de uso, un proceso que antes nos habría llevado meses. Esta mejora se reduce a una combinación de la experiencia de nuestros ingenieros de IA, nuestros algoritmos patentados y el procesamiento súper rápido de la infraestructura de IBM".

Los tiempos de entrenamiento más cortos también reducen el riesgo de Cedat 85, ya que los ingenieros no tienen que esperar tanto tiempo para averiguar si un modelo de red neuronal necesita ajustes. La compañía también ha aumentado su capacidad para asumir proyectos, lo que le permite capitalizar nuevas oportunidades.

"El despliegue de servidores IBM Power Systems AC922 nos permite ser más experimentales, ya que podemos probar cosas diferentes sin preocuparnos de inmovilizar nuestra infraestructura formando a un modelo defectuoso durante meses", explica Giannotti. "También podemos ser más proactivos con nuestros clientes actuales y potenciales, lo que nos ayuda a aumentar nuestros ingresos y nos permite rentabilizar nuestra inversión en soluciones IBM en pocos meses."

De cara al futuro, Cedat 85 está investigando cómo podría integrar otras tecnologías de IBM en sus ofertas. Específicamente, la empresa está explorando cómo las herramientas de IBM watsonx podrían ayudar a desbloquear valor adicional del texto para los clientes.

Giannotti concluye: "Con el apoyo de la infraestructura de IBM, producimos miles de millones de palabras de texto a partir de la voz para nuestros clientes cada día. Al implementar los últimos servidores IBM Power Systems, nos aseguramos de seguir liderando el desarrollo de soluciones de voz a texto. Ahora tenemos la oportunidad de asociarnos con IBM para aportar al mercado algo aún más especial".

Cedat 85

Cedat 85 es líder del mercado en tecnología y servicios de voz a texto con sede en Roma, Italia. La empresa cuenta con más de 500 clientes en todo el mundo, 33 años de experiencia y fue designada uno de los 11 principales actores mundiales y uno de los cinco principales en Europa para aplicaciones de voz a texto en el panorama competitivo de 2018 de Gartner. La empresa opera en todo el mundo a través de su marca internacional Speech-i.

De el siguiente paso

Para obtener más información sobre IBM Power Systems, póngase en contacto con su representante de IBM o con un socio comercial, o visite el siguiente sitio web: ibm.com/power

Ver más historias de clientes u obtener más información sobre IBM® Systems Hardware

Para obtener más información sobre Computer Gross Italia SpA, visite: computergross.it (enlace externo a ibm.com)

Notas a pie de página

© Copyright IBM Corporation 2019. IBM Corporation, IBM Cloud, New Orchard Road, Armonk, NY 10504

Producido en los Estados Unidos de América, agosto de 2019.

IBM, el logotipo de IBM, ibm.com e Power Systems son marcas comerciales de International Business Machines Corp., registradas en muchas jurisdicciones del mundo. Los demás nombres de productos y servicios pueden ser marcas registradas de IBM u otras empresas. Puede consultar una lista de las actuales marcas registradas de IBM en la web, en el apartado "Información sobre derechos de autor y marcas registradas" en www.ibm.com/es-es/legal/derechos de autor.

Linux es una marca registrada de Linus Torvalds en Estados Unidos, otros países o ambos.

La información contenida en este documento es la vigente en la fecha de su publicación original y está sujeta a cambios por parte de IBM. No todas las ofertas mencionadas en este documento están disponibles en todos los países en los que IBM está presente.

Los datos de rendimiento y ejemplos de clientes mencionados se presentan únicamente con fines ilustrativos. Los datos reales de rendimiento pueden variar en función de las configuraciones y condiciones de funcionamiento específicas. LA INFORMACIÓN DE ESTE DOCUMENTO SE OFRECE "TAL CUAL ESTÁ" SIN NINGUNA GARANTÍA, NI EXPLÍCITA NI IMPLÍCITA, INCLUIDAS, ENTRE OTRAS, LAS GARANTÍAS DE COMERCIALIZACIÓN, ADECUACIÓN A UN FIN CONCRETO Y CUALQUIER GARANTÍA O CONDICIÓN DE INEXISTENCIA DE INFRACCIÓN. Los productos de IBM están sujetos a garantía según los términos y condiciones de los acuerdos bajo los que se proporcionan.

El cliente es responsable de garantizar el cumplimiento de las leyes y reglamentos aplicables. IBM no presta asesoramiento legal ni declara o garantiza que sus servicios o productos aseguren que el cliente cumpla con cualquier ley o normativa.