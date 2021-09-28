Aunque el reconocimiento del habla suele confundirse con el reconocimiento de la voz, este último se centra en la traducción del habla de un formato verbal a otro textual, mientras que el primero sólo trata de identificar la voz de un usuario concreto.

IBM ha desempeñado un papel destacado en el reconocimiento de voz desde su creación, con el lanzamiento de "Shoebox" en 1962. Esta máquina era capaz de reconocer 16 palabras diferentes, lo que suponía un avance del trabajo inicial de los Laboratorios Bell de los años cincuenta. Sin embargo, IBM no se detuvo ahí, sino que continuó innovando a lo largo de los años, lanzando la aplicación VoiceType Simply Speaking en 1996. Este software de reconocimiento de voz tenía un vocabulario de 42 000 palabras, admitía inglés y español, e incluía un diccionario de ortografía de 100 000 palabras.

Aunque la tecnología del habla tenía un vocabulario limitado en sus inicios, hoy en día se utiliza en un gran número de sectores, como la automoción, la tecnología y la sanidad. Su adopción no ha hecho más que acelerarse en los últimos años debido a los avances en el deep learning y el big data. Las investigaciones (enlace externo a ibm.com) muestran que se espera que este mercado tenga un valor de 24 900 millones de dólares en 2025.