Cedat85
Transformer la parole en un actif numérique grâce à des solutions de Speech to Text basées sur une technologie cognitive puissante
Deux hommes discutant dans une rue avec de petits bâtiments en arrière-plan

Accents, dialectes, langues, voix : transformer ces informations en actifs numériques à l’aide de la reconnaissance vocale automatique, telle est la mission de Cedat85, qui développe des solutions pour extraire de la valeur de la parole. À l’aide de serveurs IBM Power Systems AC922, l’entreprise a accéléré l’entraînement de modèles de réseaux neuronaux, réduisant ainsi les délais de commercialisation de ses solutions.

Défi

Les nombreuses nuances dans la parole rendent difficile sa conversion en un texte analysable d’un point de vue technique. Comment Cedat85 pourrait-il renforcer sa position de leader de la technologie de reconnaissance vocale ?

Transformation

Cedat85 a exploité la puissance des serveurs accélérés d’IBM pour accélérer l’entraînement des modèles de réseaux neuronaux, ce qui a permis à l’entreprise de prendre en charge davantage de projets et de fournir des résultats plus rapidement.

Résultats 2,4 fois plus rapide
pour entraîner les modèles, ce qui réduit les délais de mise sur le marché et améliore la précision des solutions
Booste
les revenus en augmentant les possibilités de nouveaux projets et expérimentations
Des milliards de mots/jour
sont reconnus, ce qui permet le développement d’applications inédites de reconnaissance vocale
Description du défi
Découvrir les secrets de la parole

Depuis des centaines de milliers d’années, les humains utilisent la parole pour communiquer rapidement et efficacement des idées et des émotions complexes. La parole seule, cependant, est très difficile à analyser sans d’abord produire une trace écrite, ce qui nécessite du temps et des ressources.

La technologie de reconnaissance vocale vise à changer cela en convertissant automatiquement la parole en un texte écrit qui peut être analysé. Depuis plus de trente ans, Cedat85 élabore des solutions de Speech to Text innovantes et permet à ses clients des secteurs des médias, du gouvernement, des finances, des assurances, de la technologie, des départements marketing et des centres d’appel de répondre à des demandes de plus en plus complexes.

Enrico Giannotti, directeur général de Cedat85, explique : « La parole est un phénomène très sophistiqué. Nous parlons en utilisant des langues, des dialectes et des modèles linguistiques différents. La parole est très dynamique : chaque jour, de nouvelles expressions sont inventées et le sens des mots existants évolue. Le développement de solutions de reconnaissance vocale est donc un travail périlleux. »

Depuis 2002, Cedat85 conçoit des réseaux neuronaux sophistiqués pour soutenir ses solutions de Speech to Text, ses algorithmes devenant plus complexes et plus précis au fil du temps. Pour franchir une nouvelle étape dans le développement, l’entreprise souhaitait accélérer les cycles d’entraînement des modèles. Auparavant, en raison des limitations de l’infrastructure, il fallait à Cedat85 des semaines, voire des mois, pour entraîner un modèle de réseau neuronal. Ce processus était risqué et prenait beaucoup de temps, car il ne permettait pas de connaître la précision du modèle tant que l’entraînement n’était pas terminée.

« Nous entraînons nos modèles à l’aide de grandes quantités de données », commente M. Giannotti. « Même si nous avions augmenté notre infrastructure avec des GPU pour accélérer le traitement, il fallait toujours beaucoup de temps pour obtenir des résultats. Chaque projet était tellement chronophage et gourmand en ressources que nous avons dû reporter des opportunités. Avec la popularité croissante des solutions analytiques et vocales, de nouveaux marchés émergent en permanence pour la technologie Speech to Text. Pour ne pas nous laisser distancer par nos concurrents, nous étions déterminés à avancer plus vite. »

Grâce aux serveurs IBM Power Systems AC922, nous pouvons entraîner les modèles de réseaux neuronaux 2,4 fois plus rapidement. Et surtout, ces gains de temps ne se font pas au détriment de la précision. Enrico Giannotti Directeur général Cedat85
Description de la transformation
Être informé des dernières innovations

Lorsque Cedat85 a entendu parler des serveurs IBM Power Systems AC922, conçus pour prendre en charge l’IA d’entreprise, il a sauté sur l’occasion de les comparer à son infrastructure existante accélérée par GPU.

M. Giannotti se souvient : « Nous voulions savoir si IBM pouvait tenir la promesse de performances sans précédent pour les workloads d’IA avec sa dernière génération de serveurs Power Systems. Nous avons testé la technologie et nous avons rapidement constaté que la réponse était oui : IBM a largement surpassé notre environnement précédent. »

Cedat85 a fait appel à Computer Gross Italia, un partenaire commercial d’IBM, pour l’accompagner dans l’installation et, en quelques jours, la plateforme était opérationnelle. Peu après, Cedat85 a remporté un appel d’offres pour un projet emblématique : « Save our Sounds », une initiative de la British Library visant à préserver le patrimoine sonore du Royaume-Uni. Cedat85 a été engagé pour aider à constituer une archive radio nationale et préserver ainsi le capital audio des émissions radio passées et futures des stations à travers le Royaume-Uni en transcrivant la parole en texte.

« Save our Sounds est une étape importante pour Cedat85 », explique M. Giannotti. « Pour mener à bien ce projet, nous avions besoin d’enrichir nos modèles. Par exemple, il fallait qu’ils soient capables de reconnaître la grande variété d’accents et de dialectes qui existent au Royaume-Uni, et de saisir les termes familiers. La nouvelle infrastructure IBM, plus puissante, est arrivée pile au bon moment pour soutenir ces efforts. »

Grâce à l’infrastructure IBM, nous produisons chaque jour des milliards de mots de texte issus de la parole pour nos clients. En déployant les derniers serveurs IBM Power Systems, nous nous assurons de continuer à montrer la voie en matière de développement de solutions Speech to Text. Enrico Giannotti Directeur général Cedat85
Description des résultats
Parler le langage de l’IA

Cedat85 tire parti des serveurs IBM Power Systems à forte intensité de données et de calcul pour fournir des résultats aux clients avec une rapidité et une qualité exceptionnelles. En réduisant le temps de mise sur le marché de ses solutions, l’infrastructure IBM contribue à donner à l’entreprise un avantage concurrentiel vital.

« Grâce aux serveurs IBM Power Systems AC922, nous pouvons entraîner les modèles de réseaux neuronaux 2,4 fois plus rapidement », commente M. Giannotti. « Et surtout, ces gains de temps ne se font pas au détriment de la précision. Nous avons récemment mené à bien un projet pilote pour un client gouvernemental dans le cadre duquel nous devions adapter nos modèles pour tenir compte des différents accents et dialectes régionaux. En quelques semaines, nous avons augmenté la précision de notre modèle de langue anglaise de près de 10 % lorsqu’il est appliqué à son cas d’utilisation. Par le passé, ce processus nous aurait pris des mois. Cette amélioration est due à la combinaison de l’expertise de nos ingénieurs en IA, de nos algorithmes propriétaires et du traitement ultra-rapide de l’infrastructure IBM. »

Les temps d’entraînement plus courts réduisent également les risques pour Cedat85, car les ingénieurs n’ont pas à attendre aussi longtemps pour savoir si un modèle de réseau neuronal a besoin d’être perfectionné. L’entreprise a également augmenté sa capacité à prendre en charge des projets, ce qui lui permet de tirer parti de nouvelles opportunités.

« Le déploiement de serveurs IBM Power Systems AC922 nous permet de faire davantage d’expérimentations, car nous pouvons essayer différentes choses sans nous soucier d’immobiliser notre infrastructure pour entraîner un modèle défectueux pendant des mois », explique M. Giannotti. « Nous pouvons également être plus proactifs avec nos clients existants et potentiels, ce qui nous permet d’accroître nos revenus et de rentabiliser les solutions IBM en quelques mois. »

Cedat85 explore les façons dont il pourra intégrer d’autres technologies IBM à ses offres à l’avenir. Plus précisément, l’entreprise étudie la façon dont les outils IBM Watson peuvent l’aider à générer une valeur supplémentaire à partir du texte pour les clients.

M. Giannotti conclut : « Grâce à l’infrastructure IBM, nous produisons chaque jour des milliards de mots de texte issus de la parole pour nos clients. » En déployant les derniers serveurs IBM Power Systems, nous nous assurons de continuer à montrer la voie en matière de développement de solutions Speech to Text. Ensuite, nous avons la possibilité de faire équipe avec IBM pour apporter quelque chose de spécial sur le marché. »

Cedat85

Cedat85 est un leader du marché dans la technologie et les services de Speech to Text basé à Rome, en Italie. L’entreprise compte plus de 500 clients dans le monde, possède 33 ans d’expérience et a été désignée comme l’un des 11 premiers acteurs mondiaux et l’un des cinq premiers en Europe pour les applications Speech to Text dans le paysage concurrentiel 2018 de Gartner. L’entreprise opère dans le monde entier grâce à sa marque internationale Speech-i.

Passez à l’étape suivante

Pour en savoir plus sur IBM Power Systems, veuillez contacter votre interlocuteur IBM habituel ou votre partenaire commercial IBM, ou visitez le site Web suivant : ibm.com/power

Découvrez d’autres témoignages de clients ou apprenez-en davantage sur IBM Systems Hardware

Pour en savoir plus sur Computer Gross Italia SpA, visitez : computergross.it (lien externe à ibm.com)

Notes de bas de page

© copyright IBM corporation 2019. IBM Corporation, IBM Cloud, New Orchard Road, Armonk, NY 10504

Produit aux Etats-Unis, août 2019.

IBM, le logo IBM, ibm.com et Power Systems sont des marques commerciales d’International Business Machines Corp., déposées dans de nombreux pays. Les autres noms de produits et de services peuvent être des marques d’IBM ou d’autres sociétés. La liste actualisée des marques d’IBM est disponible sur la page Web « Copyright and trademark information » à l’adresse www.ibm.com/fr-fr/legal/copytrade.shtml.

Linux est une marque déposée de Linus Torvalds aux États-Unis et/ou dans d'autres pays.

Les informations contenues dans le présent document étaient à jour à la date de sa publication initiale. Elles peuvent être modifiées sans préavis par IBM. Les offres mentionnées dans le présent document ne sont pas toutes disponibles dans tous les pays où la société IBM est présente.

Les données de performance et les exemples de clients cités sont présentés à titre informatif uniquement. Les résultats des performances peuvent varier en fonction des configurations et des conditions de fonctionnement. LES INFORMATIONS CONTENUES DANS LE PRÉSENT DOCUMENT SONT FOURNIES « EN L’ÉTAT », SANS AUCUNE GARANTIE EXPLICITE OU IMPLICITE, NOTAMMENT SANS AUCUNE GARANTIE DE QUALITÉ MARCHANDE, D’ADÉQUATION À UN USAGE PARTICULIER ET AUCUNE GARANTIE OU CONDITION D’ABSENCE DE CONTREFAÇON. Les produits IBM sont garantis conformément aux dispositions des contrats qui régissent leur utilisation.

Il incombe au client de respecter les lois et réglementations qui lui sont applicables. IBM ne fournit pas de conseils juridiques et ne déclare ni ne garantit que ses services ou produits garantiront que le client est en conformité avec la législation ou la réglementation en vigueur.