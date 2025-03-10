Certains, comme les chercheurs de l'université des postes et télécommunications de Pékin, conçoivent actuellement de petits modèles linguistiques spécialement destinés aux smartphones. L’équipe a constaté que les petits modèles de langage fonctionnent « plus rapidement et plus efficacement » lorsqu’ils sont conçus pour le matériel sur lequel ils fonctionneront, plutôt que de finir un modèle plus grand pour l’utiliser sur un téléphone, explique la co-auteure Rongjie Yi à IBM Think.

Pourquoi la course aux téléphones avec IA s’accélère-t-elle maintenant ? Les progrès réalisés dans le domaine des petits modèles de langage (SLM) propulsent cette évolution dans la technologie mobile, affirme M. El Maghraoui. « Ces modèles compacts, plus efficaces et plus performants peuvent effectuer un traitement en temps réel et créer des interactions personnalisées et sécurisées sur des appareils périphériques comme les smartphones », explique-t-elle.

M. El Maghraoui ajoute qu'au fur et à mesure que les gens utilisent les SLM sur les smartphones, nous pouvons tirer des leçons qui seront en fait plus utiles en dehors de l'arène des consommateurs. Les petits modèles sont pratiques pour les téléphones, mais essentiels pour « des applications plus sérieuses et critiques, telles que les dispositifs embarqués dans les usines où des données de fabrication sensibles doivent être traitées localement ».

Qu'il s'agisse de services financiers, de soins de santé ou de fabrication, il existe de nombreuses situations dans lesquelles les entreprises disposent de données qu'elles souhaitent conserver sur site. Les petits modèles leur permettent d'extraire des informations utiles de ces données sans avoir à les envoyer sur un cloud public.

C'est pourquoi IBM a donné la priorité à des modèles plus petits et adaptés aux besoins, tels que sa série Granite, car ils permettent aux entreprises de rechercher des performances de pointe à un coût bien inférieur.

Le président et PDG d’IBM, Arvind Krishna, a expliqué dans un article de Fortune : « Dans notre travail chez IBM, nous avons constaté que les modèles adaptés à leur usage ont déjà conduit à des réductions allant jusqu’à 30 fois sur les coûts d’inférence de l’IA, rendant la formation plus efficace et accessible. »

Dans de nombreuses entreprises, « les contraintes de temps et de précision sont plus strictes », explique M. El Magrahoui. Tout retard ou erreur peut entraîner la perte d'importantes sommes d'argent ou compromettre la sécurité des données, voire plus.

« Vous ne pouvez pas vous permettre de commettre une erreur dans ce type d'environnement, car les conséquences sont bien plus graves qu'une simple erreur de programmation d'un vol, par exemple », explique-t-elle.

Alors que les utilisateurs continuent d'expérimenter des téléphones alimentés par le SLM avec IA-premier, ceux qui travaillent dans d'autres domaines Continuer de suivre de près les enseignements tirés de ces appareils edge.