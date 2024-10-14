Les experts affirment que la voie à suivre ne se limite pas à la réduction des coûts. « Vous pouvez utiliser l’IA générative pour améliorer l’efficacité de votre codage ; la façon dont vous codez une application peut la rendre plus ou moins gourmande en énergie. Certaines estimations suggèrent que vous pouvez réduire la consommation d’énergie d’une application jusqu’à 50 % en passant à un meilleur langage de programmation et à un code plus efficace.

Les entreprises utilisent également l'IA générative pour optimiser l'aménagement des centres de données et améliorer la conception des serveurs. « L’IA générative peut améliorer l’efficacité de vos capacités de calcul et l’efficacité de vos ressources de calcul de différentes manières », explique M. Dencik. « Ceci peut faire partie de la solution, plutôt que d'être simplement la source du problème. »

Masood suggère des stratégies supplémentaires : « Il existe des moyens créatifs pour relever ces défis, comme le routage LLM, ou l’orientation intelligente des requêtes entrantes vers le modèle de langage le plus approprié en fonction de facteurs tels que la complexité, le coût et les performances, garantissant une utilisation efficace des ressources et des résultats optimaux. » Il évoque également « la réduction des coûts d’exécution des LLM en réduisant leur taille et en les accélérant ». Le recours à la quantification pour réduire la mémoire nécessaire au modèle et à un ajustement fin efficace pour accélérer la formation permet de réduire les coûts matériels et d’accélérer les temps de traitement, ce qui rend ces modèles plus abordables à déployer et à utiliser. »

La complexité croissante des modèles d’IA est un autre facteur d’augmentation des coûts. M. Dencik recommande une approche stratégique : « Vous n’avez pas besoin d’utiliser de grands modèles de language pour tout », affirme-t-il. « Un petit modèle entraîné sur des données de haute qualité peut être plus efficace et obtenir les mêmes résultats, voire de meilleurs résultats, selon la tâche à accomplir. Il est essentiel de sélectionner le modèle approprié, mais il peut être préférable de réutiliser et d’affiner les modèles existants plutôt que d’en créer de nouveaux pour chaque nouvelle tâche pour laquelle vous souhaitez utiliser l’IA. »

Il préconise une approche multimodale et multimodèle du déploiement de l’IA : « Pour être rentable, vous devriez permettre à votre entreprise d’évoluer vers une utilisation multimodale et multimodèle de l’IA et disposer d’une plateforme qui vous permette de le faire au sein de l’entreprise, explique-t-il. Bien que cela puisse sembler plus complexe, c’est un moyen pour votre entreprise de tirer le meilleur parti de l’IA de la manière la plus rentable possible. »

Les préoccupations en matière de développement durable influencent également le coût total de possession des systèmes d'IA. Bien que les coûts énergétiques soient en grande partie cachés dans les dépenses cloud, plutôt que d’apparaître directement sur les factures du quotidien, la sensibilisation de l’impact environnemental de l’IA générative est croissante. « Ce n’est pas seulement un coût économique ; c’est un coût environnemental lié à l’utilisation de l’IA », explique M. Dencik. Il cite des pratiques émergentes comme les « opérations vertes », qui visent à optimiser l’utilisation du cloud pour réduire l’impact environnemental.

Face à ces défis, apprendre à gérer efficacement les coûts informatiques pourrait devenir un facteur de différenciation clé sur le marché. Le rapport conclut que « les PDG qui maîtrisent le mieux ces coûts seront capables de gérer leur entreprise comme une machine ultra-performante, en réduisant les freins tout en utilisant les technologies les plus récentes pour devancer la concurrence. »