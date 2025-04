Les réseaux neuronaux, les grands modèles de langage (LLMs) et les modèles d’apprentissage profond dépendent largement de la qualité et de l’intégrité des données d’entraînement, qui déterminent en fin de compte les fonctions d’un modèle. Ces données d’entraînement peuvent provenir de différentes sources, telles qu’Internet, des bases de données gouvernementales et des fournisseurs de données tiers. En injectant des points de données incorrects ou biaisés (données empoisonnées) dans ces jeux de données, les acteurs de la menace peuvent modifier le comportement d’un modèle de manière subtile ou radicale.

Par exemple, la manipulation des données par empoisonnement peut conduire à une classification erronée des données, ce qui réduit l’efficacité et la précision des systèmes d’IA et de ML. De plus, ces attaques peuvent présenter des risques graves liés à la cybersécurité, en particulier dans des secteurs comme la santé et les véhicules autonomes.