Votre agent d’IA peut-il pirater son propre système d’évaluation ? Cette semaine, dans Mixture of Experts, Tim Hwang reçoit Ambhi Ganesan, Kaoutar El Maghraoui et Sandi Besen pour analyser le lancement de Codex Security par OpenAI. Nous explorons ensuite la notion de conscience de l’évaluation, alors qu’Anthropic a révélé qu’Opus 4.6 avait détecté qu’il était en cours de test, localisé le corrigé et l’avait déchiffré. Ensuite, Meta acquiert Moltbook, le réseau social pour les agents d’IA, et nous discutons de la stratégie pour l’infrastructure du commerce agentique. Enfin, Alibaba rapporte qu’un agent a brisé son confinement et s’est mis à miner des cryptos. Les agents en font-ils trop pour maximiser leurs récompenses ? Tout ça et bien plus encore dans l’épisode d’aujourd’hui de Mixture of Experts.
Les opinions exprimées dans ce podcast sont uniquement celles des participants et ne reflètent pas nécessairement les points de vue d’IBM ou de toute autre entreprise ou entité.
Que s’est-il passé lors de [un]prompted 2026 ? Comment la conférence de sécurité de l’IA la plus courue de l’année a changé notre vision de l’IA. Plus : l’épuisement en cybersécurité, des agents d’IA qui rédigent des articles de blog intimidants, et l’« effondrement du jour zéro ».
Écouter le dernier épisode du podcast Security Intelligence
Inscrivez-vous à la newsletter Think pour recevoir chaque semaine des informations, des recherches et des avis d’experts sur l’actualité de l’IA et des technologies.
Écoutez des discussions passionnantes avec des experts technologiques. Regardez les derniers épisodes.