Les ordinateurs peuvent-ils devenir autonomes ? C’est le pari derrière Simular, une startup qui crée des agents d’IA capables d’utiliser des ordinateurs comme les humains. IBM Think a discuté des ordinateurs agentiques avec Ang Li, PDG et cofondateur de Simular, qui a travaillé chez Google DeepMind et au sein de la division conduite autonome de Baidu.
Selon Li, lorsque nous interagissons avec un ordinateur, les humains passent beaucoup de temps à effectuer des mouvements inutiles. Par exemple, selon une étude qu’il a menée avec son équipe, l’utilisateur moyen passe jusqu’à cinq heures par jour à déplacer une souris.
« Le clavier et la souris, ce n’est pas naturel », a-t-il déclaré dans une interview accordée à IBM Think. « Notre génération y est encore habituée, mais la précédente ne l’était pas, et peut-être que la suivante ne le sera pas non plus. » Selon M. Li, nous devrions plutôt nous pencher sur la façon dont les humains fonctionnent pour déterminer comment l’IA évolue. « La technologie tente de créer quelque chose de facile à communiquer, comme la parole, et essaie de faire en sorte que cette machine se comporte comme un humain, afin que nous puissions interagir de manière plus naturelle. »
Simular imagine un avenir où les ordinateurs fonctionneront comme des systèmes entièrement autonomes. « Tout le monde pense que l’AGI [intelligence artificielle générale] fonctionne comme des robots humanoïdes, des voitures autonomes », a déclaré M. Li. « Je pense que c’est certainement l’une des directions, mais que se passerait-il si les ordinateurs pouvaient faire tout le travail que je fais ? C’est déjà de l’intelligence au niveau humain. » Li estime que cela est possible aujourd’hui, grâce aux avancées technologiques comme les frameworks open source et les systèmes multi-agents.
Simular a été lancé sur macOS au début du printemps en tant que navigateur natif, dans le but de prendre en charge les tâches les plus banales et répétitives qui peuvent enliser les gens dans un travail qui n’est pas épanouissant ou qui manque d’impact. Au lieu de fonctionner sur le cloud, l’agent de Simular fonctionne en local via un navigateur WebKit natif. Il fonctionne de manière autonome en coulisses et permet aux utilisateurs d’intervenir à tout moment.
Selon la vision de Li, les humains resteront dans la boucle et coexisteront avec les agents. « Les agents commettent encore beaucoup d’erreurs, c’est pourquoi il est important que les humains aient la possibilité d’intervenir immédiatement », a-t-il déclaré. « C’est comme le PDG d’une entreprise. Si vous voulez envoyer un salaire ou envoyer de l’argent à une autre entreprise, vous avez toujours besoin de quelqu’un pour signer, n’est-ce pas ? »
La navigation agentique est un domaine où il faut jouer des coudes et la concurrence s’intensifie cette année. The Browser Company vient de lancer Dia, sa propre version de la navigation agentique, pour les utilisateurs de son ancien produit phare, Arc.
« L’IA va changer la façon dont nous interagissons avec notre ordinateur et les usages pour lesquels nous nous tournons vers lui », a déclaré Josh Miller, PDG de The Browser Company, lors d’un récent podcast.
En janvier, OpenAI a lancé Operator, un agent autonome pour les tâches basées sur un navigateur. Quelques semaines plus tard, Perplexity a donné un aperçu de son propre navigateur d’IA, Comet, qui n’a pas encore été lancé. « La raison pour laquelle nous créons ce navigateur est qu’il pourrait s’agir de la meilleure façon de créer des agents », a déclaré Aravind Srinivas, PDG de Perplexity, lors d’une interview accordée à The Verge en avril dernier.
M. Li, qui a publié à l’automne dernier un article avec cette équipe sur un framework agentique ouvert qui utilise les ordinateurs comme des humains, estime que le rythme de l’innovation dans le domaine de l’IA agentique s’accélère. « Je pense qu’il est bon que plus de personnes travaillent sur ce sujet », a-t-il dit.
Il est convaincu que les humains, dans un avenir proche, pourront simplement se concentrer sur l’innovation créative. « Si la technologie est suffisamment performante, tout le monde portera une petite boîte ou quelque chose d’encore plus petit », ajoute-t-il. « Ensuite, il suffit de parler à la boîte, et elle fera le travail pour vous. Vous n’êtes pas obligé de regarder un écran. C’est l’avenir que je vois. »
