IA agentique et interface web

Anthropic expérimente Claude en tant qu’agent agissant dans le navigateur Chrome

Anthropic déploie en test une version de son LLM Claude capable d’agir dans le navigateur Chrome. L’assistant peut cliquer, remplir des formulaires ou gérer des emails, mais cette capacité soulève des enjeux de sécurité importants.

Selon Anthropic, Claude est désormais capable de gérer un calendrier via le navigateur Chrome. (Source: Anthropic)
Selon Anthropic, Claude est désormais capable de gérer un calendrier via le navigateur Chrome. (Source: Anthropic)

Anthropic annonce le lancement d’une phase pilote, en accès restreint, visant à tester une extension pour Chrome, permettant au LLM Claude d’agir directement dans le navigateur. L’objectif: rendre l’assistant plus utile en lui donnant la capacité d’observer et de manipuler les interfaces web comme le ferait un humain. Cette phase d’essai implique un millier d’utilisateurs du plan Claude Max et vise à recueillir des retours sur l’utilité et la sécurité du système.

La société spécialisée dans la GenAI considère cette évolution comme «inévitable», soulignant qu’une grande partie des tâches numériques se font dans un navigateur. Claude est désormais capable de gérer un calendrier, planifier des rendez-vous, rédiger des réponses à des emails, ou encore traiter des notes de frais, selon Anthropic.

Risques et mesures de défense

Mais cette avancée s’accompagne de défis majeurs en matière de cybersécurité. En particulier, les agents IA agissant via un navigateur sont vulnérables aux attaques par injection de prompt. Celles-ci consistent à dissimuler dans une page web ou un email des instructions invisibles incitant l’IA à effectuer des actions indésirables, sans validation de l’utilisateur. Anthropic cite l’exemple d’un email demandant la suppression de messages pour des raisons de «sécurité», instruction que Claude avait suivie à tort lors de premiers tests.

Des tests d’attaque menés en interne ont révélé un taux de réussite de près d’un quart pour ce type d’injection avant l’ajout de mesures de protection. L’introduction de nouveaux garde-fous a permis de réduire ce taux à environ un dixième. Sur un ensemble de scénarios spécifiques au navigateur, comme des champs de formulaires cachés dans le code HTML, les défenses mises en place ont ramené le taux de succès de plus d’un tiers à zéro, selon Anthropic. Parmi les protections activées: des permissions site par site, des confirmations d’action pour les tâches sensibles (publication, achat, partage de données personnelles) et un blocage automatique des sites à haut risque (finance, contenu adulte ou piraté). Claude serait également en mesure de détecter les comportements suspects, même sous des formes nouvelles.

Mais Anthropic concède que ces mécanismes de défense  restent perfectibles. Le programme pilote a pour but d’élargir la base des scénarios d’usage et d’attaque, en conditions réelles. Les résultats permettront d’ajuster les systèmes de détection, d’affiner les modèles sous-jacents et de développer de nouveaux contrôles de permission adaptés aux attentes des utilisateurs.
 

Webcode
A2VS2TN7