Albert, Mistral et Guillaume Tell

Comment a été développée Albert, l’IA générative de l’Etat français

L’IA de l’Etat français s’appelle Albert. ICTjournal s’est entretenu avec l’un de ses concepteurs, qui explique comment a été développé un modèle d’IA générative pour assister les agents chargés de répondre aux demandes en ligne des citoyens. Basé sur Mistral, ce modèle s’appelle Guillaume Tell…

En visite dans une agence de France Service utilisant l’outil Albert, le premier ministre français Gabriel Attal a plaidé pour mettre l’IA au service des Français.
En visite dans une agence de France Service utilisant l’outil Albert, le premier ministre français Gabriel Attal a plaidé pour mettre l’IA au service des Français.

«Dites bonjour à Albert», c’est ainsi que le premier ministre français Gabriel Attal a levé le voile sur l’IA générative développée depuis plusieurs mois par son service en charge du numérique (la DINUM en franco-français).

Présenté comme une IA 100% française, l’outil ‘Albert est destiné au personnel de l’administration. Il servira notamment à pré-rédiger les réponses aux millions de demandes en ligne que l’Etat français reçoit chaque année, à pré-instruire les projets environnementaux ou encore à automatiser la retranscription d’audiences judiciaires et de compte-rendus médicaux.

Le jeune chef du gouvernement français a donné les messages rassurants de rigueur: les informations livrées par l’IA seront vérifiées, la technologie ne va pas remplacer les agents de l’Etat mais leur faciliter la vie et, in fine, les usagers profiteront de services publics plus humains.

Guillaume Tell apprend à écrire pour l'administration française

L’outil Albert a été développé depuis juin 2023 par une équipe d’une dizaine d’ingénieurs au sein de la DINUM. ICTjournal s’est entretenu avec l’un d’entre eux, Pierre-Carl Langlais, qui a co-créé tout récemment la société Pleias. Il a notamment participé au développement du modèle Guillaume Tell (!), qui permet à Albert de répondre aux demandes en ligne des citoyens à l’administration française.

Hébergé sur l’infrastructure de l’Etat français, Guillaume Tell est actuellement basé sur le modèle Mistral 7B, mais il devrait être ré-entraîné sur Llama 3. Les concepteurs ont utilisé diverses techniques pour que le modèle assiste efficacement les agents des services publics chargés de répondre aux demandes en ligne. Il faut ainsi que le modèle exploite correctement les informations de l’Etat, produise des contenus vérifiables et épouse le ton de l’administration.

Fine-tuning et RAG

Pierre-Carl Langlais explique que le projet recourt à la technique RAG pour récupérer les informations contenues dans les documents de l’administration. Ces derniers (en général des PDF) ont ainsi été découpés en «chunks» de 300 mots.

Mais l’adaptation du modèle de Mistral ne se limite pas au RAG, le modèle a aussi été passablement ré-entraîné (fine-tuning). D’abord, les concepteurs l’ont calibré pour qu’il épouse un style adéquat en français, en recourant notamment au feedback des agents (RLHF) pour donner au modèle des exemples de réponses à suivre et d’autres à éviter.

En complémentarité du RAG, ils ont par ailleurs travaillé à améliorer la capacité du modèle à puiser dans de longs PDF. Pierre-Carl Langlais souligne à cet égard que les modèles actuels étant entraînés sur des contenus web, ils ne sont pas optimaux pour les PDF.

Enfin, le spécialiste indique que le modèle a été entraîné à bien utiliser les sources et citations. En arbitrant entre l’impératif que les informations produites soient vérifiables et celui que les contenus soient digestes et pas la simple copie de ce qui figure dans les originaux. Il explique s’être inspiré de la manière dont les articles Wikipedia sourcent les informations.

Orienter le modèle en continu

Ce travail permet de réduire les hallucinations liées au modèle sous-jacent (aujourd’hui Mistral, demain Llama), mais pas de les éliminer complètement. Pierre-Carl Langlais déplore le manque de transparence quant aux contenus sur lesquels sont entraînés les modèles. Idéalement, il faudrait entraîner un modèle neuf avec des sources fiables et contrôlées, et des PDF. Il précise néanmoins: «Via les feedbacks des utilisateurs, on jugule, et on oriente le modèle en continu».

Après quelques projets pilotes, la question est maintenant du passage à l’échelle, sachant qu’une cinquantaine d’agences de l’Etat français s’intéressent à utiliser Albert. La solution va sans doute consister à utiliser un même modèle et à recourir au RAG pour les spécificités de chaque domaine.

Webcode
Qm89Wi27