AgentDoc rédige, met en forme et structure votre document en direct pendant que vous parlez — sur votre téléphone ou votre ordinateur portable. Sans saisie, sans menus.
Que vous soyez dans les transports, en train de dicter un brouillon sur votre téléphone ou simplement plus à l'aise à l'oral qu'au clavier — AgentDoc s'articule autour de votre façon naturelle de penser.
Toute personne qui préfère parler plutôt que taper. Dictez une lettre de motivation dans le bus, rédigez un rapport entre deux réunions ou écrivez un long e-mail sans déverrouiller le clavier. L'agent écoute, rédige et met en forme en direct.
Conçu pour les personnes ayant un handicap moteur, des troubles musculo-squelettiques, ou pour quiconque trouve qu'une interface souris-clavier est fatigante ou impossible à utiliser. Chaque opération est accessible uniquement à la voix.
Le même backend expose chaque opération sur le document sous forme d'outil MCP typé, afin que des agents LLM autonomes puissent lire, écrire, mettre en forme et naviguer dans les documents sans aucune intervention humaine. Voir /agents.
Une boîte à outils ciblée et soigneusement conçue – pensée autour des fondamentaux qui comptent le plus pour les agents et pour les utilisateurs de la voix d'abord.
Propulsée par Google Gemini Live. Parlez naturellement – l'agent comprend le contexte, se souvient des modifications précédentes et confirme chaque action à voix haute.
Chaque opération est exposée sous forme d'outil MCP. Les agents IA peuvent créer, modifier et naviguer dans les documents de façon autonome via un protocole standardisé – sans bidouille.
Couleurs, polices, tailles, surlignages, gras, italique, indice, exposant, retraits – le tout appliqué en langage naturel, sans barre d'outils.
Pagination A4 automatique. Exportez des PDF au pixel près ou du Word natif (.docx) à la demande. Importez aussi vos documents Word existants – polices, couleurs, sauts de page, en-têtes et pieds de page tous préservés.
Une double architecture WebSocket garantit que l'affichage se met à jour à l'instant même où l'agent modifie le document – sans interrogation périodique, sans rafraîchissement.
Authentification par JWT, isolation des documents par utilisateur, assainissement DOMPurify et protection en périphérie Cloudflare – durci pour la production dès le premier jour.
Que vous tapiez, parliez ou lanciez un agent automatisé – le déroulement reste toujours la même boucle simple.
Ouvrez le panneau de discussion ou appuyez sur le microphone. Décrivez ce que vous voulez en langage courant : « Crée un titre intitulé Introduction » ou « Mets le deuxième paragraphe en italique ».
L'agent IA traduit votre intention en appels d'outils MCP précis – il trouve les bons indices de caractères, insère ou supprime des chaînes et applique les jetons de mise en forme.
Le backend publie un événement WebSocket. L'éditeur réaffiche la vue A4 paginée en temps réel. L'agent confirme ce qu'il a fait – à la voix ou par écrit.
AgentDoc est le banc d'essai empirique d'une thèse en cours évaluant l'impact de la conception des outils sur la fiabilité des agents IA.
Ce projet sous-tend une thèse scientifique évaluant la granularité des outils, leur prolifération et les contraintes de flux de travail sur les agents LLM opérant dans un contexte d'édition de documents. Le banc d'essai mesure la précision des agents via la distance de Levenshtein, la consommation de jetons et les taux d'hallucination sur 20 configurations de flux de travail contrôlées (A–T) et 13 scénarios de référence.