🎤 Parlez, ne tapez plus

Rédigez vos lettres et documents à la voix.

AgentDoc rédige, met en forme et structure votre document en direct pendant que vous parlez — sur votre téléphone ou votre ordinateur portable. Sans saisie, sans menus.

Inscrivez-vous & dictez → Voir comment ça marche

Conçu pour celles et ceux qui préfèrent parler.

Que vous soyez dans les transports, en train de dicter un brouillon sur votre téléphone ou simplement plus à l'aise à l'oral qu'au clavier — AgentDoc s'articule autour de votre façon naturelle de penser.

🎤

Adeptes de la voix d'abord

Toute personne qui préfère parler plutôt que taper. Dictez une lettre de motivation dans le bus, rédigez un rapport entre deux réunions ou écrivez un long e-mail sans déverrouiller le clavier. L'agent écoute, rédige et met en forme en direct.

  • Commande vocale complète — aucun clic, aucun menu
  • Mise en forme en temps réel pendant que vous parlez
  • Fonctionne sur téléphone, tablette et ordinateur portable
  • Export en .docx ou PDF une fois terminé
♿️

Cas d'usage en accessibilité

Conçu pour les personnes ayant un handicap moteur, des troubles musculo-squelettiques, ou pour quiconque trouve qu'une interface souris-clavier est fatigante ou impossible à utiliser. Chaque opération est accessible uniquement à la voix.

  • Aucun clic, glisser-déposer ni saisie requis
  • Retour vocal après chaque modification
  • Structure DOM compatible avec les lecteurs d'écran
  • Gratuit, en ligne, sans installation
🤖

Pour les développeurs : une API pensée pour les agents

Le même backend expose chaque opération sur le document sous forme d'outil MCP typé, afin que des agents LLM autonomes puissent lire, écrire, mettre en forme et naviguer dans les documents sans aucune intervention humaine. Voir /agents.

  • Suite complète d'outils MCP (lire, insérer, supprimer, mettre en forme)
  • Synchronisation WebSocket en temps réel après chaque modification
  • Banc d'essai pour évaluer la précision des agents

Tout ce qu'il vous faut, rien de superflu

Une boîte à outils ciblée et soigneusement conçue – pensée autour des fondamentaux qui comptent le plus pour les agents et pour les utilisateurs de la voix d'abord.

🎤

Commande vocale native

Propulsée par Google Gemini Live. Parlez naturellement – l'agent comprend le contexte, se souvient des modifications précédentes et confirme chaque action à voix haute.

🤖

Architecture pensée pour les agents

Chaque opération est exposée sous forme d'outil MCP. Les agents IA peuvent créer, modifier et naviguer dans les documents de façon autonome via un protocole standardisé – sans bidouille.

🌟

Mise en forme de texte enrichi

Couleurs, polices, tailles, surlignages, gras, italique, indice, exposant, retraits – le tout appliqué en langage naturel, sans barre d'outils.

📄

Pagination A4, PDF & Word

Pagination A4 automatique. Exportez des PDF au pixel près ou du Word natif (.docx) à la demande. Importez aussi vos documents Word existants – polices, couleurs, sauts de page, en-têtes et pieds de page tous préservés.

Synchronisation en temps réel

Une double architecture WebSocket garantit que l'affichage se met à jour à l'instant même où l'agent modifie le document – sans interrogation périodique, sans rafraîchissement.

🔒

Multi-utilisateur sécurisé

Authentification par JWT, isolation des documents par utilisateur, assainissement DOMPurify et protection en périphérie Cloudflare – durci pour la production dès le premier jour.

Trois étapes vers un document terminé

Que vous tapiez, parliez ou lanciez un agent automatisé – le déroulement reste toujours la même boucle simple.

1

Exprimez ou tapez votre intention

Ouvrez le panneau de discussion ou appuyez sur le microphone. Décrivez ce que vous voulez en langage courant : « Crée un titre intitulé Introduction » ou « Mets le deuxième paragraphe en italique ».

2

L'agent exécute les outils

L'agent IA traduit votre intention en appels d'outils MCP précis – il trouve les bons indices de caractères, insère ou supprime des chaînes et applique les jetons de mise en forme.

3

Votre document se met à jour instantanément

Le backend publie un événement WebSocket. L'éditeur réaffiche la vue A4 paginée en temps réel. L'agent confirme ce qu'il a fait – à la voix ou par écrit.

Conçu comme une plateforme de recherche

AgentDoc est le banc d'essai empirique d'une thèse en cours évaluant l'impact de la conception des outils sur la fiabilité des agents IA.

Interfaces tout-vocal pilotées par agent

Ce projet sous-tend une thèse scientifique évaluant la granularité des outils, leur prolifération et les contraintes de flux de travail sur les agents LLM opérant dans un contexte d'édition de documents. Le banc d'essai mesure la précision des agents via la distance de Levenshtein, la consommation de jetons et les taux d'hallucination sur 20 configurations de flux de travail contrôlées (A–T) et 13 scénarios de référence.

Gemini 3 Flash MCP / FastMCP ReAct FSM Prolifération d'outils Distance de Levenshtein Dérive d'indices
Essayer l'éditeur →

Notes techniques & correctifs de version

Des articles courts et denses sur la façon dont AgentDoc est construit – choix d'architecture, tests de performance et bugs que nous corrigeons.

Tous les articles →

Prêt à éditer sans souris ni clavier ?

Ouvrez l'éditeur et énoncez votre première instruction. Votre document répondra.

Ouvrir l'éditeur →