AgentDoc escribe, da formato y estructura tu documento en directo mientras hablas β en tu mΓ³vil o en tu portΓ‘til. Sin teclear, sin menΓΊs.
Ya sea que vayas de camino al trabajo, dictes un borrador en el mΓ³vil o simplemente hables mΓ‘s rΓ‘pido de lo que escribes β AgentDoc estΓ‘ diseΓ±ado en torno a la forma en que ya piensas.
Cualquiera que prefiera hablar a teclear. Dicta una carta de presentaciΓ³n en el autobΓΊs, redacta un informe entre reuniones o escribe un correo largo sin desbloquear el teclado. El agente escucha, redacta y da formato en directo.
DiseΓ±ado para personas con discapacidades motrices, lesiones por esfuerzo repetitivo o cualquiera para quien una interfaz de ratΓ³n y teclado resulte agotadora o imposible. Toda operaciΓ³n es accesible solo con la voz.
El mismo backend expone cada operaciΓ³n de documento como una herramienta MCP tipada, de modo que los agentes LLM autΓ³nomos pueden leer, escribir, dar formato y navegar documentos sin intervenciΓ³n humana. Consulta /agents.
Un conjunto de herramientas enfocado y cuidadosamente diseΓ±ado, construido en torno a las primitivas que mΓ‘s importan a los agentes y a los usuarios que hablan primero.
Impulsado por Google Gemini Live. Habla con naturalidad β el agente entiende el contexto, recuerda ediciones anteriores y confirma cada acciΓ³n en voz alta.
Cada operaciΓ³n se expone como una herramienta MCP. Los agentes de IA pueden crear, editar y navegar documentos de forma autΓ³noma mediante un protocolo estandarizado β sin parches.
Colores, fuentes, tamaΓ±os, resaltados, negrita, cursiva, subΓndice, superΓndice, sangrΓa β todo aplicado con lenguaje natural, sin barra de herramientas.
PaginaciΓ³n A4 automΓ‘tica. Exporta PDF perfectos al pΓxel o Word nativo (.docx) cuando quieras. Importa tambiΓ©n documentos de Word existentes β fuentes, colores, saltos de pΓ‘gina, encabezados y pies conservados.
La arquitectura de doble WebSocket garantiza que la vista se actualice en el instante en que el agente modifica el documento β sin sondeos, sin recargar.
AutenticaciΓ³n basada en JWT, aislamiento de documentos por usuario, sanitizaciΓ³n con DOMPurify y protecciΓ³n perimetral de Cloudflare β robusto para producciΓ³n desde el primer dΓa.
Tanto si escribes, hablas o ejecutas un agente automatizado β el flujo es siempre el mismo bucle sencillo.
Abre el panel de chat o pulsa el micrΓ³fono. Describe lo que quieres en lenguaje sencillo: "Crea un encabezado llamado IntroducciΓ³n" o "Pon en cursiva el segundo pΓ‘rrafo."
El agente de IA traduce tu intenciΓ³n en llamadas precisas a herramientas MCP β localizando los Γndices de caracteres adecuados, insertando o eliminando cadenas y aplicando tokens de formato.
El backend publica un evento de WebSocket. El editor vuelve a renderizar la vista A4 paginada en tiempo real. El agente confirma lo que hizo β por voz o texto.
AgentDoc es el banco de pruebas empΓrico de una tesis en curso que evalΓΊa cΓ³mo el diseΓ±o de las herramientas afecta a la fiabilidad de los agentes de IA.
Este proyecto sustenta una tesis cientΓfica que evalΓΊa la granularidad de las herramientas, el exceso de herramientas y las restricciones de flujo de trabajo en agentes LLM que operan en un contexto de ediciΓ³n de documentos. El banco de pruebas mide la precisiΓ³n del agente mediante la distancia de Levenshtein, el consumo de tokens y las tasas de alucinaciΓ³n a lo largo de 20 configuraciones de flujo controladas (AβT) y 13 escenarios de referencia.