Parches, novedades y notas de ingeniería
Notas de versión y artículos de ingeniería de AgentDoc, el editor de documentos nativo de IA para agentes LLM y usuarios que priorizan la voz (también conocido como agent doc, agentdocs, docedit). Publicamos parches pequeños y frecuentes; aquí tienes qué cambió y por qué.
Cómo escribir una carta en el móvil con la voz (gratis, sin app)
Dicta una carta en el móvil, dale formato y exporta un PDF impecable: sin escribir en un teclado diminuto y sin app que instalar. Un recorrido breve y de principio a fin para sacar una carta de verdad desde el móvil.
Cómo escribir una carta de presentación en el móvil con la voz (gratis)
Postula a un empleo desde el móvil: dicta por voz una carta de presentación profesional, dale un encabezado y una maquetación limpios, adáptala a cada puesto y exporta un PDF como los que esperan los reclutadores.
Cómo escribir un documento en el móvil sin teclado
Crea un documento completo (encabezados, listas, tablas, saltos de página) sin abrir nunca el teclado en pantalla. Dicta el texto, edítalo y dale formato por voz, y exporta un PDF o un archivo de Word.
Importación de DOCX: ida y vuelta de documentos de Word a través de un editor con IA
El reflejo de la reescritura de exportación. Saltos de página, hipervínculos, encabezados/pies, fuentes, colores e interlineado, todo conservado en el viaje de Word al editor y de vuelta. Además, el truco de iterar los hijos del XML que impide que python-docx descarte silenciosamente todos los hipervínculos.
Reconstruyendo la exportación a PDF + DOCX: WeasyPrint, filtros Lua de Pandoc y confiar en el frontend
Reescribimos el flujo de exportación para que las descargas en PDF y DOCX coincidan de verdad con lo que ven
los usuarios en pantalla. La clave arquitectónica: el paginador del navegador ya es la
fuente de verdad; el servidor solo tiene que seguirlo. Además, un repaso del truco del
reference.docx de Pandoc y de un filtro Lua que traduce las
clases stand-off del editor a propiedades de run nativas de Word.
Notas de parche de AgentDoc – abril de 2026: correcciones del renderizador, composición de decoraciones, semántica de alternancia
Cinco correcciones publicadas esta semana: preservación de la profundidad en listas anidadas, composición de clases decoration-*,
semántica TOGGLE correcta en las herramientas apply_*, escape de código en línea y estilo de decoraciones
generalizado más allá de <span>. Qué se rompió, por qué se rompió y qué cambiamos.
Granularidad de herramientas en agentes LLM: lo que nos enseñaron 20 configuraciones de flujo de trabajo
Comparamos herramientas atómicas vs. macros compuestas vs. FSM de ReAct con restricciones de estado en 20 configuraciones de flujo de trabajo (A–T) y 13 escenarios. El resultado no es el que predice la narrativa de «menos herramientas = mejor». Análisis detallado de precisión, coste en tokens y dónde están los precipicios.
Edición de documentos por voz con Gemini Live: arquitectura y compromisos
Por qué conectamos el audio nativo de Gemini 3.1 Flash Live directamente al servidor MCP en lugar de apilar un segundo LLM detrás de un proxy de transcripción, y qué ganas con ello en latencia, precisión y fiabilidad de las llamadas a herramientas.
¿Quieres novedades? Guarda esta página en favoritos: publicamos aproximadamente cada 2–3 semanas. Para contexto legible por máquinas, consulta /llms.txt.