Dale a tu agente de IA edición de documentos – en menos de 60 segundos

AgentDoc es un servidor público de Model Context Protocol (MCP). Cualquier agente LLM que hable MCP – Gemini, Claude, GPT o el tuyo propio – puede conectarse, autenticarse y usar una API completa de edición de documentos con tipado: leer, escribir, formatear, navegar, exportar PDF. Sin SDK que integrar, sin esquema que mantener de tu lado, sin intervención humana.

Esta página es la ruta canónica de incorporación para agentes y para las personas que los operan. Si tú (o tu modelo) quieres un editor de documentos funcional disponible como herramienta, aquí tienes todo lo que necesitas.

Endpoint MCP

https://agent-doc-edit.com/mcp/sse

Model Context Protocol estándar sobre Server-Sent Events. Autenticación con token bearer JWT (consulta el inicio rápido más abajo). Presupuesto de tokens gratuito por cuenta; no se requiere tarjeta de crédito.

Inicio rápido (una sola llamada HTTP)

Registra una cuenta de agente aislada y recibe su clave de API en una sola petición. Sin navegador, sin correo electrónico, sin intervención humana. Cada agente registrado es su propio usuario con su propio ámbito de documentos: distintos agentes nunca ven los documentos de los demás.

curl -X POST https://agent-doc-edit.com/api/agents/register \
  -H "Content-Type: application/json" \
  -d '{"name": "my-research-agent"}'

# Response
# {
#   "user_id":        "...",
#   "username":       "agent_AbCdEfGh",
#   "name":           "my-research-agent",
#   "api_key":        "ak_...",          <-- shown ONLY here, store it
#   "api_key_prefix": "ak_AbCdEfGh",
#   "created_at":     "2026-04-25T..."
# }

Eso es todo. Usa la api_key como token bearer contra /mcp/sse y el agente tendrá 35 herramientas tipadas para leer, escribir, formatear, paginar y exportar documentos – completamente delimitadas a su propia cuenta.

Dos formas de autenticarse

Opción A – El agente se registra por sí mismo (recomendado para flujos autónomos)

Usa POST /api/agents/register como se muestra arriba. El agente obtiene su propia cuenta de usuario y su propio espacio de nombres de documentos. Distintos agentes nunca colisionan. Límite de tasa: 5 registros por hora por IP. Esta es la ruta correcta para canalizaciones de cartas, procesadores por lotes, trabajos programados y flujos multiagente.

Opción B – Usa tu propia cuenta humana (para "darle edición de documentos a mi propio asistente")

Abre /app, inicia sesión, barra lateral → "API Keys for Agents""+ Create New Key". La clave se muestra una sola vez. Úsala como token bearer. El agente comparte tu cuenta, tus documentos y el estado de tu documento activo. Útil cuando quieres que un agente copiloto opere junto a ti sobre un mismo corpus.

Qué se factura (y qué no)

Los agentes traen su propio LLM. Pagas a tu proveedor de modelos por los tokens de razonamiento. Nosotros no los vemos, no cobramos por ellos, no aplicamos límites sobre ellos. Nuestro servicio aloja el servidor MCP, el almacenamiento de documentos y la canalización de renderizado. La columna token_limit en las cuentas de agente se fija en 0 como cinturón de seguridad defensivo: si alguna ruta de código futura intentara alguna vez ejecutar nuestro agente Gemini interno con autenticación de cuenta de agente, se negaría – los agentes permanecen estrictamente en la ruta de herramientas MCP.

Importante: esto es autónomo, no colaborativo

Esta ruta está construida para flujos de agentes autónomos – tu agente razona con su propio LLM, llama directamente a nuestras herramientas MCP, edita documentos en su propia cuenta y exporta un resultado. La misma superficie de herramientas probada en producción que usan nuestros agentes de voz y texto da potencia a tu agente – pero tu agente nunca habla con el nuestro. No hay un salto IA-a-IA, ni una llamada interna al LLM en tu nombre, ni una sesión compartida con nuestro editor en el navegador.

Si quieres que una persona y nuestro agente de voz/texto coediten en vivo, usa /app directamente – esa es una ruta distinta. Si quieres que tu propio agente opere el editor sin intervención humana, el endpoint MCP descrito aquí es la superficie correcta.

Conéctate desde cualquier cliente MCP

Python (cliente mcp / Anthropic / Google ADK)

from mcp.client.sse import sse_client
from mcp import ClientSession
import json

AGENTDOC_TOKEN = "ak_..."  # from POST /api/agents/register

async def edit_document():
    headers = {"Authorization": f"Bearer {AGENTDOC_TOKEN}"}
    async with sse_client("https://agent-doc-edit.com/mcp/sse",
                          headers=headers) as (read, write):
        async with ClientSession(read, write) as session:
            await session.initialize()
            # Workflow T (~35 tools) is applied automatically. Token is
            # injected from the Authorization header – do NOT pass `token`
            # in tool arguments.
            tools = await session.list_tools()

            # Create a document
            res = await session.call_tool("create_document",
                                          {"title": "My Report"})
            payload = json.loads(res.content[0].text)
            doc_id = payload["doc_id"]   # structured field, no regex

            # Insert content
            await session.call_tool("insert_string", {
                "doc_id": doc_id,
                "text":   "# Hello\n\nFirst paragraph.",
                "index":  0,
            })

            # Trigger PDF; response includes a self-describing fetch URL
            res = await session.call_tool("trigger_pdf_download",
                                          {"doc_id": doc_id})
            pdf_meta = json.loads(res.content[0].text)
            print(pdf_meta["pdf_url"])  # → "/api/doc//pdf"

TypeScript (Anthropic SDK)

import { Client } from "@modelcontextprotocol/sdk/client/index.js";
import { SSEClientTransport } from "@modelcontextprotocol/sdk/client/sse.js";

const transport = new SSEClientTransport(
  new URL("https://agent-doc-edit.com/mcp/sse"),
  { requestInit: { headers: { Authorization: `Bearer ${TOKEN}` } } }
);
const client = new Client({ name: "my-agent", version: "1.0" }, { capabilities: {} });
await client.connect(transport);

const tools = await client.listTools();
const result = await client.callTool({
  name: "insert_string",
  arguments: { text: "Hello from my agent.", index: 0 }
});

curl (exploración en bruto)

curl -N -H "Authorization: Bearer $TOKEN" \
     -H "Accept: text/event-stream" \
     https://agent-doc-edit.com/mcp/sse

Catálogo de herramientas – Workflow T se aplica automáticamente

Los agentes externos (es decir, las peticiones autenticadas con una clave de API ak_*) quedan automáticamente restringidos a la superficie de herramientas Workflow T – el valor por defecto de producción Pareto-óptimo que usan nuestros propios agentes de voz y texto. Tú no aplicas este filtro; el servidor MCP lo aplica del lado del servidor tanto en tools/list como en tools/call. Esto te ofrece el subconjunto curado de ~35 herramientas (primitivas tipadas + macros + retroalimentación de observación sobre desplazamientos de índice), elimina las herramientas de bloc de notas y de intención FSM que no pertenecen a T, y excluye las variantes atómicas "explotadas" que solo usa nuestro benchmark de saturación de herramientas. Cada herramienta tiene un esquema JSON para sus argumentos y devuelve una respuesta estructurada con marcadores explícitos de éxito/error; las operaciones que desplazan índices incluyen retroalimentación de observación ("observation": "INDEX SHIFT – re-read before next mutation") para que el agente se mantenga anclado entre turnos.

get_document_context
Devuelve Markdown en bruto + HTML renderizado en una sola llamada. Herramienta de lectura principal.
find
Búsqueda con regex. Devuelve todas las coincidencias con índices [start, end) y 150 caracteres de contexto.
insert_string / delete_substring
Mutaciones de texto basadas en índices. Variantes de encabezado/pie de página para áreas aisladas.
replace_substring
Eliminación + inserción atómica. Evita el desfase de índices entre dos llamadas separadas.
format_text
15 colores, 12 fuentes, 7 tamaños, negrita/cursiva/subrayado/tachado/subíndice/superíndice, alineación, sangría, enlaces.
format_table
Estilo/color/ancho de borde, fondos, alineación, anchos de columna, relleno, alternancia de filas.
macro_replace_all / macro_format_all_matches
Operaciones masivas atómicas. Procesa las coincidencias en orden de índice inverso para evitar el desfase.
insert_page_break / delete_page_break / find_page_breaks
Primitivas de salto de página – marcadores DOM invisibles, no subcadenas de caracteres.
generate_table_of_contents
Inyecta automáticamente una tabla de contenidos con hipervínculos en un índice dado a partir de la estructura de encabezados existente.
create_document / rename_document / set_active_document / list_documents
Gestión de documentos. La sesión del agente se enruta automáticamente al documento activo.
navigate_to_page / set_page_layout
Navegación por páginas, ajuste de márgenes y tamaño de página.
trigger_pdf_download
Emite un evento de exportación a PDF que el usuario (o un agente posterior) puede recoger.

Inicializa un documento a partir de un DOCX existente

La superficie de herramientas MCP permite que tu agente construya documentos desde cero. Para flujos que parten de un archivo de Word ya redactado – plantillas de membrete corporativo, texto estándar de contratos, un borrador entrante que revisar – un endpoint HTTP adicional de un solo paso acepta cargas de .docx, crea un nuevo Document en la cuenta del agente y lo activa para que la siguiente llamada MCP recaiga sobre el contenido importado:

# Upload a .docx; response is the new {id, title, ...}
curl -X POST https://agent-doc-edit.com/api/docs/import/docx \
  -H "Authorization: Bearer $API_KEY" \
  -F "[email protected]" \
  -F "title=Q3 Customer Letter"

Los saltos de página, los hipervínculos, los encabezados / pies de página, las fuentes, los colores y el interlineado sobreviven todos a la importación. Análisis técnico completo: Importación de DOCX – Conversión de ida y vuelta de documentos de Word.

Casos de uso que tu agente puede asumir de forma autónoma

Qué hace esto amigable para agentes (en concreto)

Límites y restricciones honestas

Metadatos de descubribilidad

Pruébalo ahora

Abre el editor en una pestaña, ejecuta tu agente en otra. Las ediciones del agente aparecen en tiempo real en la misma pantalla – útil para depuración, demos o para ejecutar una colaboración humano + agente.

Abrir el editor →

Artículos de ingeniería