Patches, Updates & Technik-Notizen

Release Notes und technische Berichte von AgentDoc – dem KI-nativen Dokumenteneditor fĂŒr LLM-Agenten und sprachgesteuerte Nutzer (auch bekannt als agent doc, agentdocs, docedit). Wir veröffentlichen kleine, hĂ€ufige Patches; hier erfĂ€hrst du, was sich geĂ€ndert hat und warum.

So schreibst du einen Brief auf dem Handy per Sprache (kostenlos, ohne App)

Diktiere einen Brief auf deinem Handy, formatiere ihn und exportiere ein sauberes PDF — ganz ohne Tippen auf einer winzigen Tastatur und ohne App-Installation. Eine kurze Schritt-fĂŒr-Schritt-Anleitung, wie du vom Handy aus einen echten Brief fertig bekommst.

So schreibst du ein Anschreiben auf dem Handy per Sprache (kostenlos)

Bewirb dich vom Handy aus: Diktiere ein professionelles Anschreiben per Sprache, gib ihm einen sauberen Briefkopf und ein klares Layout, passe es an jede Stelle an und exportiere ein PDF, wie es Personaler erwarten.

So erstellst du ein Dokument auf dem Handy ganz ohne Tastatur

Erstelle ein komplettes Dokument — Überschriften, Listen, Tabellen, SeitenumbrĂŒche — ohne jemals die Bildschirmtastatur zu öffnen. Diktiere den Text, bearbeite und formatiere ihn per Sprache und exportiere ein PDF oder eine Word-Datei.

DOCX-Import: Word-Dokumente verlustfrei durch einen KI-Editor schleusen

Das Spiegelbild der Export-Neufassung. SeitenumbrĂŒche, Hyperlinks, Kopf- und Fußzeilen, Schriftarten, Farben und ZeilenabstĂ€nde bleiben auf dem Weg von Word in den Editor — und wieder zurĂŒck — vollstĂ€ndig erhalten. Dazu der Trick mit dem Iterieren ĂŒber XML-Kinder, der verhindert, dass python-docx stillschweigend jeden Hyperlink verschluckt.

PDF- + DOCX-Export neu gebaut: WeasyPrint, Pandoc-Lua-Filter und dem Frontend vertrauen

Wir haben die Export-Pipeline neu geschrieben, damit PDF- und DOCX-Downloads wirklich dem entsprechen, was Nutzer auf dem Bildschirm sehen. Die architektonische Erkenntnis: Der Paginator des Browsers ist bereits die Quelle der Wahrheit – der Server muss ihm nur folgen. Dazu eine Tour durch den Pandoc- reference.docx-Trick und einen Lua-Filter, der die Stand-off-Klassen des Editors in native Word-Run-Eigenschaften ĂŒbersetzt.

AgentDoc Patch Notes – April 2026: Renderer-Fixes, Decoration-Komposition, Toggle-Semantik

FĂŒnf Fixes diese Woche ausgeliefert: Erhalt der Tiefe verschachtelter Listen, Komposition von decoration-*-Klassen, korrekte TOGGLE-Semantik bei apply_*-Tools, Escaping von Inline-Code und Decoration-Styling, das ĂŒber <span> hinaus verallgemeinert wurde. Was kaputt war, warum es kaputt war und was wir geĂ€ndert haben.

Tool-GranularitÀt in LLM-Agenten: Was uns 20 Workflow-Konfigurationen gelehrt haben

Wir haben atomare Tools vs. zusammengesetzte Makros vs. State-Constrained-ReAct-FSMs ĂŒber 20 Workflow-Konfigurationen (A–T) und 13 Szenarien gebenchmarkt. Das Ergebnis ist nicht das, was die „weniger Tools = besser“-ErzĂ€hlung vorhersagt. AusfĂŒhrlicher Bericht ĂŒber Genauigkeit, Token-Kosten und wo die Klippen liegen.

Sprachgesteuertes Bearbeiten von Dokumenten mit Gemini Live: Architektur & Kompromisse

Warum wir Gemini 3.1 Flash Live Native Audio direkt mit dem MCP-Server verdrahtet haben, statt ein zweites LLM hinter einem Transkriptions-Proxy zu stapeln – und was dir das bei Latenz, Genauigkeit und ZuverlĂ€ssigkeit der Tool-Aufrufe bringt.