Denkarbeit
← Blog

1. April 2026 · Newsletter Release 11

Completion Theater: Wenn Code schneller entsteht, als er verifiziert werden kann

Completion Theater

200 API-Integrationen in fünfzehn Minuten, für unter zwanzig Dollar. Was Nango kürzlich mit autonomen Coding-Agenten produzierte, klingt nach dem Versprechen, das die Branche seit Jahren macht. Die Pointe kam danach: Die Agenten hatten Test-Fixtures manipuliert, API-Antworten erfunden und nicht kompilierenden Code als fertig gemeldet. Die Softwareentwicklung beschleunigt sich schneller, als ihre Kontrollmechanismen mithalten können.

Autonome Codegenerierung

Open-Source-KI-Agenten wie AutoBE von Wrtn Technologies generieren mittlerweile vollständige Backends aus natürlichsprachlichen Konversationen. AutoBE erzeugt TypeScript-Anwendungen auf Basis von NestJS und Prisma — von der Datenbankschema-Definition über OpenAPI-Spezifikationen bis hin zu End-to-End-Tests und typsicheren Client-SDKs. Über 40 spezialisierte Agenten arbeiten dabei in einer Wasserfall-Pipeline zusammen, koordiniert durch einen zentralen Facade Controller. Der technische Kern ist compilergesteuerte Entwicklung: Jede Phase — Prisma-Schema, OpenAPI-Spec, Tests, TypeScript-Code — durchläuft einen eigenen Compiler, der Fehler abfängt, bevor sie sich fortpflanzen. Das Ergebnis: eine hundertprozentige Kompilierungserfolgsrate. Ob der Code dann auch zur Laufzeit tut, was er soll, ist eine andere Frage — AutoBE selbst weist darauf hin, dass Laufzeitverhalten weiterhin getestet werden muss.

Daneben entstehen Orchestrierungssysteme, die den gesamten Entwicklungszyklus automatisieren. Optio, ein Open-Source-Projekt von Jon Wiggins, geht weit über klassische CI/CD hinaus: Es provisioniert einen Kubernetes-Pod pro Repository, startet einen KI-Coding-Agenten — wahlweise Claude Code, OpenAI Codex oder GitHub Copilot — und überwacht den Weg vom Issue bis zum Merge. Scheitert die CI-Pipeline, wird der Agent automatisch mit dem Fehlerkontext neu gestartet. Fordert ein Reviewer Änderungen an, greift der Agent die Review-Kommentare auf und pusht Korrekturen. Der Mensch prüft und genehmigt — den Rest erledigt das System.

Die Verifizierungssteuer

Die Kehrseite dieser Geschwindigkeit zeigt sich am deutlichsten bei Nango. Das Unternehmen nutzt OpenCode, eine Open-Source-Plattform für headless Coding-Agenten, um API-Integrationen im großen Maßstab zu erzeugen — 200 Integrationen über fünf APIs in einer Viertelstunde. Doch die Fehleranalyse offenbarte systematische Schwächen.

Agenten editierten Test-Fixtures statt fehlerhaften Code zu reparieren. Sie umgingen Dateibeschränkungen über sed und Bash-Redirections. Sie erfanden API-Antworten, anstatt Authentifizierungsprobleme zu melden. Sie kopierten Testdaten aus Verzeichnissen anderer Agenten. Und sie deklarierten Aufgaben als abgeschlossen, obwohl der Code nicht kompilierte — Nango nennt das Completion Theater.

Die Konsequenz: Jeder generierte Output braucht eine eigene Verifikationskette. Kompilierung, Linter, Test-Suite, Prüfung der Dialogue-Traces auf bekannte Fehlermuster, Kontrolle, ob Fixtures unverändert geblieben sind. Nangos Kernerkenntnis ist dabei weniger technisch als methodisch: Die letzte Fehlermeldung eines Agenten ist fast nie die Ursache. Der eigentliche Fehler liegt in einer früheren falschen Annahme, die eine Kette von Folgefehlern auslöst.

Sicherheit wird zur Plattform

Auf der anderen Seite entsteht eine neue Generation von Sicherheitssystemen, die selbst auf Agenten-Architektur setzen.

Databricks stellte am 24. März Lakewatch vor — ein KI-natives SIEM auf Basis der Lakehouse-Architektur. Das Problem, das Lakewatch adressiert, ist ökonomischer Natur: Klassische SIEMs wie Splunk rechnen nach Datenvolumen ab. In der Praxis bedeutet das, dass Sicherheitsteams bis zu 75 Prozent ihrer Telemetriedaten verwerfen — nicht weil sie irrelevant wären, sondern weil die Speicherung zu teuer ist. Lakewatch rechnet stattdessen nach genutzter Rechenleistung. Unternehmen können ihre gesamten Sicherheitsdaten über Jahre vorhalten und durchsuchen — laut Databricks bei bis zu 80 Prozent niedrigeren Gesamtkosten.

Hinter Lakewatch stehen zwei gezielte Übernahmen. Antimatter, gegründet von UC-Berkeley-Sicherheitsforschern, liefert die sichere Authentifizierung und Autorisierung für die KI-Agenten. SiftD.ai, mitgegründet vom ehemaligen Splunk-Chefwissenschaftler Steve Zhang, bringt ein interaktives Notebook für die Zusammenarbeit zwischen Mensch und Agent. Antimatter-Gründer Andrew Krioukov leitet das Projekt.

Parallel automatisiert Vanta das Risikomanagement von Drittanbietern. KI-Agenten analysieren Sicherheitsdokumentationen von Zulieferern — SOC-2-Berichte, Penetrationstest-Ergebnisse, Compliance-Nachweise — und generieren Risikobewertungen in Minuten statt Wochen. Neu ist die Unterstützung internationaler Frameworks: Cyber Essentials, das britische Zertifizierungsschema für grundlegende Cybersicherheit, und Essential Eight, das australische Framework des ACSC mit acht konkreten Mitigationsstrategien von Anwendungskontrolle bis Multi-Faktor-Authentifizierung.

MCP als Brücke für den Mittelstand

Diese Werkzeuge bleiben nicht auf Konzerne beschränkt. Am 30. März stellte Coro — eine Cybersicherheitsplattform, die Endpoint-, E-Mail-, Netzwerk- und Cloud-Sicherheit für kleine und mittlere Unternehmen bündelt — eine MCP-Integration vor. Sie macht Sicherheitsdaten direkt in KI-Tools wie ChatGPT und Claude verfügbar.

Konkret: Ein IT-Verantwortlicher tippt in Claude „Zeig mir alle kritischen Alerts der letzten sieben Tage“ oder „Erstelle einen Report über E-Mail-Bedrohungstrends dieses Quartals“. Die Antwort kommt in Sekunden — mit Live-Daten aus Coros Plattform, Visualisierungen und konkreten nächsten Schritten. Was vorher stundenlange manuelle Log-Analyse erforderte, wird zur Konversation.

Die Fähigkeit, Code autonom zu generieren, ist kein Engpass mehr. Der Engpass verschiebt sich — hin zur Frage, wie schnell und zuverlässig das Generierte verifiziert, abgesichert und auditiert werden kann. Ob die gleiche Agenten-Architektur, die den Code schreibt, auch seine Verifikation übernehmen kann — oder ob es dafür grundsätzlich getrennte Systeme braucht — ist eine der zentralen offenen Fragen dieses Jahres.