Paperclip: Die Open-Source-Steuerungsebene für KI-Agenten-Unternehmen
Paperclip ist kein weiterer Task-Manager. Gestartet im März 2026, gibt es Multi-Agenten-Teams Organigramme, Budgets, Prüfprotokolle und Governance auf Vorstandsebene. Was es ist, wie es funktioniert und warum es wichtig ist.
Themen
In der KI-Agenten-Community kursiert eine treffende Analogie: Wenn OpenClaw ein Mitarbeiter ist, ist Paperclip das Unternehmen. Dieser eine Satz erklärt, was Paperclip anstrebt, besser als die meisten technischen Beschreibungen. Es ist kein Framework zum Erstellen von Agenten. Es ist die Organisationsebene, die über ihnen sitzt und Koordination, Verantwortlichkeit und Budgetkontrolle über eine Flotte von KI-Arbeitern übernimmt.
Paperclip wurde im März 2026 von @dotta veröffentlicht und sammelte in den ersten Wochen über 46.700 GitHub-Sterne. Die schnelle Verbreitung spiegelt eine echte Lücke im aktuellen KI-Stack wider: Die meisten Teams, die mehrere Agenten betreiben, haben keinen gemeinsamen Zustand, keine Kostentransparenz und keine Möglichkeit, zu verhindern, dass zwei Agenten dieselbe Arbeit zweimal erledigen.
Das Problem, das Paperclip löst
Einen einzelnen KI-Agenten zu betreiben ist einfach genug. Zwanzig davon gleichzeitig zu betreiben ist ein völlig anderes Problem. Ohne Koordination entstehen doppelte Arbeit, unkontrollierte Kosten und null Verantwortlichkeit für das, was jeder Agent tatsächlich getan hat.
Die spezifischen Fehlerbilder sind jedem bekannt, der versucht hat, Multi-Agenten-Workflows zu skalieren:
- Kein gemeinsamer Zustand: Agent A schließt eine Aufgabe ab, die Agent B bereits begonnen hat. Keiner weiß vom anderen.
- Keine Kostentransparenz: LLM-API-Ausgaben verteilen sich auf viele Prozesse ohne zentrale Abrechnung. Die tatsächlichen Kosten kennt man erst im Nachhinein.
- Keine Koordination: Agenten, die Arbeit aneinander übergeben sollten, arbeiten in Silos. Fortschritte stagnieren, weil keine Instanz Abhängigkeiten auflösen kann.
- Kein Prüfprotokoll: Wenn etwas schiefläuft, gibt es keine zuverlässige Aufzeichnung darüber, was jeder Agent wann und warum getan hat.
Paperclip adressiert all diese Probleme auf der Infrastrukturebene, bevor man überhaupt Agenten-Logik schreibt.
Kein Task-Manager: Eine Unternehmensstruktur
Der Rahmen, der Paperclip verständlich macht, ist, dass es KI-Agenten-Teams so modelliert, wie man eine echte Organisation modellieren würde. Nicht mit losen Aufgabenlisten, sondern mit Organigrammen, Berichtsstrukturen, definierten Rollen, monatlichen Budgets pro Agent, Zielausrichtung und Governance auf Vorstandsebene.
Dieser letzte Punkt ist entscheidend. Paperclip setzt den Menschen in die Rolle des Vorstands. Agenten führen innerhalb der Unternehmensstruktur aus, aber der Mensch behält die endgültige Autorität über Ziele, Budgetzuteilung und Richtlinien. Dies ist kein autonomes KI-Unternehmen ohne Aufsicht. Es ist ein strukturiertes Delegationsmodell, bei dem Autonomie begrenzt und nachprüfbar ist.
Die Zwei-Schichten-Architektur
Paperclip trennt seine Aufgaben klar in zwei Schichten.
Steuerungsebene
Paperclip selbst ist die Steuerungsebene. Es verwaltet Agenten, weist Aufgaben zu, setzt Budgets durch, pflegt das Prüfprotokoll und handhabt Governance. Agenten laufen nicht innerhalb von Paperclip. Sie laufen extern und berichten zurück. Paperclip ist der Teil, der zu jedem Zeitpunkt weiß, was im gesamten Unternehmen passiert.
Ausführungsdienste
Agenten sind Ausführungsdienste. Sie leben außerhalb von Paperclip, laufen auf der Infrastruktur, die für jede Runtime sinnvoll ist, und verbinden sich über Adapter mit der Steuerungsebene. Das Adaptermuster ist der Weg, wie Paperclip verhindert, dass man an einen bestimmten KI-Stack gebunden wird. Agenten "melden sich zurück", um Aufgabenstatus zu berichten, Arbeit aus der Issue-Queue zu entnehmen und ihre Aktivitäten im Prüfprotokoll zu erfassen.
Kernprimitive
Paperclip definiert eine kleine Menge von Primitiven, die sich zur vollständigen Unternehmensstruktur zusammenfügen.
Unternehmen
Der Top-Level-Container. Ein Unternehmen hat Ziele, eine Liste von Agenten und eine Governance-Richtlinie. Alles andere lebt innerhalb eines Unternehmens.
Agenten
Jeder Agent hat eine definierte Rolle, ein monatliches Budget in Cent und einen Status. Die Budgetdurchsetzung ist atomar: Wenn ein Agent sein monatliches Limit erreicht, stoppt er. Es gibt keine sanfte Degradierung oder Umgehung. Das ist bewusst so. Weiche Limits versagen still; harte Limits nicht.
Issues und Tasks
Arbeit wird als Issues und Tasks modelliert. Der Schlüsselmechanismus ist atomares Auschecken: Wenn ein Agent eine Aufgabe beansprucht, ist sie diesem Agenten bis zur Fertigstellung oder expliziten Freigabe gesperrt. Kein anderer Agent kann sie aufgreifen. Dies ist das spezifische Feature, das das Problem der doppelten Arbeit eliminiert, und es wird auf Datenbankebene implementiert, nicht der Anwendungslogik überlassen.
Heartbeats
Agenten arbeiten nach geplanten Aufwachzyklen, sogenannten Heartbeats. Anstatt kontinuierlich zu laufen, wacht ein Agent nach einem Zeitplan auf, prüft zugewiesene Arbeit, führt sie aus, berichtet zurück und schläft. Das macht Rechenkosten vorhersehbar und Agentenverhalten nachvollziehbar.
Governance
Die Governance-Schicht formalisiert das Mensch-als-Vorstand-Modell. Richtlinienentscheidungen, Budgetänderungen und Zielaktualisierungen fließen durch Governance. Das Prüfprotokoll ist unveränderlich: Einmal aufgezeichnet, können Agentenaktionen nicht geändert oder gelöscht werden. Das ist wichtig für die Verantwortlichkeit und wird zunehmend relevant, da KI-Agenten Maßnahmen mit realen Konsequenzen ergreifen.
Das Adaptersystem
Paperclip wird mit Adaptern für neun Runtimes ausgeliefert:
- Claude (Anthropic)
- Codex (OpenAI)
- Gemini (Google)
- Cursor
- OpenCode
- OpenClaw
- Hermes
- Process (jeder lokale Teilprozess)
- HTTP (jeder API-Endpunkt)
Die HTTP- und Process-Adapter sind die Notausgänge. Jede Runtime, die einen HTTP-Aufruf tätigen oder als Teilprozess laufen kann, lässt sich in Paperclip integrieren. Das Adaptermuster bedeutet, dass die Steuerungsebene stabil bleibt, während sich das Agenten-Ökosystem weiterentwickelt. Neue KI-Runtimes werden als Adapter eingebunden, ohne Änderungen am Kern zu erfordern.
Tech-Stack
Die Implementierungsentscheidungen spiegeln produktionsreife Entwicklung wider, nicht schnelles Prototyping:
- React 19 für das Frontend
- Express.js 5 für die API-Schicht
- PostgreSQL 17 für persistente Speicherung, mit PGlite als eingebettete Option für lokale Entwicklung
- Drizzle ORM für typsicheren Datenbankzugriff
- Better Auth für Authentifizierung
Die PGlite-Option ist erwähnenswert. Sie bedeutet, dass man eine vollständige Paperclip-Instanz lokal betreiben kann, ohne einen separaten Datenbankserver. Für Entwicklung und Einzelmaschinen-Deployments entfällt damit eine erhebliche Betriebsabhängigkeit.
Budgetdurchsetzung in der Praxis
Budgetdurchsetzung verdient einen eigenen Abschnitt, da sie eines der Features ist, die im Produktionseinsatz am meisten zählen. Paperclip verfolgt Ausgaben pro Agent in Cent, mit monatlichen Reset-Zyklen. Die Limits sind hart.
Das ist kein Dashboard, das zeigt, was man letzten Monat ausgegeben hat. Es ist ein System, das einen Agenten stoppt, wenn er sein Limit mitten in einer Aufgabe erreicht. Die Konsequenzen sind erheblich:
- Finanzteams erhalten vorhersehbare KI-Ausgaben ohne Überraschungsrechnungen
- Entwicklungsteams können mit neuen Agenten-Konfigurationen experimentieren, ohne unkontrollierte Kosten zu riskieren
- Agenten mit höherer Verantwortung oder Durchsatz erhalten höhere Budgets; Agenten mit niedrigerer Priorität erhalten niedrigere
- Budgetzuteilung wird zur Governance-Entscheidung, nicht zum Nachgedanken
Für Organisationen, die KI-Automatisierung in großem Maßstab betreiben, rechtfertigt dieses Feature allein den architektonischen Mehraufwand einer Orchestrierungsebene.
Self-Hosted und MIT-lizenziert
Paperclip ist vollständig self-hosted und unter der MIT-Lizenz veröffentlicht. Keine Nutzungsgebühren, keine Anbieterbindung, keine externen Dienstabhängigkeiten. Das Agenten-Unternehmen läuft auf der eigenen Infrastruktur, und die erzeugten Daten verbleiben dort.
Für regulierte Branchen oder Organisationen mit strengen Datenanforderungen ist das kein Bonus-Feature. Es ist eine Voraussetzung. Das Prüfprotokoll, das beim Verwalten von Agenten hilft, hilft auch dabei, Compliance nachzuweisen, weil die Aufzeichnungen in der eigenen Datenbank liegen.
Clipmart: Der geplante Marktplatz
Clipmart ist der geplante Marktplatz für vorgefertigte KI-Unternehmen. Das Konzept: Man lädt eine vollständige Unternehmenskonfiguration herunter, einschließlich Agentenrollen, Aufgabenvorlagen, Governance-Richtlinien und Budgetzuteilungen, und stellt sie auf der eigenen Paperclip-Instanz bereit.
Das ist eine erhebliche Wette auf die Idee, dass KI-Unternehmenskonfigurationen zu einem teilbaren, wiederverwendbaren Artefakt werden, ähnlich wie Software-Pakete. Ein vorgefertigtes "Kundensupport-Unternehmen" oder "Code-Review-Unternehmen", das man deployt und anpasst, anstatt es von Grund auf zu bauen. Ob Clipmart Erfolg hat, hängt davon ab, ob die Community Konfigurationen produziert, die es wert sind, geteilt zu werden, aber das Modell ist solide.
Was das bedeutet
Einzelne KI-Agenten sind die erste Schicht dieses technologischen Wandels. Sie können Aufgaben ausführen, Werkzeuge nutzen und innerhalb definierter Grenzen autonom operieren. Aber einzelne Agenten stoßen an eine Grenze: Sie können nicht koordinieren, Ressourcen nicht effizient teilen und nicht als Kollektiv verwaltet werden.
Paperclip stellt die zweite Schicht dar. Es ist Infrastruktur für Multi-Agenten-Organisationen, nicht für Multi-Agenten-Skripte. Der Unterschied ist bedeutend, weil Organisationen Eigenschaften haben, die Skripte nicht haben: Verantwortlichkeit, Rollendefinition, Ressourcenzuteilung, Richtliniendurchsetzung und Prüfprotokolle. Diese Eigenschaften machen Agenten-Deployments sicher genug für den Produktionseinsatz in geschäftskritischen Workflows.
Das Projekt ist unter paperclip.ing/docs zu finden, der Quellcode auf GitHub. Wer Multi-Agenten-Workflows erstellt und bei dem der Koordinationsaufwand zum Hauptproblem geworden ist, sollte sich die Zeit nehmen, es zu evaluieren.
Bei webvise helfen wir Unternehmen dabei, KI-Automatisierungsarchitekturen zu entwerfen und umzusetzen, die im Produktionseinsatz standhalten. Wer Orchestrierungsplattformen evaluiert oder ein Multi-Agenten-Deployment für echte Arbeit strukturieren möchte, kann Kontakt aufnehmen und wir helfen, den richtigen Ansatz zu finden.
Weitere Artikel
OpenClaw: Der Open-Source-KI-Agent, der GitHub-Rekorde gebrochen hat - und was das für Ihr Unternehmen bedeutet
OpenClaw wuchs in 60 Tagen von einem Wochenendprojekt auf 250.000 GitHub-Sterne. Es verbindet KI-Modelle mit über 50 Messaging-Plattformen und läuft autonom auf Ihrer eigenen Infrastruktur. Was es ist, wie es funktioniert und warum es relevant ist.
Nächster ArtikelHermes Agent: Der KI-Agent, der sich selbst verbessert und aus jeder Aufgabe lernt
Nous Research hat Hermes Agent im Februar 2026 veröffentlicht und er hat bereits 24.600 GitHub-Sterne. Es ist ein persistenter, serverseitiger autonomer Agent, der kontinuierlich eine eigene Skill-Bibliothek aufbaut. Was ihn unterscheidet und warum das wichtig ist.