Hermes Agent: Der KI-Agent, der sich selbst verbessert und aus jeder Aufgabe lernt
Nous Research hat Hermes Agent im Februar 2026 veröffentlicht und er hat bereits 24.600 GitHub-Sterne. Es ist ein persistenter, serverseitiger autonomer Agent, der kontinuierlich eine eigene Skill-Bibliothek aufbaut. Was ihn unterscheidet und warum das wichtig ist.
Themen
Die meisten KI-Coding-Tools teilen dieselbe grundlegende Einschränkung: Sie vergessen alles, wenn die Sitzung endet. Nous Research hat Hermes Agent genau für dieses Problem entwickelt. Im Februar 2026 veröffentlicht, hat er bereits rund 24.600 GitHub-Sterne und einen Slogan, den man wörtlich nehmen sollte: "the agent that grows with you." Das ist kein Chatbot mit einem Gedächtnisschalter. Es ist ein persistenter, serverseitiger Agent mit einem geschlossenen Lernzyklus, der ihn mit zunehmendem Einsatz tatsächlich leistungsfähiger macht.
Was Hermes Agent wirklich ist
Hermes Agent ist ein kostenloser, quelloffener autonomer KI-Agent, entwickelt von Nous Research, dem Team hinter der Hermes-Modellfamilie. Er läuft dauerhaft auf einem Server statt in einer IDE oder einem Browser-Tab. Jede abgeschlossene Aufgabe kann zu einer wachsenden Skill-Bibliothek beitragen, auf die der Agent in zukünftigen Sitzungen zurückgreift. Das praktische Ergebnis ist ein Agent, der von Anfang an leistungsfähig ist und sich im Laufe der Zeit zunehmend an die spezifischen Arbeitsabläufe und die Umgebung des Nutzers anpasst.
Das Projekt basiert auf der Hermes-Modellfamilie (Hermes-3, basierend auf Llama 3.1) und wurde mit Atropos Reinforcement Learning für hohe Tool-Calling-Genauigkeit trainiert. Zudem ist er modellunabhängig: Man kann ihn auf Nous Portal, OpenRouter (mit Zugang zu 200+ Modellen), OpenAI, Anthropic oder einen benutzerdefinierten Endpunkt ausrichten. Die Architektur ist so gestaltet, dass die zentrale Agentenlogik unabhängig vom darunter liegenden Modell funktioniert.
Die Gedächtnisarchitektur
Das Gedächtnis ist der Bereich, in dem Hermes Agent am deutlichsten von herkömmlichen Agenten abweicht. Er arbeitet auf drei verschiedenen Ebenen, und das Verständnis dieser Ebenen erklärt, warum der Anspruch auf Selbstverbesserung glaubwürdig ist und nicht nur Marketing.
Kurzfristiger Kontext
Standard-In-Context-Gedächtnis für die aktuelle Aufgabe. Nichts Ungewöhnliches, aber es fließt in das ein, was als Nächstes kommt.
Skill-Dokumente
Das ist das Herzstück des Lernzyklus. Hermes Agent erstellt Skill-Dokumente aus abgeschlossenen Aufgaben: durchsuchbare Markdown-Dateien, die dem agentskills.io-Standard folgen. Bei einem neuen Problem durchsucht der Agent seine Skill-Bibliothek per Volltextsuche (FTS5) und ruft relevante Verfahren aus früheren Erfahrungen ab. Skills sind dabei nicht statisch, der Agent verbessert sie während der Nutzung und motiviert sich selbst dazu, neues Wissen nach jeder Sitzung zu speichern. Es ist der einzige große quelloffene Agent mit dieser Art von prozeduralem Gedächtnis.
Nutzermodellierung über Honcho
Hermes Agent integriert Honcho für die Nutzermodellierung, was bedeutet, dass er ein Bild Ihrer Präferenzen, Ihres Arbeitsstils und Ihres Kontexts aufbaut, das sitzungsübergreifend bestehen bleibt. Kombiniert mit der FTS5-Suche über vergangene Konversationen kann er relevante Verläufe abrufen, ohne dass Sie bereits bereitgestellten Kontext erneut erklären müssen.
Der geschlossene Lernzyklus
Der Lernzyklus ist das, was Hermes Agent von Tools unterscheidet, die lediglich persistentes Gedächtnis haben. Die meisten Agenten erinnern sich an das, was man ihnen gesagt hat. Hermes Agent lernt aus dem, was er getan hat. Die Abfolge sieht so aus:
Nous Research bezeichnet dies als "the only agent with a built-in learning loop", und die Architektur bestätigt diesen Anspruch. Der Nudge-Mechanismus, bei dem der Agent sich aktiv selbst dazu veranlasst, Wissen zu persistieren, anstatt auf explizite Anweisung zu warten, ist besonders gut durchdacht. Er sorgt dafür, dass die Skill-Akkumulation automatisch erfolgt, ohne manuelle Pflege zu erfordern.
Plattformübergreifendes Messaging über ein einziges Gateway
Hermes Agent verbindet sich mit Telegram, Discord, Slack, WhatsApp, Signal und CLI über einen einzigen Gateway-Prozess. Es sind keine separaten Integrationen für jede Plattform erforderlich. Das Gateway leitet Nachrichten unabhängig von ihrer Herkunft an das Agenten-Runtime weiter, was bedeutet, dass derselbe persistente Agent mit derselben Skill-Bibliothek antwortet, egal ob man ihn über Slack am Schreibtisch oder Telegram am Smartphone erreicht.
Das ist wichtiger als es auf den ersten Blick erscheinen mag. Die größte Adoptionsbarriere für KI-Agenten in Teams ist meist, dass der Agent irgendwo separat von den eigentlichen Arbeitsorten lebt. Ein Agent, der die Menschen in ihren bestehenden Kommunikationskanälen trifft, beseitigt diese Reibung vollständig.
Ausführungsbackends
Hermes Agent unterstützt sechs Ausführungsbackends, was ihm eine ungewöhnlich breite Deployment-Flexibilität für ein Open-Source-Projekt verleiht:
- Local - läuft direkt auf Ihrem Rechner
- Docker - containerisierte Ausführung für Isolation
- SSH - Remote-Ausführung auf beliebigen zugänglichen Servern
- Daytona - verwaltete Entwicklungsumgebungen
- Singularity - HPC- und Forschungsrechencluster
- Modal - serverlose Cloud-Ausführung
Das Singularity-Backend ist besonders hervorzuheben. Es macht Hermes Agent praktikabel für akademische und wissenschaftliche Rechenumgebungen, in denen Docker oft nicht verfügbar ist. Kombiniert mit den unten beschriebenen Forschungs-Tools positioniert dies ihn als echtes Werkzeug für Forschungsteams, nicht nur für Softwareentwickler.
40+ integrierte Tools und MCP-Integration
Von Anfang an liefert Hermes Agent mehr als 40 integrierte Tools für Dateioperationen, Shell-Ausführung, Web-Browsing, API-Aufrufe und mehr. Er unterstützt auch das Model Context Protocol (MCP), was bedeutet, dass er mit jedem MCP-kompatiblen Tool-Server erweitert werden kann. Die natürlichsprachliche Cron-Planung ermöglicht die Definition von wiederkehrenden Aufgaben in einfachem Englisch statt in Cron-Syntax, was den Einrichtungsaufwand für nicht-technische Nutzer erheblich reduziert.
Forschungs-Tools: Batch-Trajectories und Fine-Tuning
Nous Research hat Hermes Agent mit Blick auf die eigenen Forschungsbedürfnisse entwickelt, und die Forschungs-Tools spiegeln das wider. Der Agent unterstützt Batch-Trajectory-Generierung für die Erfassung von Agentenverhalten in großem Maßstab, native Atropos-RL-Integration für Reinforcement Learning aus Agentenerfahrungen und ShareGPT-Export für die Umwandlung von Agenten-Konversationen in Fine-Tuning-Datensätze.
Das ist ein bedeutsames Detail. Die meisten quelloffenen Agenten-Frameworks behandeln die Sammlung von Trainingsdaten als Nachgedanken. Hermes Agent macht sie zu einer erstklassigen Funktion. Wer ein Modell auf eine spezifische Domäne fine-tunen möchte, findet die Infrastruktur für die Generierung und den Export von Trainingsdaten bereits integriert.
Der Zusammenhang mit AutoResearch
Hermes Agent bewegt sich im selben konzeptionellen Bereich wie AutoResearch: Beide repräsentieren den Wandel hin zu KI-Systemen, die sich selbst verbessern, anstatt statische Tools zu bleiben. AutoResearch konzentriert sich auf autonome wissenschaftliche Untersuchungen, iteriert durch Hypothesengenerierung und experimentelle Validierung. Hermes Agent konzentriert sich auf die Akkumulation prozeduraler Skills und lernt, wie Aufgaben im Laufe der Zeit effektiver erfüllt werden können.
Der gemeinsame Nenner ist, dass keines der Systeme als festes Tool konzipiert ist, das man einmal konfiguriert. Beide sind darauf ausgelegt, mit der Zeit an Wert zu gewinnen. Das ist ein grundlegend anderes Paradigma als die aktuelle Generation von KI-Assistenten, mit erheblichen Auswirkungen darauf, wie Unternehmen über den Einsatz von KI nachdenken sollten.
Was das für Unternehmen bedeutet
Der Compounding-Value-Ansatz
Herkömmliche Softwaretools liefern an Tag eins in etwa denselben Wert wie an Tag hundert. Ein Agent mit einem Lernzyklus ist anders. Die Skill-Bibliothek, die er aus spezifischen Arbeitsabläufen, der eigenen Codebasis und internen Prozessen aufbaut, wird zu einem Wettbewerbsvorteil. Ein gut betriebener Hermes-Agent-Einsatz nach sechs Monaten wird bei bestimmten Aufgaben erheblich effektiver sein als zu Beginn, weil er domänenspezifische Verfahren angesammelt hat, die kein Standard-Tool replizieren kann.
Die Infrastrukturverpflichtung
Persistente serverseitige Agenten erfordern Infrastruktur, die sitzungsbasierte Tools nicht benötigen. Man braucht kontinuierlich laufende Rechenleistung, Speicher für Skill-Dokumente und Konversationsverläufe, Monitoring für ein autonomes System, das Code ausführt und APIs aufruft, sowie eine Sicherheitshaltung, die einem Agenten mit umfassendem Tool-Zugang angemessen ist. Das Open-Source-Modell bedeutet keine Lizenzkosten, aber der Betriebsaufwand ist real. Teams, die Hermes Agent evaluieren, sollten den erforderlichen Engineering-Aufwand für einen zuverlässigen Betrieb einkalkulieren.
Modellflexibilität als Risiko-Absicherung
Die modellunabhängige Architektur ist über den offensichtlichen Flexibilitätsvorteil hinaus ein praktischer Vorzug. KI-Modellleistung und -preise verändern sich rapide. Ein Agenten-Framework, das einen an einen einzigen Anbieter bindet, setzt einen den Preisentscheidungen und Modell-Deprecations dieses Anbieters aus. Die Unterstützung von Hermes Agent für OpenRouter, OpenAI, Anthropic und benutzerdefinierte Endpunkte bedeutet, dass das zugrundeliegende Modell gewechselt werden kann, ohne die Agentenkonfiguration neu zu erstellen oder die akkumulierte Skill-Bibliothek zu verlieren.
Erste Schritte
Das Hermes Agent GitHub-Repository und die offizielle Dokumentation sind die richtigen Ausgangspunkte. Das Projekt ist aktiv, Nous Research iteriert schnell. Wer es für einen Produktionseinsatz evaluiert, sollte die aktuellen Release Notes prüfen, anstatt sich auf Dokumentation zu verlassen, die möglicherweise hinter den neuesten Änderungen zurückliegt.
Die plattformübergreifende Messaging-Unterstützung macht einen ersten Test unkompliziert: Man verbindet ihn mit einem Slack-Kanal oder Telegram-Bot, gibt ihm eine kleine Menge wiederkehrender Aufgaben und beobachtet, wie sich die Skill-Bibliothek über zwei bis drei Wochen entwickelt. Das ist ein niedrigschwelliger Weg, den Lernzyklus-Anspruch zu validieren, ohne einen vollständigen Produktionseinsatz zu wagen.
Bei webvise helfen wir Unternehmen, KI-Agenten-Architekturen zu evaluieren und zu implementieren, von der ersten Machbarkeitsbewertung bis zur Produktionsumsetzung. Wenn Sie selbstverbessernde Agenten wie Hermes Agent erkunden oder verstehen möchten, wie autonome KI in Ihre spezifischen Arbeitsabläufe passt, nehmen Sie Kontakt auf und wir helfen Ihnen, den Ansatz zu finden, der Ihren Anforderungen und Ihrer Infrastruktur entspricht.
Weitere Artikel
Paperclip: Die Open-Source-Steuerungsebene für KI-Agenten-Unternehmen
Paperclip ist kein weiterer Task-Manager. Gestartet im März 2026, gibt es Multi-Agenten-Teams Organigramme, Budgets, Prüfprotokolle und Governance auf Vorstandsebene. Was es ist, wie es funktioniert und warum es wichtig ist.
Nächster ArtikelKarpathys AutoResearch: Was passiert, wenn KI die Forschung übernimmt
Andrej Karpathy veröffentlichte AutoResearch im März 2026, ein Open-Source-Framework, das KI-Coding-Agenten nachts autonom Machine-Learning-Experimente durchführen lässt. 65.000 GitHub-Sterne in wenigen Wochen. Was dahintersteckt.