Hermes Agent: Was es ist & wie es lernt (2026)

Hermes Agent ist der quelloffene, selbstverbessernde autonome KI-Agent von Nous Research. Er läuft dauerhaft auf einem Server, verbindet sich über ein einziges Gateway mit Telegram, Slack, Discord, WhatsApp, Signal und CLI und baut aus abgeschlossenen Aufgaben eine eigene Skill-Bibliothek auf. Das Projekt startete im Februar 2026 und erreichte binnen acht Wochen 24.600+ GitHub-Sterne. Sternzahlen spiegeln Sichtbarkeit und Community-Interesse wider; die Produktionsreife erfordert eine gesonderte Bewertung. Der Agent ist modell-agnostisch, kostenlos und unterscheidet sich von den meisten anderen Agenten in einem zentralen Punkt: einer geschlossenen Lernschleife, die ihn mit jeder Nutzung leistungsfähiger macht.

Wer hat ihn entwickelt? Nous Research, das Team hinter der Hermes-Modellfamilie (Hermes-3, basierend auf Llama 3.1).
Ist er Open Source? Ja, vollständig quelloffen auf GitHub.
Was macht ihn besonders? Eine geschlossene Lernschleife. Aus abgeschlossenen Aufgaben entstehen Skill-Dokumente, die der Agent bei ähnlichen Problemen automatisch abruft.
Welche Plattformen werden unterstützt? Telegram, Slack, Discord, WhatsApp, Signal, Matrix, iMessage (über BlueBubbles), WeChat und CLI über ein einziges Gateway.
Mit welchen Modellen funktioniert er? Modell-agnostisch: Nous Portal, OpenRouter (200+ Modelle), OpenAI, Anthropic oder ein beliebiger eigener Endpunkt.
Welche Version ist aktuell? Version 0.9.0 ("Everywhere"), veröffentlicht im April 2026. Neu: Profile für isolierte Multi-Agent-Teams. Zur Produktivbereitstellung empfiehlt sich der Day-30-Operator-Layer-Leitfaden.

Den meisten KI-Coding-Tools ist eine grundlegende Schwäche gemein: Mit dem Ende einer Session ist alles vergessen. Nous Research hat Hermes Agent gezielt dafür entwickelt, dieses Problem zu beheben. Strukturell unterscheidet er sich grundlegend von einem Chatbot mit konfigurierbarer Gedächtnisfunktion. Hinter dem Tagline "the agent that grows with you" steckt mehr als Marketing: Es ist ein dauerhaft laufender, serverseitiger Agent.

Was Hermes Agent tatsächlich ist

Hermes Agent ist ein kostenloser, quelloffener autonomer KI-Agent von Nous Research, dem Team hinter der Hermes-Modellfamilie. Er läuft dauerhaft auf einem Server, nicht in einer IDE oder einem Browser-Tab. Jede abgeschlossene Aufgabe kann in eine wachsende Skill-Bibliothek einfließen, auf die der Agent in künftigen Sessions zurückgreift. Das Ergebnis: ein Agent, der von Anfang an leistungsfähig ist und sich im Laufe der Zeit immer besser an spezifische Workflows und Umgebungen anpasst.

Das Projekt basiert auf der Hermes-Modellfamilie (Hermes-3, basierend auf Llama 3.1) und wurde mit Atropos Reinforcement Learning auf hohe Tool-Calling-Genauigkeit trainiert. Gleichzeitig ist er modell-agnostisch: Nous Portal, OpenRouter (mit Zugang zu 200+ Modellen), OpenAI, Anthropic oder ein eigener Endpunkt lassen sich frei wählen. Die Architektur ist so ausgelegt, dass die Kernlogik des Agenten unabhängig vom darunterliegenden Modell funktioniert.

Die Speicherarchitektur

Im Bereich Gedächtnis weicht Hermes Agent am deutlichsten von konventionellen Agenten ab. Drei klar getrennte Ebenen bilden die Grundlage, und wer sie versteht, erkennt, warum der Anspruch auf Selbstverbesserung substanziell ist und kein Marketingversprechen.

Kurzzeit-Kontext

Standardmäßiges In-Context-Memory für die aktuelle Aufgabe. Nichts Ungewöhnliches, aber es legt den Grundstein für das, was folgt.

Skill-Dokumente

Hier liegt der Kern der Lernschleife. Hermes Agent erstellt aus abgeschlossenen Aufgaben Skill-Dokumente: durchsuchbare Markdown-Dateien nach dem agentskills.io-Standard. Bei einem neuen Problem durchsucht der Agent seine Skill-Bibliothek per Volltextsuche (FTS5) und ruft passende Vorgehensweisen aus früherer Erfahrung ab. Die Dokumente sind dabei nicht statisch: Der Agent verbessert sie aktiv während der Nutzung und veranlasst sich nach jeder Session selbst, neues Wissen zu speichern. Damit gehört er zu den wenigen bedeutenden Open-Source-Agenten mit eingebautem prozeduralem Gedächtnis dieser Art.

User-Modeling über Honcho

Hermes Agent integriert Honcho für das User-Modeling. Dabei entsteht eine Repräsentation von Präferenzen, Arbeitsstil und Kontext, die sessionübergreifend erhalten bleibt. Kombiniert mit der FTS5-Suche über vergangene Gespräche kann der Agent relevante Vorgeschichte abrufen, ohne dass bereits gelieferter Kontext erneut erklärt werden muss.

Die geschlossene Lernschleife

Die Lernschleife ist das, was Hermes Agent von Werkzeugen mit bloßem persistentem Gedächtnis unterscheidet. Die meisten Agenten erinnern sich an das, was Sie ihnen gesagt haben. Hermes Agent lernt aus dem, was er getan hat. Die Abfolge sieht so aus:

Nous Research bezeichnet dies als Agenten mit eingebetteter Lernschleife, eine Eigenschaft, die in produktiven Agent-Frameworks noch immer selten ist. Wer die Architektur genauer betrachtet, stellt fest: Die Aussage ist fundiert. Besonders durchdacht ist der Nudge-Mechanismus, bei dem der Agent sich aktiv selbst dazu veranlasst, Wissen zu persistieren, anstatt auf explizite Anweisungen zu warten. Skill-Akkumulation geschieht damit automatisch, ohne manuelle Pflege.

Plattformübergreifendes Messaging über ein einziges Gateway

Hermes Agent verbindet sich mit Telegram, Discord, Slack, WhatsApp, Signal und CLI über einen einzigen Gateway-Prozess. Separate Integrationen für jede Plattform entfallen. Das Gateway leitet Nachrichten unabhängig vom Ursprung an die Agent-Runtime weiter: Ob Sie über Slack am Schreibtisch oder Telegram unterwegs zugreifen, antwortet stets derselbe persistente Agent mit derselben Skill-Bibliothek.

Das ist relevanter als es auf den ersten Blick scheint. Die größte Adoptionsbarriere für KI-Agenten in Teams ist meist, dass der Agent abseits der eigentlichen Arbeitsorte lebt. Ein Agent, der Menschen in ihren bestehenden Kommunikationskanälen begegnet, beseitigt diese Hürde vollständig.

Ausführungs-Backends

Hermes Agent unterstützt sechs Ausführungs-Backends, was ihm für ein Open-Source-Projekt ungewöhnlich breite Deployment-Flexibilität verschafft:

Local: läuft direkt auf Ihrem Rechner
Docker: containerisierte Ausführung für Isolation
SSH: Remote-Ausführung auf jedem erreichbaren Server
Daytona: verwaltete Entwicklungsumgebungen
Singularity: HPC- und wissenschaftliche Compute-Cluster
Modal: serverlose Cloud-Ausführung

Das Singularity-Backend verdient besondere Erwähnung. Es macht Hermes Agent in akademischen und wissenschaftlichen Computing-Umgebungen nutzbar, wo Docker häufig nicht verfügbar ist. Zusammen mit den nachfolgend beschriebenen Research-Tools positioniert es ihn als ernsthaftes Werkzeug für Forschungsteams, nicht nur für Softwareentwickler.

40+ integrierte Tools und MCP-Integration

Hermes Agent wird standardmäßig mit mehr als 40 integrierten Tools ausgeliefert, die Dateioperationen, Shell-Ausführung, Web-Browsing, API-Aufrufe und mehr abdecken. Daneben unterstützt er das Model Context Protocol (MCP), sodass sich beliebige MCP-kompatible Tool-Server einbinden lassen. Natural-Language-Cron-Scheduling ermöglicht es, wiederkehrende Aufgaben auf Englisch statt in Cron-Syntax zu definieren, was den Einrichtungsaufwand für nicht-technische Nutzer erheblich reduziert.

Research-Tooling: Batch-Trajektorien und Fine-Tuning

Nous Research hat Hermes Agent mit Blick auf eigene Forschungsanforderungen entwickelt, und das Research-Tooling spiegelt das wider. Der Agent unterstützt Batch-Trajektoriengenerierung zur Erfassung von Agentenverhalten im großen Maßstab, native Atropos-RL-Integration für Reinforcement Learning aus Agentenerfahrungen sowie ShareGPT-Export, um Agentengespräche in Fine-Tuning-Datensätze umzuwandeln.

Das ist ein bedeutsames Detail. Die meisten Open-Source-Agent-Frameworks behandeln die Erfassung von Trainingsdaten als Nachgedanken. In Hermes Agent ist sie ein erstklassiges Feature. Wer ein Modell auf der eigenen Domain fine-tunen möchte, findet die nötige Infrastruktur zur Generierung und zum Export von Trainingsdaten bereits integriert.

Der Bezug zu AutoResearch

Hermes Agent bewegt sich im selben konzeptuellen Raum wie AutoResearch: Beide stehen für den Wandel hin zu KI-Systemen, die sich selbst verbessern, statt statische Werkzeuge zu bleiben. Selbstverbessernd im Sinne des Lernens aus Ergebnissen innerhalb des eigenen Skill-Graphen, nicht autonom im AGI-Sinne. AutoResearch konzentriert sich auf autonome wissenschaftliche Forschung, mit Iteration durch Hypothesenbildung und experimentelle Validierung. Hermes Agent fokussiert auf prozedurale Skill-Akkumulation, also darauf, Aufgaben mit der Zeit immer wirkungsvoller zu erledigen.

Der gemeinsame Nenner: Keines der Systeme ist als einmalig konfigurierbares Fixwerkzeug konzipiert. Beide sind darauf ausgelegt, mit zunehmender Laufzeit an Wert zu gewinnen. Das verändert die Deployment-Planung grundlegend: Gedächtnis, Evaluation, Eigentümerschaft und der sichere Übergang gelernter Verfahren in die Produktion müssen von Anfang an mitgedacht werden.

Geschäftliche Anwendungsfälle

Der Fall für kumulativen Wert

Konventionelle Software-Tools liefern an Tag 100 ungefähr denselben Wert wie an Tag eins. Ein Agent mit Lernschleife verhält sich anders. Die Skill-Bibliothek, die sich aus spezifischen Workflows, einer Codebasis und internen Prozessen aufbaut, wird zum Wettbewerbsvorteil. Ein gut betriebenes Hermes-Agent-Deployment nach sechs Monaten wird bei den eigenen Aufgaben erheblich leistungsfähiger sein als zu Beginn, weil domänenspezifische Verfahren akkumuliert werden, die kein vorkonfiguriertes Tool replizieren kann.

Die Infrastrukturverpflichtung

Dauerhaft laufende serverseitige Agenten erfordern Infrastruktur, die sessionbasierte Tools nicht brauchen. Notwendig sind kontinuierlich laufende Compute-Ressourcen, Speicherplatz für Skill-Dokumente und Gesprächshistorie, Monitoring für ein autonomes System, das Code ausführt und APIs aufruft, sowie ein Sicherheitskonzept, das dem breiten Tool-Zugriff des Agenten gerecht wird. Das Open-Source-Modell bedeutet keine Lizenzkosten, aber der operative Aufwand ist real. Teams, die Hermes Agent evaluieren, sollten den Engineering-Aufwand für einen zuverlässigen Betrieb von Anfang an einkalkulieren.

Modellflexibilität als Risikoabsicherung

Die modell-agnostische Architektur ist ein praktischer Vorteil, der über bloße Flexibilität hinausgeht. KI-Modellleistung und -preise verändern sich schnell. Ein Agent-Framework, das an einen einzigen Anbieter bindet, setzt einen dessen Preisentscheidungen und Modell-Deprecations aus. Die Unterstützung von OpenRouter, OpenAI, Anthropic und eigenen Endpunkten erlaubt es, das zugrundeliegende Modell zu wechseln, ohne die Agent-Konfiguration neu aufzubauen oder die akkumulierte Skill-Bibliothek zu verlieren.

Erste Schritte

Der richtige Einstieg sind das Hermes-Agent-GitHub-Repository und die offizielle Dokumentation. Das Projekt ist aktiv, Nous Research iteriert zügig. Wer es für einen Produktiveinsatz evaluiert, sollte die aktuellen Release Notes konsultieren, statt sich auf Dokumentation zu verlassen, die neueren Änderungen möglicherweise hinterherhinkt.

Die plattformübergreifende Messaging-Unterstützung vereinfacht einen ersten Test erheblich: Den Agenten an einen Slack-Kanal oder Telegram-Bot anbinden, eine kleine Menge wiederkehrender Aufgaben übergeben und beobachten, wie sich die Skill-Bibliothek über zwei bis drei Wochen entwickelt. Das ist ein deutlich ressourcenschonenderer Weg, die Lernschleife zu validieren, als ein vollständiges Produktiv-Deployment.

webvise unterstützt Unternehmen bei der Bewertung und Implementierung von KI-Agenten-Architekturen, von der initialen Machbarkeitsbewertung bis zur Produktivbereitstellung. Wer selbstverbessernde Agenten wie Hermes Agent evaluiert oder verstehen möchte, wie autonome KI in die eigenen Workflows passt, kann sich melden: webvise findet den Ansatz, der zu den konkreten Anforderungen und der vorhandenen Infrastruktur passt.

Die Praktiken von webvise sind an den ISO 27001- und ISO 42001-Standards ausgerichtet.