Hermes Agent w produkcji: problem 30. dnia

Warstwa operatorska Hermes Agent to zbiór dyscyplin utrzymujących spójność zespołu wieloprofilowego po dniu 30. Cztery prymitywy: handoff contracts z możliwością blokowania, audyty memory-KPI per profil, bramki uprawnień per rola i skoordynowany stan cron. Bez nich 4-profilowy zespół (Hermes, Alan, Mira, Turing) wykazuje oznaki konwergencji głosów w ciągu miesiąca.

Większość przewodników operatorskich Hermes zatrzymuje się na bootstrapie 4-profilowym; materiał dotyczący wdrożenia na dzień 30 jest rzadki w publicznej dokumentacji. Dzień 30 to moment, w którym profile zaczynają brzmieć tak samo, handoffy po cichu przestają działać, a build stanowiący powód do dumy staje się nie do odróżnienia od konfiguracji z jednym agentem.

Jeśli Hermes Agent w wersji 0.9.0 działa ze standardowym bootstrapem obejmującym profile Alan, Mira i Turing, podstawowy build jest kompletny; praca na dzień 30 zaczyna się od tego momentu. Każdy prymityw poniżej pochodzi z rzeczywistych wzorców wdrożeniowych i jest powiązany z konkretnym trybem awarii, który wymusza jego istnienie.

Handoff contracts są prawdziwe tylko wtedy, gdy mogą blokować. Jeśli kształt wejścia odbierającego profilu jest nieprawidłowy, handoff musi zakończyć się niepowodzeniem, a nie tylko ostrzeżeniem.
Pamięć gnije per profil. Cotygodniowy audyt `memory-kpi` wyłapuje to wcześnie. Przekroczenie progu 15% nieaktualnych notatek wyzwala przebieg `brain-resolve`.
Bramki uprawnień zapobiegają cichemu rozszerzaniu przywilejów. Alan nigdy nie otrzymuje dostępu do powłoki. Tylko orchestrator może zatwierdzać commity do main.
Cztery tryby awarii na dzień 30 wyjaśniają większość regresji wdrożeniowych obserwowanych w środowiskach wieloagentowych. Dryf profili, rotacja handoffów, rozrost SOUL.md, kolizja cron. Każdy ma konkretne przeciwdziałanie.
Przeczytaj najpierw [przewodnik po definicji Hermes Agent](/blog/hermes-agent-self-improving-ai), jeśli potrzebny jest kontekst dotyczący czym jest ten agent przed warstwą operatorską.

Bazowy 4-profilowy zespół (podsumowanie)

Zanim warstwa operatorska ma znaczenie, 4-profilowy zespół startowy musi być uruchomiony. Opisany poniżej kanoniczny podział to ten, do którego zbiega większość produkcyjnych wdrożeń Hermes.

Hermes (orchestrator). Planuje, dekompozuje, kieruje, syntetyzuje. Kontroler ruchu, nie wąskie gardło.
Alan (specjalista ds. badań). Opiera się na źródłach, sceptyczny, świadomy niepewności. Chroni zespół przed zmyśloną pewnością.
Mira (architekt narracji). Klarowność, struktura, świadomość odbiorcy. Przekształca zweryfikowany materiał w komunikację.
Turing (budowniczy i debugger). Implementacja, logi, diffy, odtwarzalność. Liczy się z testami, nie z narracyjnym szlifem.

Profile izolują jednocześnie siedem elementów stanu: konfigurację, sesje, pamięć, umiejętności, osobowość, stan cron i stan bramki. Ta izolacja jest prymitywem, od którego zależy warstwa operatorska. Jeśli nadal działa jeden profil niosący pięć ról, żaden z poniższych wzorców nie pomoże. Najpierw napraw prymityw.

Jeśli potrzebna jest pomoc w ocenie, czy 4-profilowe wdrożenie Hermes pasuje do rzeczywistego obciążenia pracą zespołu, webvise może przez to przeprowadzić.

Handoff contracts: jedyna rzecz blokująca dryf profili

Handoff contract to czteroelementowa specyfikacja przechowywana w `~/.hermes/team/handoffs/<from>-to-<to>.md`. Contract jest prawdziwy tylko wtedy, gdy może blokować. Jeśli wejście nie pasuje do zadeklarowanego kształtu, harness kończy handoff niepowodzeniem i wymaga przeglądu przez człowieka. Cztery wymagane pola:

Pole	Definicja	Przykład (Alan do Miry)
Kształt wejścia	Czego oczekuje odbierający profil	Ocenione twierdzenia z URL-ami źródeł, nie surowe fragmenty
Kształt wyjścia	Co zwróci odbierający profil	Szkic sekcji plus dziennik zmian, nie gotowy artykuł
Akcja przy błędzie	Co dzieje się, gdy wejście jest nieprawidłowe	block, require-human-review lub retry
Bramka weryfikacji	Jedno twierdzenie, które musi być prawdziwe przed zakończeniem handoffu	Każde twierdzenie ma URL źródła

Bramka jest nośna. Większość zespołów pisze dokumenty handoff jako sugestie i zastanawia się, dlaczego profile dryfują. Sugestia nigdy nie blokuje. Bez blokady Alan w końcu wysyła surowe transkrypty do Miry, Mira zaczyna szkicować bez atrybuowania źródeł i jakość wyjścia zespołu eroduje jeden cichy handoff na raz.

Memory-KPI: próg 15% nieaktualnych notatek

Pamięć gnije wewnątrz każdego profilu tak samo, jak wspólne wiki gnije po przekroczeniu 100 stron. Cotygodniowy audyt wyłapuje gnicie, zanim profil zacznie cytować siebie z przestarzałego kontekstu. Trzy metryki per profil mają znaczenie:

`source_backed_pct`: odsetek notatek, które nadal mają możliwe do pobrania źródło. Spada, gdy źródła zwracają 404 lub zostają usunięte.
`stale_notes`: liczba notatek, których przywołany kod, URL lub konfiguracja nie odpowiada już rzeczywistości.
`contradiction_notes`: liczba notatek sprzecznych z czymś innym w pamięci tego samego profilu.

Cotygodniowe polecenie audytu działa dla każdego profilu specjalisty: `for p in alan mira turing; do hermes -p $p memory-kpi --json | jq '.source_backed_pct, .stale_notes, .contradiction_notes'; done`. Obserwuj `stale_notes`. Gdy przekroczy 15% wszystkich notatek w profilu, zaplanuj przebieg `brain-resolve`, zanim profil zacznie cytować siebie z przestarzałego kontekstu.

Bramki uprawnień: uprawnienia per rola

Żaden profil nie otrzymuje więcej uprawnień niż potrzebuje jego rola. Orchestrator jest jedynym profilem uprawnionym do rozszerzania zakresu jakiegokolwiek innego profilu. Zapisanie tego w tabeli sprawdzanej co tydzień to różnica między zarządzanym zespołem a czterema agentami, którzy powoli wszyscy stają się administratorami.

Profil	Klasa ryzyka	Uprawnienia
Alan (badania)	bezpieczna	Odczyt sieci i repo, zapis tylko do research/. Bez dostępu do powłoki, bez zapisu poza sandboxem.
Mira (pisarz)	bezpieczna	Odczyt wyników badań, zapis tylko do drafts/. Bez dostępu do sekretów, bez wykonywania kodu.
Turing (inżynier)	wymaga przeglądu	Odczyt repo, uruchamianie sandboxowanych testów, zapis do feature branch. Każdy commit do main wymaga zatwierdzenia przez orchestratora.
Hermes (orchestrator)	krytyczna	Jedyny profil uprawniony do zatwierdzania commitów Turinga, mergowania gałęzi lub wywoływania płatnych wywołań API powyżej limitu budżetu.

Zasada jest nośna. Agent badawczy z dostępem do powłoki w końcu uruchomi polecenie, którego uruchamiać nie powinien. Profil pisarza z dostępem do sekretów w końcu wycieknie je do szkicu. Dryf uprawnień dzieje się cicho i jest oczywisty dopiero z perspektywy czasu, co jest trudnym momentem na odkrycie luki.

Cztery tryby awarii na dzień 30

Cztery konkretne tryby awarii odpowiadają za większość regresji wdrożeniowych obserwowanych w konfiguracji wieloagentowej Hermes. Każdy ma bezpośrednie przeciwdziałanie. Pominięcie któregokolwiek sprawi, że zespół wygląda świetnie w pierwszym dniu, a rozmywa się w dniu 30.

1. Dryf profili

Edycje SOUL.md narastają po cichu. Mira powoli staje się Turingiem. Rozwiązanie: co tydzień porównuj każdy SOUL.md z wersją z pierwszego dnia. Każda nowa odpowiedzialność otrzymuje wpis zatwierdzenia w dzienniku albo zostaje cofnięta. Bez wyjątków dla małych edycji, bo to właśnie z nich wynika dryf.

2. Rotacja handoffów

Plik contract istnieje, ale nikt go nie egzekwuje. Alan znowu zaczyna wysyłać surowe transkrypty do Miry. Rozwiązanie: podłącz każdy plik handoff do harnessa tak, by niedopasowane wejście blokowało. Contract, który nie może blokować, to dokumentacja, nie kontrola.

3. Rozrost SOUL.md

Każda rola rośnie o akapity obsługujące przypadki graniczne, aż agent traci swoją pierwotną tożsamość w szumie. Rozwiązanie: ogranicz SOUL.md do 400 słów. Wszystko ponad to trafia do AGENTS.md lub pliku referencyjnego per domena. Ograniczenie zmusza do utrzymania tożsamości w ryzach.

4. Kolizja cron

Wiele profili planuje zadania na godzinę 3 w nocy bez koordynacji. Orchestrator budzi się, zastając czterech agentów walczących o ten sam limit API. Rozwiązanie: jeden wspólny plik `~/.hermes/team/cron.md` wymieniający każde zaplanowane zadanie we wszystkich profilach z dokładną godziną, czasem trwania i zależnościami. Sprawdź go przed dodaniem nowego crona.

Dopasowanie do zespołów biznesowych

Warstwa operatorska to część, która przekształca demo Hermes w trwałą infrastrukturę produkcyjną. Większość zespołów oceniających frameworki wieloagentowe skupia się na koszcie wstępnej konfiguracji i pomija model utrzymania. 4-profilowy zespół bez handoff contracts, audytów pamięci i bramek uprawnień ma tę samą krzywą awarii co agent jednoprofilowy z sześciotygodniowym opóźnieniem: działa sprawnie na początku, niewidocznie się degraduje, odpada gdy jest najbardziej potrzebny.

Przypadek wartości kumulowanej dla Hermes, czyli powód, dla którego biblioteka umiejętności ma znaczenie, zachodzi tylko wtedy, gdy utrzymuje się warstwa operatorska. Umiejętności zgromadzone przez profil, który po cichu dryfował do innej roli, to umiejętności dla roli, której już nie ma.

webvise pomaga firmom projektować i obsługiwać architektury agentów AI, w tym wieloprofilowe zespoły Hermes z dyscypliną zarządzania pozwalającą przetrwać po dniu 30. Jeśli oceniają Państwo wdrożenie Hermes lub mają już takie, które zaczyna się rozmywać, zapraszamy do kontaktu, aby wzmocnić warstwę operatorską, zanim tryby awarii się skumulują.

Praktyki webvise są zgodne z normami ISO 27001 i ISO 42001.