Wdrożenie Hermes Agent w produkcji: warstwa operatorska na dzień 30
Większość 4-profilowych zespołów Hermes Agent działa sprawnie w pierwszym dniu i zlewa się w jeden głos do dnia 30. Warstwa operatorska, która temu zapobiega: handoff contracts, audyty memory-KPI i bramki uprawnień per rola.
Warstwa operatorska Hermes Agent to zbiór dyscyplin, które utrzymują spójność zespołu wieloprofilowego po dniu 30. Cztery prymitywy: handoff contracts z możliwością blokowania, audyty memory-KPI per profil, bramki uprawnień per rola i skoordynowany stan cron. Bez nich 4-profilowy zespół (Hermes, Alan, Mira, Turing) zlewa się w jednego rozmytego agenta w ciągu miesiąca.
Każdy przewodnik operatorski Hermes online kończy się na bootstrapie 4-profilowym. Nikt nie publikuje zrzutów ekranu z dnia 30, bo dzień 30 to moment, w którym profile zaczynają brzmieć tak samo, handoffy po cichu przestają działać, a build, z którego byliśmy dumni, staje się nie do odróżnienia od konfiguracji z jednym agentem.
Jeśli Państwo mają Hermes Agent w wersji 0.9.0 działający z profilami Alan, Mira i Turing, podstawowy build jest gotowy. To, co następuje, to warstwa operatorska. Każdy prymityw poniżej pochodzi z rzeczywistych wzorców wdrożeniowych i jest powiązany z konkretnym trybem awarii, który wymusza jego istnienie.
Handoff contracts są prawdziwe tylko wtedy, gdy mogą blokować. Jeśli kształt wejścia odbierającego profilu jest nieprawidłowy, handoff musi zakończyć się niepowodzeniem, nie tylko ostrzeżeniem.
Pamięć gnije per profil. Uruchamiaj cotygodniowy audyt `memory-kpi`. Przekroczenie 15% nieaktualnych notatek wyzwala przebieg `brain-resolve`.
Bramki uprawnień zapobiegają cichemu rozszerzaniu przywilejów. Alan nigdy nie otrzymuje dostępu do powłoki. Tylko orchestrator może zatwierdzać commity do main.
Cztery tryby awarii na dzień 30 niszczą większość wdrożeń. Dryf profili, rotacja handoffów, rozrost SOUL.md, kolizja cron. Każdy ma konkretne przeciwdziałanie.
Przeczytaj najpierw [przewodnik po definicji Hermes Agent](/blog/hermes-agent-self-improving-ai), jeśli potrzebny jest kontekst dotyczący czym jest ten agent przed warstwą operatorską.
Bazowy 4-profilowy zespół (podsumowanie)
Zanim warstwa operatorska ma znaczenie, 4-profilowy zespół startowy musi być uruchomiony. Opisany poniżej kanoniczny podział to ten, do którego zbiega większość produkcyjnych wdrożeń Hermes.
Hermes (orchestrator). Planuje, dekompozuje, kieruje, syntetyzuje. Kontroler ruchu, nie wąskie gardło.
Alan (specjalista ds. badań). Opiera się na źródłach, sceptyczny, świadomy niepewności. Chroni zespół przed zmyśloną pewnością.
Mira (architekt narracji). Klarowność, struktura, świadomość odbiorcy. Przekształca zweryfikowany materiał w komunikację.
Turing (budowniczy i debugger). Implementacja, logi, diffy, odtwarzalność. Zależy mu na testach, nie na narracyjnym szlifie.
Profile izolują jednocześnie siedem elementów stanu: konfigurację, sesje, pamięć, umiejętności, osobowość, stan cron i stan bramki. Ta izolacja jest prymitywem, od którego zależy warstwa operatorska. Jeśli nadal działa jeden profil niosący pięć ról, żaden z poniższych wzorców nie pomoże. Najpierw napraw prymityw.
Jeśli potrzebna jest pomoc w ocenie, czy 4-profilowe wdrożenie Hermes pasuje do rzeczywistego obciążenia pracą zespołu, webvise może przez to przeprowadzić.
Handoff contracts: jedyna rzecz blokująca dryf profili
Handoff contract to czteroPolowa specyfikacja przechowywana w `~/.hermes/team/handoffs/<from>-to-<to>.md`. Contract jest prawdziwy tylko wtedy, gdy może blokować. Jeśli wejście nie pasuje do zadeklarowanego kształtu, harness kończy handoff niepowodzeniem i wymaga przeglądu przez człowieka. Cztery wymagane pola:
| Pole | Definicja | Przykład (Alan do Miry) |
|---|---|---|
| Kształt wejścia | Czego oczekuje odbierający profil | Ocenione twierdzenia z URL-ami źródeł, nie surowe fragmenty |
| Kształt wyjścia | Co zwróci odbierający profil | Szkic sekcji plus dziennik zmian, nie gotowy artykuł |
| Akcja przy błędzie | Co dzieje się, gdy wejście jest nieprawidłowe | block, require-human-review lub retry |
| Bramka weryfikacji | Jedno twierdzenie, które musi być prawdziwe przed zakończeniem handoffu | Każde twierdzenie ma URL źródła |
Bramka jest nośna. Większość zespołów pisze dokumenty handoff jako sugestie i zastanawia się, dlaczego profile dryfują. Sugestia nigdy nie blokuje. Bez blokady Alan w końcu wysyła surowe transkrypty do Miry, Mira zaczyna szkicować bez atrybuowania źródeł i jakość wyjścia zespołu eroduje jeden cichy handoff na raz.
Memory-KPI: próg 15% nieaktualnych notatek
Pamięć gnije wewnątrz każdego profilu tak samo, jak wspólne wiki gnije po przekroczeniu 100 stron. Cotygodniowy audyt wyłapuje gnicie, zanim profil zacznie cytować siebie z przestarzałego kontekstu. Trzy metryki per profil mają znaczenie:
`source_backed_pct`: odsetek notatek, które nadal mają możliwe do pobrania źródło. Spada, gdy źródła zwracają 404 lub zostają usunięte.
`stale_notes`: liczba notatek, których przywołany kod, URL lub konfiguracja nie odpowiada już rzeczywistości.
`contradiction_notes`: liczba notatek sprzecznych z czymś innym w pamięci tego samego profilu.
Cotygodniowe polecenie audytu działa dla każdego profilu specjalisty: `for p in alan mira turing; do hermes -p $p memory-kpi --json | jq '.source_backed_pct, .stale_notes, .contradiction_notes'; done`. Obserwuj `stale_notes`. Gdy przekroczy 15% wszystkich notatek w profilu, zaplanuj przebieg `brain-resolve`, zanim profil zacznie cytować siebie z przestarzałego kontekstu.
Bramki uprawnień: uprawnienia per rola
Żaden profil nie otrzymuje więcej uprawnień niż potrzebuje jego rola. Orchestrator jest jedynym profilem uprawnionym do rozszerzania zakresu jakiegokolwiek innego profilu. Zapisanie tego w tabeli sprawdzanej co tydzień to różnica między zarządzanym zespołem a czterema agentami, którzy powoli wszyscy stają się administratorami.
| Profil | Klasa ryzyka | Uprawnienia |
|---|---|---|
| Alan (badania) | bezpieczna | Odczyt sieci i repo, zapis tylko do research/. Bez dostępu do powłoki, bez zapisu poza sandboxem. |
| Mira (pisarz) | bezpieczna | Odczyt wyników badań, zapis tylko do drafts/. Bez dostępu do sekretów, bez wykonywania kodu. |
| Turing (inżynier) | wymaga przeglądu | Odczyt repo, uruchamianie sandboxowanych testów, zapis do feature branch. Każdy commit do main wymaga zatwierdzenia przez orchestratora. |
| Hermes (orchestrator) | krytyczna | Jedyny profil uprawniony do zatwierdzania commitów Turinga, mergowania gałęzi lub wywoływania płatnych wywołań API powyżej limitu budżetu. |
Zasada jest nośna. Agent badawczy z dostępem do powłoki w końcu uruchomi polecenie, którego nie powinien był uruchamiać. Profil pisarza z dostępem do sekretów w końcu wycieknie je do szkicu. Dryf uprawnień dzieje się cicho i jest oczywisty dopiero z perspektywy czasu, co jest złym momentem na zauważenie.
Cztery tryby awarii na dzień 30
Cztery konkretne tryby awarii odpowiadają za większość krachów wieloagentowych Hermes. Każdy ma bezpośrednie przeciwdziałanie. Pominięcie któregokolwiek sprawi, że zespół wygląda świetnie w pierwszym dniu i jest rozmyty w dniu 30.
1. Dryf profili
Edycje SOUL.md narastają po cichu. Mira powoli staje się Turingiem. Rozwiązanie: diffuj każdy SOUL.md co tydzień względem wersji z pierwszego dnia. Każda nowa odpowiedzialność otrzymuje wpis zatwierdzenia w dzienniku albo zostaje cofnięta. Bez wyjątków dla małych edycji, bo małe edycje są właśnie tym, jak dochodzi do dryfu.
2. Rotacja handoffów
Plik contract istnieje, ale nikt go nie egzekwuje. Alan znowu zaczyna wysyłać surowe transkrypty do Miry. Rozwiązanie: podłącz każdy plik handoff do harnessa tak, by niedopasowane wejście blokowało. Contract, który nie może blokować, to dokumentacja, nie kontrola.
3. Rozrost SOUL.md
Każda rola rośnie o akapity obsługujące przypadki graniczne, aż agent traci swoją pierwotną tożsamość w szumie. Rozwiązanie: ogranicz SOUL.md do 400 słów. Wszystko ponad to trafia do AGENTS.md lub pliku referencyjnego per domena. Ograniczenie zmusza zespół do utrzymania tożsamości w ryzach.
4. Kolizja cron
Wiele profili planuje zadania o 3 w nocy bez koordynacji. Orchestrator budzi się, zastając czterech agentów walczących o ten sam limit API. Rozwiązanie: jeden wspólny plik `~/.hermes/team/cron.md` wymieniający każde zaplanowane zadanie we wszystkich profilach z dokładną godziną, czasem trwania i zależnościami. Sprawdź go przed dodaniem nowego crona.
Co to oznacza dla zespołów biznesowych
Warstwa operatorska to część, która przekształca demo Hermes w trwałą infrastrukturę produkcyjną. Większość zespołów oceniających frameworki wieloagentowe skupia się na koszcie wstępnej konfiguracji i pomija model utrzymania. 4-profilowy zespół bez handoff contracts, audytów pamięci i bramek uprawnień ma tę samą krzywą awarii co agent jednoprofilowy z sześciotygodniowym opóźnieniem: działa pięknie na początku, niewidocznie się degraduje, odpada gdy jest najbardziej potrzebny.
Przypadek wartości kumulowanej dla Hermes, czyli powód, dla którego biblioteka umiejętności ma znaczenie, zachodzi tylko wtedy, gdy utrzymuje się warstwa operatorska. Umiejętności zgromadzone przez profil, który po cichu dryfował do innej roli, to umiejętności dla roli, której już nie ma.
W webvise pomagamy firmom projektować i obsługiwać architektury agentów AI, w tym wieloprofilowe zespoły Hermes z dyscypliną zarządzania pozwalającą przetrwać po dniu 30. Jeśli oceniają Państwo wdrożenie Hermes lub mają już takie, które zaczyna się rozmywać, skontaktujcie się z nami, a pomożemy wzmocnić warstwę operatorską zanim tryby awarii się skumulują.
Praktyki webvise są zgodne z normami ISO 27001 i ISO 42001.