Hermes Agent en producción: el problema del día 30

La capa de operador de Hermes Agent es el conjunto de disciplinas que mantiene coherente a un equipo multiperfiles más allá del día 30. Cuatro primitivas: contratos de traspaso que pueden bloquear, auditorías de memoria-KPI por perfil, puertas de política por rol y estado de cron coordinado. Sin ellas, un equipo de cuatro perfiles (Hermes, Alan, Mira y Turing) muestra señales de convergencia de voz en menos de un mes.

La mayoría de las guías de operador de Hermes se detienen en el arranque de cuatro perfiles; el material de despliegue para el día 30 es escaso en la documentación pública. El día 30 es cuando los perfiles empiezan a sonar igual, los traspasos fallan silenciosamente y un build del que uno estaba orgulloso se vuelve indistinguible de una configuración de agente único.

Si Hermes Agent versión 0.9.0 está en ejecución con el arranque estándar que incluye los perfiles Alan, Mira y Turing, la construcción fundacional está completa; el trabajo del día 30 comienza a partir de ahí. Cada primitiva descrita a continuación proviene de patrones de despliegue reales, junto con el modo de fallo específico que justifica su existencia.

Los contratos de traspaso solo son reales si pueden bloquear. Si la forma de entrada del perfil receptor es incorrecta, el traspaso debe fallar, no solo advertir.
La memoria se deteriora por perfil. Ejecute una auditoría semanal de `memory-kpi`. Superar el umbral del 15% de notas obsoletas activa un pase de `brain-resolve`.
Las puertas de política previenen la escalada silenciosa de privilegios. Alan nunca obtiene acceso a shell. Solo el orquestador puede aprobar commits a main.
Cuatro modos de fallo en el día 30 explican la mayoría de las regresiones de despliegue observadas. Deriva de perfiles, deterioro de traspasos, bloat de SOUL.md, colisión de cron. Cada uno tiene una contramedida específica.
Lea primero la [guía de definición de Hermes Agent](/blog/hermes-agent-self-improving-ai) si necesita el contexto sobre qué es el sistema antes de abordar la capa de operador.

La Línea de Base de Cuatro Perfiles (Recapitulación)

Antes de que la capa de operador tenga relevancia, el equipo inicial de cuatro perfiles debe estar en ejecución. La división canónica que se muestra a continuación es la que la mayoría de los despliegues de Hermes en producción acaban adoptando.

Hermes (orquestador). Planifica, descompone, enruta y sintetiza. Controlador de tráfico, no cuello de botella.
Alan (especialista en investigación). Orientado a fuentes, escéptico, consciente de la incertidumbre. Protege al equipo de la confianza alucinada.
Mira (arquitecta narrativa). Claridad, estructura, conciencia de audiencia. Convierte el material validado en comunicación.
Turing (constructor y depurador). Implementación, logs, diffs, reproducibilidad. Le importan los tests, no el pulido narrativo.

Los perfiles aíslan siete piezas de estado al mismo tiempo: configuración, sesiones, memoria, habilidades, personalidad, estado de cron y estado de gateway. Ese aislamiento es la primitiva de la que depende la capa de operador. Si todavía se ejecuta un único perfil que asume cinco roles, ninguno de los patrones descritos a continuación resultará útil. Primero hay que corregir la primitiva.

Si desea ayuda para determinar si un despliegue de Hermes de cuatro perfiles se adapta a la carga de trabajo real de su equipo, webvise puede orientarle.

Contratos de Traspaso: Lo Único que Bloquea la Deriva de Perfiles

Un contrato de traspaso es una especificación de cuatro campos almacenada en `~/.hermes/team/handoffs/<from>-to-<to>.md`. El contrato solo es real si puede bloquear. Si la entrada no coincide con la forma declarada, el harness hace fallar el traspaso y requiere revisión humana. Los cuatro campos obligatorios:

Campo	Definición	Ejemplo (Alan a Mira)
Forma de entrada	Lo que espera recibir el perfil receptor	Afirmaciones clasificadas con URLs de fuente, no extractos sin procesar
Forma de salida	Lo que devolverá el perfil receptor	Sección redactada más registro de cambios, no un artículo terminado
Acción ante fallo	Qué ocurre cuando la entrada está mal formada	block, require-human-review o retry
Puerta de verificación	Una aserción que debe cumplirse antes de completar el traspaso	Cada afirmación tiene una URL de fuente

La puerta es estructural. La mayoría de los equipos redactan los documentos de traspaso como sugerencias y se preguntan por qué los perfiles derivan. Una sugerencia nunca bloquea. Sin un bloqueo, Alan termina enviando transcripciones en bruto a Mira, Mira empieza a redactar sin atribución de fuentes y la calidad del output del equipo se erosiona un traspaso silencioso a la vez.

Memoria-KPI: El Umbral del 15% de Notas Obsoletas

La memoria se deteriora dentro de cada perfil del mismo modo que una wiki compartida se deteriora pasadas las 100 páginas. Una auditoría semanal detecta el deterioro antes de que el perfil empiece a citarse a sí mismo desde un contexto obsoleto. Tres métricas por perfil son relevantes:

`source_backed_pct`: porcentaje de notas que aún tienen una fuente recuperable. Disminuye cuando las fuentes devuelven 404 o se eliminan.
`stale_notes`: recuento de notas cuyo código, URL o configuración referenciados ya no coinciden con la realidad.
`contradiction_notes`: recuento de notas que contradicen algo más en la memoria del mismo perfil.

El comando de auditoría semanal se ejecuta en todos los perfiles especialistas: `for p in alan mira turing; do hermes -p $p memory-kpi --json | jq '.source_backed_pct, .stale_notes, .contradiction_notes'; done`. Hay que vigilar `stale_notes`. En cuanto supere el 15% del total de notas en un perfil, programe un pase de `brain-resolve` antes de que ese perfil empiece a citarse desde un contexto obsoleto.

Puertas de Política: Permiso por Rol

Ningún perfil obtiene más permisos de los que su rol necesita. El orquestador es el único perfil autorizado a ampliar el alcance de cualquier otro. Mantener esto registrado en una tabla que se revisa semanalmente marca la diferencia entre un equipo gobernado y cuatro agentes que lentamente se convierten todos en administradores.

Perfil	Clase de riesgo	Permisos
Alan (investigación)	seguro	Lectura de web y repositorio, escritura solo en research/. Sin shell, sin escritura fuera del sandbox.
Mira (redactora)	seguro	Lectura de outputs de investigación, escritura solo en drafts/. Sin acceso a secretos, sin ejecución de código.
Turing (ingeniero)	revisión	Lectura del repositorio, ejecución de tests en sandbox, escritura en rama de feature. Cada commit a main requiere aprobación del orquestador.
Hermes (orquestador)	crítico	Único perfil autorizado a aprobar commits de Turing, fusionar ramas o activar llamadas a API de pago por encima del techo presupuestario.

El principio es estructural. Un agente de investigación con acceso a shell acabará ejecutando un comando que no debería. Un perfil de redacción con acceso a secretos acabará filtrándolos en un borrador. La escalada de permisos ocurre silenciosamente y solo resulta obvia en retrospectiva, que es un momento difícil para descubrir la brecha.

Los Cuatro Modos de Fallo del Día 30

Cuatro modos de fallo específicos explican la mayoría de las regresiones de despliegue observadas en configuraciones multiagente de Hermes. Cada uno tiene una contramedida directa. Omita cualquiera de ellos y el equipo funciona bien el primer día, se degrada en el día 30.

1. Deriva de perfiles

Las ediciones de SOUL.md se acumulan silenciosamente. Mira se convierte poco a poco en Turing. La solución: comparar cada SOUL.md semanalmente con su versión del primer día. Cualquier nueva responsabilidad requiere una entrada de aprobación registrada; de lo contrario, se revierte. No hay excepciones para ediciones pequeñas, porque las ediciones pequeñas son el mecanismo por el que ocurre la deriva.

2. Deterioro de traspasos

El archivo de contrato existe pero nadie lo hace cumplir. Alan vuelve a enviar transcripciones en bruto a Mira. La solución: integrar cada archivo de traspaso en el harness de modo que una entrada incorrecta bloquee. Un contrato que no puede bloquear es documentación, no control.

3. Bloat de SOUL.md

Cada rol acumula párrafos de casos extremos hasta que el agente pierde su identidad original en el ruido. La solución: limitar SOUL.md a 400 palabras. Todo lo que exceda eso va a AGENTS.md o a un archivo de referencia por dominio. La restricción obliga a mantener la identidad bien definida.

4. Colisión de cron

Varios perfiles programan trabajos a las 3:00 sin coordinación. El orquestador se activa con cuatro agentes compitiendo por la misma cuota de API. La solución: un `~/.hermes/team/cron.md` compartido que liste todas las tareas programadas en todos los perfiles con su hora exacta, duración y dependencias. Consúltelo antes de añadir cualquier nuevo cron.

Adecuación para Equipos de Negocio

La capa de operador es la parte que convierte una demo de Hermes en infraestructura de producción duradera. La mayoría de los equipos que evalúan frameworks multiagente se centran en el coste inicial de configuración y pasan por alto el modelo de mantenimiento. Un equipo de cuatro perfiles sin contratos de traspaso, auditorías de memoria y puertas de política tiene la misma curva de fallo que un agente de perfil único con un retraso de seis semanas: funciona perfectamente al principio, se degrada de forma invisible y colapsa cuando más se necesita.

El valor acumulado de Hermes, la razón por la que la biblioteca de habilidades importa, solo se sostiene si la capa de operador se sostiene. Las habilidades acumuladas por un perfil que ha derivado silenciosamente hacia un rol diferente son habilidades para un rol que ya no existe.

webvise ayuda a las empresas a diseñar y operar arquitecturas de agentes de IA, incluidos equipos multiperfiles de Hermes con la disciplina de gobernanza necesaria para sobrevivir más allá del día 30. Si está evaluando un despliegue de Hermes o ya tiene uno que empieza a difuminarse, contacte con nosotros para fortalecer la capa de operador antes de que los modos de fallo se compensen mutuamente.

Las prácticas de webvise están alineadas con las normas ISO 27001 e ISO 42001.