Ihre AGENTS.md ist jetzt Ihr Wettbewerbsvorteil: Was in Produktionsdateien steht
Next.js 16.2 hat AGENTS.md am Dienstag als Standard-Scaffolding eingeführt. Die empirische Studie von Augment Code und unser 11-Repo-Template zeigen, was Produktionsdateien tatsächlich enthalten.
Als create-next-app vor drei Tagen AGENTS.md als Standard-Scaffolding ausgeliefert hat, hörte die Framework-Wahl auf, ein Differenzierungsmerkmal zu sein. Der Inhalt dieser Datei ist jetzt das Einzige, was einen funktionierenden Agent-Stack von einem defekten trennt.
Sechs Monate lang signalisierte eine AGENTS.md, dass Ihr Team vorne lag. Seit dem 2026-04-28 wird sie mit jedem neuen Next.js-Projekt ausgeliefert. Das Signal ist weggefallen. Was in der Datei steht, ist das neue Signal.
Die meisten Engineering-Leiter behandeln AGENTS.md als Dokumentation. Sie ist eine Laufzeit-Konfigurationsdatei, die das Modell bei jedem Aufruf lädt. Dieser Artikel analysiert die empirische Studie von Augment Code, die 100- bis 150-Zeilen-Regel, die entscheidet ob die Datei hilft oder schadet, und das Template, das wir in 11 Produktions-Client-Repos einsetzen.
Die wichtigsten Erkenntnisse
Next.js 16.2 liefert AGENTS.md als Standard-Scaffolding (veröffentlicht am 2026-04-28). Jedes neue Starter-Projekt auf Vercel erbt sie.
Die AuggieBench-Studie von Augment Code (2026-04-23): Dateien zwischen 100 und 150 Zeilen erzielen die besten Ergebnisse. Über 150 Zeilen kehren sich die Gewinne um.
Dieselbe Datei kann die Bugfix-Genauigkeit um 25% steigern und die Feature-Vollständigkeit bei anderen Aufgaben um 30% senken. Das Design der Abschnitte zählt mehr als die Gesamtlänge.
AGENTS.md ist die einzige Dokumentationsfläche mit 100% Auffindbarkeitsrate. Verwaiste _docs/-Ordner liegen unter 10%.
Der neue Wettbewerbsvorteil sind prozedurale Workflows, Entscheidungstabellen und einzeilige reaktive Regeln. Keine Architekturübersichten oder gestapelten Warnungen.
Vor drei Tagen hörte AGENTS.md auf, ein Differenzierungsmerkmal zu sein
Next.js 16.2 wurde am 2026-04-28 mit AGENTS.md als Standarddatei im create-next-app-Template ausgeliefert. Vercel verteilt das Scaffolding an jedes neue Starter-Projekt. Die Datei, die früher bedeutete, dass ein Team vorne lag, wird jetzt im leeren Paket mitgeliefert.
Die Verschiebung in der Diskussion ist der entscheidende Punkt. Vor sechs Monaten lautete die Frage, ob Ihr Team eine AGENTS.md hatte. Diese Woche wurde daraus die Frage, was darin stand. Einkäufer, die Entwicklungspartner bewerten, brauchen ein neues Bewertungsraster, da das binäre Signal verschwunden ist.
Zwei parallele Signale unterstreichen die Verschiebung. Matt Pocock's mattpocock/skills-Repository erreichte 41.000 Sterne in 85 Tagen, und das Repo ist sein .claude-Ordner, direkt veröffentlicht. Menschen vergeben Sterne für Agent-Konfigurationen anderer Personen, wie sie es früher für Frameworks taten. So sieht Commoditisierung aus.
Garry Tan's gstack-Repository, in derselben Woche veröffentlicht, überschritt 23.000 Sterne in sieben Tagen. Tan hat damit 600.000 Zeilen Produktionscode in 60 Tagen ausgeliefert. Das Repo enthält 31 Markdown-Skill-Dateien. Darunter liegt kein Framework.
Wenn Ihr Beschaffungsteam eine Methode benötigt, um KI-Readiness in Lieferantenbewertungen zu messen, hat webvise dieses Template in 11 Client-Builds eingesetzt und kann das verwendete Bewertungsraster erläutern.
Die 100- bis 150-Zeilen-Regel, mit Messung
Augment Code veröffentlichte am 2026-04-23 die erste empirische Studie zur Qualität von AGENTS.md-Inhalten. Der Autor, Slava Zhenylenko, zog Dutzende von AGENTS.md-Dateien aus Augments Monorepo. Jede Datei durchlief das AuggieBench-Eval-Suite zweimal: einmal mit der Datei und einmal ohne. Die Ausgabe wurde gegen den goldenen PR bewertet, den Menschen gemergt hatten.
Das zentrale Ergebnis: Die besten Dateien erzeugten einen Qualitätssprung, der dem Upgrade von Haiku auf Opus entspricht. Die schlechtesten Dateien erzeugten Ergebnisse, die schlechter waren als gar keine AGENTS.md. Dasselbe Engineering-Team, dasselbe Modell, dieselbe Aufgabe. Die Datei entschied den Unterschied.
Der optimale Bereich war eng. Dateien zwischen 100 und 150 Zeilen, kombiniert mit einer kleinen Menge fokussierter Referenzdokumente, die bei Bedarf geladen werden, erzeugten 10 bis 15% Gewinne über alle Metriken bei mittelgroßen Modulen von etwa 100 Kerndateien. Über 150 Zeilen kehrten sich die Gewinne um.
Tan's eigenes Eingeständnis stimmte mit dem Befund aus der Prinzipien-Perspektive überein. Seine CLAUDE.md hatte 20.000 Zeilen, mit jeder Eigenheit, jedem Muster, jeder Lektion in einer Datei kodiert. Claude Code selbst markierte den Ballast. Die Lösung waren etwa 200 Zeilen Verweise, mit dem Inhalt in Skills ausgelagert, die bei Bedarf geladen werden.
Unser eigenes Template über 11 webvise-Client-Repos, darunter aesthetic-medicine-app, biomed-landing, hyyve-landing, kersten-betreuung-landing und urban-sports-sniper-app, kommt auf 126 Zeilen. Diese Zahl wurde nicht gewählt, um zur Studie zu passen. Die Studie wurde zwei Wochen nach unserer Standardisierung veröffentlicht.
Auffindbarkeitsraten aus Augments Traces über Hunderte von Sitzungen erklären, warum die Platzierung genauso wichtig ist wie der Inhalt:
| Dokumentationsfläche | Auffindbarkeitsrate |
|---|---|
| AGENTS.md (jede Ebene der Hierarchie, automatisch geladen) | 100% |
| Referenzen aus AGENTS.md (bei Bedarf geladen) | über 90% wenn relevant |
| README.md auf Verzeichnisebene | über 80% wenn der Agent in diesem Verzeichnis arbeitet |
| Verschachtelte README.md (Unterverzeichnisse, in denen der Agent nicht ist) | rund 40% |
| Verwaiste _docs/-Ordner ohne Referenzen | unter 10% |
AGENTS.md ist die einzige Fläche mit zuverlässiger Auffindbarkeit. Wenn etwas gesehen werden muss, steht es dort oder wird von dort referenziert. Inhalte an einen referenzierten Ort zu verschieben leistet mehr als weitere Dokumentation zu schreiben.
Was in die Datei gehört und was sie ruiniert
Augments Traces wurden nach Inhaltstyp aufgeschlüsselt. Die Muster, die die Ausgabe verbesserten, und die Muster, die sie zerstörten, sind nicht symmetrisch.
Was funktioniert
Prozedurale Workflows. Nummerierte mehrstufige Workflows waren das stärkste einzelne Muster. Ein sechsstufiger Workflow zum Einbinden einer neuen Integration senkte PRs mit fehlenden Wiring-Dateien von 40% auf 10%, steigerte die Korrektheit um 25% und die Vollständigkeit um 20%.
Entscheidungstabellen bei 2 oder 3 sinnvollen Optionen. Eine Entscheidungstabelle React Query versus Zustand erzielte eine 25%-Steigerung bei best_practices in PRs in diesem Bereich. Die Tabelle löst Mehrdeutigkeit, bevor der Agent Code schreibt.
Echte Codebase-Beispiele, 3 bis 10 Zeilen lang. Verbessert die Wiederverwendung und die Einhaltung von Mustern. Längere Beispiele führen dazu, dass der Agent am falschen Muster erkennt.
Jedem Verbot ein Gebot gegenüberstellen. Reine Warnungsdokumentation schneidet schlechter ab. Ein bloßes Verbot macht den Agent vorsichtig und explorativ. Gepaart mit einer positiven Direktive, die die richtige Call-Site nennt, geht der Agent weiter.
Dateien auf Modulebene statt einer riesigen Root-Datei. Das 100- bis 150-Zeilen-Band passt zu einem mittelgroßen Modul von etwa 100 Dateien. Übergreifende Root-Dateien über dieser Größe verloren bei jeder Metrik.
Was die Ausgabe ruiniert
Architekturübersichten. Der Agent liest die Übersicht, öffnet dann Dutzende umliegender Dokumente, um seinen Ansatz zu überprüfen, lädt 10.000 bis 100.000 Token irrelevanten Kontext, und die Ausgabe verschlechtert sich. Augment nennt dies die Überexplorations-Falle.
Gestapelte Warnungen ohne begleitende Anleitung. Mit 30 bis 50 Verboten und keinen Geboten prüft der Agent seine Lösung einzeln gegen jede Warnung, auch wenn keine zutrifft.
Muster, die in der Codebase noch nicht existieren. Wenn die AGENTS.md eine Architektur beschreibt, die der Code nicht umsetzt, leitet die Datei den Agent aktiv in die falsche Richtung.
Dokumentations-Sprawl rund um die Datei. Augments schlechteste Performer waren AGENTS.md-Dateien, die auf 500K bis 2MB Architekturdokumentation lagen. Das Entfernen der AGENTS.md änderte das Verhalten kaum. Der Agent las den Sprawl unabhängig davon.
Reaktiv, nicht vorausgeschrieben
Elie Steinbock veröffentlichte am 2026-04-20 einen separaten Beitrag mit einer Disziplin, die die meisten Enterprise-AGENTS.md-Dateien, die wir prüfen, verbessert. Schreiben Sie keine Dutzenden von Regeln vor, bevor etwas schiefgelaufen ist. Präventive Überstrukturierung erzeugt Ballast, den das Modell bei jedem Durchlauf parst.
Fügen Sie Regeln reaktiv hinzu, wenn eine echte Korrektur stattgefunden hat, und halten Sie Ergänzungen auf einzeilige Aussagen beschränkt. Für alles Schwerere verschieben Sie den Inhalt in einen progressiv geladenen Skill. Die AGENTS.md bleibt kompakt. Die Skill-Schicht nimmt das Gewicht auf.
Tan's parallele Regel, die Zweimal-gescheitert-Disziplin, sagt dasselbe von der anderen Seite. Wenn Sie den Agent zweimal nach demselben Muster fragen müssen, sollte die zweite Anfrage nicht nötig sein. Das Muster gehört in die Skill-Schicht oder als Einzeiler in AGENTS.md. Das System wächst.
So sieht das in einem webvise-Build aus: die AGENTS.md wird mit 126 Zeilen und Platzhaltern ausgeliefert. Das .claude/skills-Verzeichnis enthält bei Lieferung 8 bis 15 Skill-Dateien, jede ein Verfahren, das das Team tatsächlich während des Builds durchgeführt hat. Die Datei antizipiert keine Probleme. Sie dokumentiert gelöste.
Fünf Fragen, die der Einkauf jedem Anbieter stellen sollte
Die Qualität des AGENTS.md-Inhalts ist jetzt ein messbarer Indikator für KI-native Ausführung. Die fünf Fragen unten geben einem nicht-technischen Beschaffungsteam einen schnellen Überblick, ob ein Anbieter für den 2026-Stack oder den 2024-Stack liefert.
| Frage | So klingt eine starke Antwort |
|---|---|
| Zeigen Sie mir Ihr AGENTS.md-Template. Wie viele Zeilen hat es? | 100 bis 150 Zeilen pro Modul. Keine einzelne Root-Datei. Keine 1.000 Zeilen. |
| Wie ist die Skill-Schicht strukturiert? | Progressive Offenlegung. Skills werden bei Bedarf geladen, nicht in der Root-Datei. |
| Nach welcher Regel werden Einträge hinzugefügt? | Nur reaktiv. Einzeiler für wiederkehrende Korrekturen. Skills für alles Schwerere. |
| Wie messen Sie Überexploration bei langen Aufgaben? | Sie nennen eine Metrik. Token-Verbrauch pro Aufgabe, Abschlussrate bei mehrstufigen Tickets oder etwas Konkretes. |
| Wo leben Legacy-Dokumente, und wie werden sie referenziert? | Modular. Verknüpft aus AGENTS.md mit maximal 10 bis 15 Referenzen pro Datei. Kein 2MB-Sprawl in _docs. |
Wenn ein Anbieter drei der fünf Fragen nicht beantworten kann, liefert er noch das 2024-Template. Die meisten Enterprise-Teams stoßen auf diese Grenze auf der Dokumentationsebene. Dieses Audit ist die erste Phase jedes webvise-Migrationsprojekts.
Der tiefere Befund: Die Umgebung korrigieren, nicht nur den Einstiegspunkt
Augments unbequemster Befund stammte von den schlechtesten AGENTS.md-Dateien. Sie lagen auf 500K bis 2MB umgebender Architekturdokumentation. Das Team entfernte nur die AGENTS.md aus dem Durchlauf, und das Verhalten änderte sich kaum. Der Agent las den Sprawl unabhängig davon, was die Einstiegsdatei sagte.
Die Schlussfolgerung ist schwer für Legacy-Enterprise-Teams. Die meisten Dokumentationsumgebungen, die vor 2024 aufgebaut wurden, tragen Jahre von Architekturentscheidungsprotokollen, Design-Dokumenten und Runbooks. Der Agent lädt genug davon, um eine saubere AGENTS.md zu übertönen. Eine bessere Einstiegsdatei zu schreiben ist notwendig, aber nicht ausreichend.
Die Arbeit ist unbequem. Prüfen Sie die Dokumente, die der Agent tatsächlich lädt, markieren Sie tote Dokumente zur Archivierung, modularisieren Sie die aktiven in modulscoped Referenzen, und halten Sie AGENTS.md so ausgerichtet, dass sie nur auf das zeigt, was der Agent auf dem Weg zur Änderung lesen soll. Tan's Rahmung gilt: Das Gehirn ist ein Git-Repo, der Orchestrator ist ein schlanker Dirigent, der Dateien liest. Wenn das Git-Repo voller toter Seiten ist, kann keine Einstiegsdatei das beheben.
Was das für jeden bedeutet, der 2026 ein Projekt beauftragt
Der Framework-Krieg ist vorbei. Next.js, Astro, SvelteKit und Nuxt liefern AGENTS.md-Scaffolding standardmäßig aus oder werden es im Laufe des Quartals tun. Das Unterscheidungsmerkmal hat sich eine Ebene nach oben verschoben. Der Inhalt der Datei, die Struktur des Skill-Verzeichnisses und die dahinterstehende Disziplin entscheiden, ob der Agent-Stack hilft oder schadet.
Moderne Web-Builds in 2026 werden von Tag eins an agent-lesbar ausgeliefert. Das ist der Vertrag, den webvise standardmäßig für jedes Projekt schreibt, von einer einseitigen Landing Page bis zu einer Multi-Tenant-SaaS. Das 126-Zeilen-Template, die .claude/skills-Schicht und die reaktive Regeldisziplin sind keine Extras. Sie sind der Build.
Die Praktiken von webvise sind an den ISO 27001- und ISO 42001-Standards ausgerichtet.