Copilot vs. Autopilot: Warum die meisten KI-Agenturen kollabieren, bevor sie skalieren
Sequoia sagt, Services sind die neue Software. ColdIQ hat $7M ARR erreicht, indem das Unternehmen die Arbeit verkauft, nicht das Tool. Warum KI-Agenturen, die Tools verkaufen, unter Druck geraten, und was sie ersetzt.
Jede KI-Agentur, die weiterhin das Tool verkauft, wird durch jedes neue Modell-Release unter Druck gesetzt. Die Agenturen, die das Ergebnis verkaufen, wachsen, während das Modell besser wird. Die Zahlen hinter dieser These sind endlich öffentlich. Im Jahr 2026 wetteifert jeder darum, den nächsten KI-Copiloten zu liefern. Alex Vacca hat ColdIQ auf $7M Jahresumsatz bootstrapped, indem er bewusst das Gegenteil tat.
Möglicherweise haben Sie gehört, dass das KI-Agenturen-Modell genauso stirbt wie das produktisierte Agenturen-Modell von 2022. Das stimmt zur Hälfte. Die Variante, die stirbt, verkauft Tools. Die Variante, die überlebt, verkauft die Arbeit darunter, und Sequoia-Partner Julien Bek hat das soeben *Services: The New Software* genannt.
Im Folgenden finden Sie die These, die 1:6-Mathematik dahinter, Vaccas sechsstufiges Playbook von ColdIQ und die zwei konkreten Veränderungen, die es webvise in diesem Quartal aufgezwungen hat.
Das Tool zu verkaufen, bedeutet einen permanenten Wettlauf gegen das Foundation-Modell. Das Ergebnis zu verkaufen, bedeutet, dass jedes Modell-Release Ihre Marge vergrößert, anstatt Ihr Produkt zu verdrängen.
ColdIQ ist der erste bootstrapped Services-as-Software-Datenpunkt mit Belegen. $7M ARR, 400 B2B-Kunden, 2.200+ Kampagnen, 31 Monate von null, kein Fremdkapital, 30+ Mitarbeitende in zehn Ländern.
Jede echte Services-Vertikale liegt bei einem Software-zu-Services-Verhältnis von etwa 1:6 bis 1:12. Das Budget steckt in der Arbeit, nicht in der Softwareposition.
Die sechsstufige Einstellungsreihenfolge ist nicht optional. Ersetzen Sie sich selbst in der Ausführung, bevor Sie jemanden in Marketing, Vertrieb oder Operations einstellen.
webvise operiert bereits in dieser Form. Die Aufnahme in das Anthropic Claude Partner Network (2026-04-10, Weiterführung 2026-04-18) ist die Glaubwürdigkeitsebene, die den Vertrauensaufbau beim Käufer verkürzt.
Die These, die Sequoia gerade benannt hat, und die, die ColdIQ bereits gebaut hat
Julien Bek veröffentlichte *Services: The New Software* im April 2026. Das Argument passt in einen Satz. Das nächste Billionen-Dollar-Unternehmen verkauft die Arbeit, nicht das Tool, denn für jeden $1 Softwarebudget liegen $6 bis $12 an Services-Ausgaben daneben, und KI hat dieses Services-Budget endlich für kleine Teams angreifbar gemacht.
Alex Vacca hat das Modell drei Jahre vor Sequoia bewiesen. Im Jahr 2022 kündigte er einen $80K-Operations-Job bei Worldcoin (Sam Altmans Iris-Scan-Unternehmen) und verlangte $3.000 im Monat für sein erstes Cold-Outbound-Retainer. Drei Jahre und 2.200+ Kampagnen später läuft ColdIQ bei über $7M ARR mit 400 B2B-Kunden und 30+ Mitarbeitenden in zehn Ländern. Kein Fremdkapital.
Die Form ist wichtiger als die Zahl. ColdIQ führte die Arbeit ein volles Jahr lang manuell durch, bevor sie kodiert wurde. Diese manuelle Phase war kein Fehler auf dem Weg zur Software. Sie war die F&E-Phase der darunter gelieferten Software.
Die Agentur war der Trainingsdatensatz. Wenn Sie das breitere Argument interessiert, dass jedes SaaS von der anderen Seite in dieses Muster kollabiert, haben wir den Gegenfall in einem aktuellen Beitrag dargelegt.
Copilot vs. Autopilot: einer wird komprimiert, einer wächst
Beks deutlichste Unterscheidung ist, wem das Modell tatsächlich dient. Ein Copilot gibt KI in die Hände einer Fachkraft. Die Fachkraft prüft das Ergebnis, trägt das Risiko und behält die Kundenbeziehung.
Ein Autopilot überspringt die Fachkraft vollständig und liefert das Ergebnis direkt an den Käufer. Zwei Formen, zwei Schicksale.
Die Preisobergrenze eines Copiloten ist durch die Anzahl der Fachkräfte multipliziert mit dem Lizenzpreis begrenzt. Die Obergrenze eines Autopiloten ist der TAM des Ergebnisses selbst. Die eine Grenze ist ein Kalender. Die andere ist ein Markt.
| Copilot | Autopilot | |
|---|---|---|
| Wer nutzt es | Eine Fachkraft | Der Endkäufer direkt |
| Wer trägt das Risiko | Die Fachkraft | Der Anbieter |
| Preisobergrenze | Seats x Lizenzpreis | TAM des Ergebnisses |
| Genannte Beispiele | Harvey (Anwaltskanzleien), Rogo (Investmentbanken) | Crosby (NDAs), WithCoverage (Policen), ColdIQ (Meetings) |
| Nächstes Modell-Release | Feature-Risiko: das Modell frisst das Tool | Margenausweitung: Lieferkosten sinken, Preis bleibt |
Jeder KI-Tool-Gründer stellt sich in diesem Quartal dieselbe Frage. Was passiert, wenn das nächste Modell-Release mein Produkt zu einem Feature macht? Das ist die richtige Frage.
Ein Copilot muss dauerhaft dem Foundation-Modell voraus bleiben. Ein Autopilot verbessert sich jedes Mal, wenn das Foundation-Modell es tut.
Die Mathematik: warum neben $1 Software $6 bis $12 an Services liegen
Beks Paradebeispiel ist klar. Ein typisches kleines Unternehmen gibt etwa $10.000 im Jahr für QuickBooks aus und rund $120.000 im Jahr für den Buchhalter, der den Abschluss tatsächlich macht. Dieses Verhältnis liegt bei 1:12 für Buchhaltung. Die meisten Kategorien liegen näher bei 1:6.
Cold Outbound hat dieselbe Form. Ein B2B-Unternehmen zahlt für einige Seats an Sales-Tooling, ein SDR-Gehalt, und ein spürbares Vielfaches davon an eine Agentur, wenn es eine engagiert. Die Softwareposition ist minimal. Die Arbeit ist teuer.
Deshalb musste Vacca keinen Markt erfinden. Er wechselte in eine bestehende Budgetposition, die niemand mit KI-nativer Lieferung besetzte.
Drei Filter entscheiden, ob eine Nische den Test besteht:
Wird die Arbeit heute bereits ausgelagert? Sie möchten in ein bestehendes Budget wechseln, kein neues erfinden.
Ist es Wissensarbeit? Mustererkennung und Regelanwendung, keine echte strategische Urteilsbildung, die nur ein Mensch leisten kann.
Ist der Services-Anteil spürbar größer als der Software-Anteil? Liegt das Verhältnis bei 1:2 oder darunter, gibt es kein verstecktes Budget anzugreifen.
Cold Outbound hat alle drei Tests bestanden. Das gilt auch für SEO-Content-Operations, Customer-Support-Triage, Rechnungsextraktion und Lead-Anreicherung. Vieles besteht ihn nicht. Hochrangige M&A-Strukturierung, klinische Entscheidungsfindung und kreative Markenführung scheitern am Wissensarbeits-Test. Zu behaupten, sie bestünden ihn, ist der Weg, wie Autopilot-Anbieter in diesen Kategorien ihre Kunden verlieren.
Vaccas sechsstufige Reihenfolge und die Einstellungssequenz, die die meisten Gründer falsch machen
Sechs Schritte, und die Reihenfolge ist wichtiger als jeder einzelne Schritt für sich.
1. Eine ausgelagerte Position in einer Branche wählen. Enge Fokussierung gewinnt, weil sie proprietäre Daten am schnellsten akkumuliert, und die Daten sind der eigentliche Burggraben.
2. Die ersten Kunden persönlich gewinnen. Keine Website, kein Deck, kein Funnel. Einen Retainer-Boden festlegen, an dem Sie auch in drei Jahren noch festhalten möchten. ColdIQ startete bei $3K/Monat, weil Lieferung darunter nicht möglich war.
3. Die Arbeit manuell erledigen und jeden Schritt dokumentieren. Vier Artefakte von Tag eins: ein Markdown-SOP pro wiederholbarer Aufgabe, ein Loom jedes Mal, wenn die Arbeit einen Cursor berührt, ein datiertes Entscheidungsprotokoll pro Kunde, und eine Fehlkampagnen-Datei. Diese letzte Datei wird das wertvollste Artefakt des ersten Jahres.
4. Wie ein Service bepreisen, wie ein Produkt berichten. Setup-Gebühr plus monatlicher Retainer, der an eine Ergebniskennzahl gebunden ist (gebuchte Meetings, erzielte Abschlüsse) plus ein Performance-Bonus, wenn das Ziel übertroffen wird. Live-Dashboard von Tag eins, wöchentliches Update mit Erfolgen und Misserfolgen, quartalsweise Gespräch mit dem Entscheidungsträger, nicht nur dem Operator.
5. Sich selbst in der Ausführung ersetzen, bevor Sie irgendetwas anderes skalieren. Einstellungsreihenfolge: Delivery-Operator, dann technischer Automatisierer, dann Head of Delivery. Keinen Vermarkter, Vertriebler oder COO einstellen, bevor die Ausführungsebene ohne Sie läuft.
6. Den Daten-Burggraben vor dem Software-Burggraben aufbauen. Jeden Input speichern (roh und bereinigt), jeden Output mit seinem Ergebnis getaggt, jeden Urteilsspruch mit seiner Begründung, und jeden Einwand plus die Antwort, die ihn geschlossen hat.
Vacca hat sich 2025 vollständig aus dem täglichen Betrieb zurückgezogen. Das Unternehmen machte im nächsten Monat weiter. Gründer sind die Decke. Dieser eine Satz widerlegt die meisten Agenturen-Orthodoxien von 2022, denn jeder Agenturgründer, der sagte "Services lassen sich nicht skalieren", meinte eigentlich "Ich lasse mich persönlich nicht skalieren".
Wie das innerhalb einer kleinen KI-nativen Agentur aussieht
Wir bei webvise arbeiten schon eine Weile in dieser Form. Die Agentur liefert Landing Pages, WordPress-zu-Next.js-Migrationen, MVPs und KI-Automatisierungs-Retainer über einen Claude-nativen Stack: Next.js 16, Drizzle ORM, Neon Postgres, Better Auth, Vercel AI SDK, Polar für die Abrechnung. 100 % des Codes wird über Claude Code geschrieben.
25.000+ Zeilen Client-Applikationscode wurden bereits in einem einzigen Engagement über diese Schleife geliefert. Die Agentur ist nicht das Endziel. Sie ist die manuelle Ausführungsphase dessen, was wir als nächstes produktisieren.
Zwei konkrete Veränderungen, die uns die These von Bek und Vacca in diesem Quartal aufgezwungen hat:
Anthropic Claude Partner Network. Wir haben die erste Prüfung am 2026-04-10 bestanden und wurden am 2026-04-18 zur Weiterführung zugelassen. Das ist kein Abzeichen für Taglines. Es ist die Glaubwürdigkeitsebene, die den Vertrauensaufbau beim Käufer für Claude-native Lieferung verkürzt, und es qualifiziert uns für Co-Sell-Engagements, bei denen der Kunde bereits von Anthropic direkt von Claude überzeugt wurde.
Jeder Retainer führt jetzt eine Fehlkampagnen-Datei. Landing-Page-Launches, KI-Automatisierungs-Flows und Migrationsengagements pflegen jeweils ein Markdown-Protokoll mit dem, was nicht funktioniert hat und warum. Diese Datei ist der Trainingsdatensatz für die Autopilot-Version desselben Service. Es ist das Artefakt, das die meisten Agenturen überspringen, und das, auf das Vacca als das wertvollste Produkt des ersten Jahres hinweist.
Benannte Kundenprojekte, bei denen dies bereits live ist oder geplant ist: OHYP (SaaS-App als unsere Referenzvorlage), young leaders (aktive Jugendorganisationsplattform, mehrere Iterationen), MP Bau (Landing Page plus KI-Chatbot für ein Bauunternehmen), Aesthetic Medicine (Patientenverwaltungs-App). Jedes Engagement bezahlt uns dafür, Trainingsdaten für ein Produkt zu produzieren, das wir noch nicht geliefert haben. Jedes einzelne verdichtet den Datensatz darunter.
Wann der Copilot-Modus die richtige Wahl ist
Die Autopilot-Betrachtung ist nicht universell. Copilot ist die richtige Form, wenn das zugrundeliegende Urteilsvermögen genuinen Nicht-Übertragbarkeits-Charakter hat. Hochrangige Rechtsberatung, M&A-Deal-Strukturierung und regulierte klinische Entscheidungsfindung lassen sich nicht in ein Ergebnis-SKU übersetzen, das ein Anbieter unterzeichnen kann.
Harvey verkauft einen Copiloten an Anwaltskanzleien, weil der Partner, nicht das Modell, die versicherte Einheit ist. Rogo verkauft aus demselben Grund an Investmentbanken. In beiden Fällen ist der Käufer rechtlich, finanziell oder ethisch für das Ergebnis der Arbeit verantwortlich und wird das Ergebnis deshalb nicht an einen Anbieter abgeben, egal wie gut das Modell wird.
Der Test ist einfach. Wenn der Käufer die regulatorische oder reputationsbezogene Haftung trägt, ist Copilot die richtige Form. Wenn der Käufer nur das Ergebnis möchte und nicht wissen muss, wer es hergestellt hat, ist Autopilot die einzige Form, die das nächste Modell-Release überlebt.
Überall dazwischen verbringt der Copilot-Anbieter die nächsten fünf Jahre damit, dem Foundation-Model-Anbieter hinterherzulaufen. Ein Wettlauf, den Sie konstruktionsbedingt verlieren.
Wie Sie am Montagmorgen entscheiden, was Sie wirklich verkaufen
Zwei Fragen beantworten den Großteil der Entscheidung:
Kann der Käufer Sie für das Ergebnis bezahlen, ohne die Software jemals zu berühren? Wenn nicht, liefern Sie einen Copiloten. In Ordnung, wenn die Kategorie die Nicht-Übertragbarkeits-Hürde erfüllt. Nicht in Ordnung, wenn die Kategorie Wissensarbeit ist.
Sind die Services-Ausgaben in Ihrer Kategorie mindestens 6-mal so hoch wie die Software-Ausgaben? Wenn ja, gibt es eine versteckte Budgetposition, die es sich lohnt, mit KI-nativer Lieferung anzugreifen. Wenn nicht, entwickeln Sie Software, verkaufen Sie Seats und akzeptieren Sie die Copilot-Obergrenze.
Wenn Sie ein Gründer sind, der zwischen einer kleinen Beratung und einem echten Unternehmen feststeckt, ist der Weg ehrlich über das, was er erfordert. Arbeiten Sie manuell, bis der Markt Ihnen zeigt, was automatisiert werden soll. Stellen Sie zuerst jemanden für die Ausführung ein. Führen Sie die Fehlkampagnen-Datei.
Schreiben Sie die Dashboards, bevor Sie das Produkt schreiben. Die Anti-Slop-Content-Strategie, die wir in diesem Blog verwenden, ist eine kleinere Version desselben Prinzips: veröffentlichen Sie nur das, was das Foundation-Modell nicht bereits erzeugen kann.
Wenn Sie evaluieren, wie Sie Ihre Agentur für die nächsten zwölf Monate neu aufstellen, oder einen Claude-nativen Lieferpartner suchen, der sich bereits zu dieser Form verpflichtet hat, ist webvise genau für diese These aufgebaut. Sprechen wir.
Die Praktiken von webvise sind an den ISO 27001- und ISO 42001-Standards ausgerichtet.
Kimi K2.6: Ein Open-Weight Frontier-Coding-Modell zum Zehntel der Kosten
Moonshot AIs Kimi K2.6 ist das zweite chinesische Open-Weight-Coding-Modell in vier Monaten, das das Frontier-Niveau erreicht. Für Agenturen, die KI-Agenten an Kunden ausliefern, hat sich die Stack-Entscheidung über Nacht verändert.
Nächster ArtikelWenn Kunden nach RAG fragen in 2026: Unser Entscheidungsbaum (und warum wir selten dort beginnen)
Wir bauen RAG-Pipelines, wenn Kunden darauf bestehen, empfehlen sie aber in 2026 selten als ersten Schritt. Der größte Teil des LLM-Tooling-Stacks von 2024 wurde zwischen Januar und April obsolet. Hier ist der Entscheidungsbaum, den wir mit jedem Interessenten durchgehen, und was wir liefern, wenn der Baum von RAG wegzeigt.