Perché i team AI sviluppano più velocemente e lanciano peggio: il problema dell'intent debt
L'AI ha reso la scrittura del codice quasi gratuita. Decidere cosa scrivere è diventato più difficile. Il divario è l'intent debt, e si accumula più rapidamente di qualsiasi codebase legacy.
L'AI ha reso la scrittura del codice quasi gratuita. Decidere cosa scrivere è diventato più difficile. Questo divario è l'intent debt, e si accumula più rapidamente di qualsiasi codebase legacy.
Garry Tan dichiara di sviluppare 37.000 righe di codice al giorno su cinque progetti, gestendo al contempo Y Combinator a tempo pieno. Gli ingegneri di Anthropic hanno accumulato 47 giorni di regressioni silenziose in Claude Code prima di individuarle in un postmortem pubblico del 23 aprile 2026. Entrambi i numeri descrivono lo stesso problema da angolazioni opposte.
Se il team scrive più codice che mai eppure i risultati rilasciati sono peggiori rispetto a un anno fa, si sta assistendo all'accumulo in tempo reale di intent debt. Il tech debt era la tassa sulla lentezza del codice. L'intent debt è la tassa sulla lentezza delle decisioni. Questo articolo individua il collo di bottiglia, spiega perché i livelli di review e di eval non riescono a intercettarlo, e illustra le quattro mosse per ridurlo.
L'AI ha compresso i tempi di sviluppo da 30 a 100 volte. I tempi decisionali si sono ridotti di 3-5 volte. Il divario è il nuovo collo di bottiglia.
L'intent debt vive a monte di ogni livello di review. I code reviewer AI, gli eval e gli agenti QA individuano codice difettoso, non la cosa sbagliata costruita bene.
I 47 giorni di regressioni silenziose di Anthropic in Claude Code sono un postmortem di intent debt mascherato da problema di eval. La deriva non era nel codice, ma nell'attenzione del team.
La soluzione è strutturale, non tattica. Non si esce da questa situazione sviluppando di più. L'unica via d'uscita è decidere meglio, più in fretta e prima.
webvise tratta la cattura dell'intent come il vero deliverable, non come un'attività preliminare gratuita. Scopri dove si applica nel tuo team.
Cos'è davvero l'Intent Debt
Il tech debt è il termine che Ward Cunningham ha coniato nel 1992 per descrivere il costo futuro di scegliere una soluzione rapida rispetto a una pulita. Lo scambio aveva un'economia chiara: si rilasciava prima, si pagavano interessi sotto forma di manutenzione più difficile in seguito, e il capitale restava nella codebase come qualcosa da refactorizzare quando si avesse avuto tempo.
L'intent debt ha la stessa forma. Lo scambio è più codice in cambio di decisioni più sfocate. Si rilascia prima perché l'AI ha scritto l'implementazione in 30 minuti anziché in tre giorni, e l'interesse è tutto ciò che a valle si accumula quando il team non ha mai stabilito con precisione quale fosse l'output corretto fin dall'inizio.
Il vocabolario manca perché lo scambio è nuovo. Gli scritti di Martin Fowler su naming e design intent presuppongono un mondo in cui scrivere il codice era il passaggio costoso, cosicché definire correttamente il design si ripagasse in meno riscritture.
Quella premessa si è invertita nel 2024. Quando riscrivere richiede un giorno, il passaggio di progettazione smette di ripagare come prima. I team se ne accorgono e saltano la progettazione, che era il momento in cui l'intent veniva condensato in qualcosa su cui la persona successiva poteva ragionare.
Due modalità di fallimento osservate direttamente.
La prima: una funzionalità viene rilasciata in tre giorni quando pre-AI ne avrebbe richieste tre settimane. Funziona. Risolve però un problema che gli utenti non avevano, perché la spec era un messaggio Slack e l'implementatore era un agente Cursor. Il costo di sviluppo era così basso che nessuno ha rimesso in discussione se valesse la pena costruirla.
La seconda: un ingegnere senior abbandona sei direzioni di prodotto nell'arco di un anno. Nessuna muore per ragioni tecniche. Tutte muoiono nella fase di pre-vendita, e quell'ingegnere continua a saltarla perché scrivere codice sembra più produttivo. Quell'ingegnere sono io, e il costo del postmortem di quelle sei direzioni è stato superiore a qualsiasi tech debt che abbia mai estinto.
Entrambe le storie sono intent debt con le ricevute. La maggior parte dei team di engineering cerca ancora di risolverlo al livello del build, con un altro reviewer, un altro eval, un altro linter. La soluzione si trova un livello più su. Se il team produce ricevute come queste, webvise è stata costruita attorno a questa inversione.
I Numeri Dietro il Cambiamento
I dati diretti più chiari sull'asimmetria provengono dal file gstack ETHOS di Garry Tan, pubblicato nell'aprile 2026. Tan sviluppa un toolkit open-source per agenti da Y Combinator e strumenta i propri agenti con rapporti espliciti di compressione umano-AI per ogni tipo di attività.
| Tipo di attività | Team umano | Con AI | Compressione |
|---|---|---|---|
| Boilerplate / scaffolding | 2 giorni | 15 min | ~100x |
| Scrittura test | 1 giorno | 15 min | ~50x |
| Implementazione funzionalità | 1 settimana | 30 min | ~30x |
| Bug fix + test di regressione | 4 ore | 15 min | ~20x |
| Architettura / design | 2 giorni | 4 ore | ~5x |
| Ricerca / esplorazione | 1 giorno | 3 ore | ~3x |
La tabella si legge colonna per colonna. Il boilerplate si comprime 100x, la scrittura dei test 50x, il lavoro sulle funzionalità 30x. Architettura e ricerca si comprimono 5x e 3x.
Le ultime tre righe riguardano il lavoro di intent. Si comprimono, ma a un decimo del ritmo delle prime tre. Questa è la fonte strutturale dell'intent debt: codificare è ormai quasi gratuito, decidere è ancora costoso.
Per renderlo concreto: se il team dedicava l'80% della giornata di engineering al codice e il 20% alle decisioni, il nuovo rapporto dopo una compressione 30x sul codice risulta circa 12% codice e 88% decisioni. La maggior parte dei team ha mantenuto gli stessi organici, la stessa cadenza di riunioni e la stessa struttura di review, per poi osservare il secondo elemento traboccare.
Quel trabocco è l'aspetto concreto dell'intent debt.
Tre Sintomi che Indicano di Averlo già Accumulato
L'intent debt è invisibile finché non lo si nomina. Tre sintomi ricorrono nei team con cui si lavora.
Il Riflesso di Ridurre lo Scope su Lavoro a Costo Completato
Ci si ritrova a scrivere tre test invece di dieci, a saltare la documentazione, a definire l'80% come "abbastanza buono". L'istinto aveva senso quando il tempo umano era il vincolo principale. Con l'AI nel loop, la versione completa richiede gli stessi minuti della soluzione parziale.
Questo riflesso è ormai pensiero obsoleto, applicato automaticamente. Il costo è l'abitudine decisionale che considera sempre preferibile rilasciare prima piuttosto che rilasciare bene, quando rilasciare prima non fa più guadagnare tempo.
Più Review, Meno Decisioni
Elie Steinbock ha pubblicato il 20 aprile 2026 una tesi che identifica la review come il nuovo collo di bottiglia. Elenca sette livelli di difesa, dai code reviewer AI come Cubic e CodeRabbit agli agenti QA dedicati fino a un'osservabilità circoscritta. I team adottano questi livelli e la superficie di review assorbe una quota sempre maggiore della giornata.
L'intent debt vive a monte di tutti questi strumenti. I reviewer AI individuano codice difettoso, non la cosa sbagliata costruita bene. Un agente QA che percorre ogni flusso a ogni rilascio comunica che il flusso funziona, non se debba esistere.
Deriva Silenziosa Visibile Solo nei Postmortem
Anthropic ha pubblicato un postmortem il 23 aprile 2026 che documenta 47 giorni di regressioni silenziose in Claude Code. La cornice narrativa principale era "gli eval non intercettano la deriva". La cornice più profonda è che la deriva si accumula nel divario tra ciò che il team intendeva e ciò che il sistema faceva realmente.
Ogni team che utilizza lo sviluppo assistito dall'AI ha in questo momento la propria finestra di 47 giorni aperta. La maggior parte la scoprirà solo in un postmortem.
Perché Review ed Eval Non Riescono a Intercettarlo
Gli strumenti di review rispondono alla domanda "il codice ha fatto ciò che la spec indicava?". Le suite di eval rispondono "il modello si è comportato come l'eval si aspettava?". Entrambe sono domande corrette ma circoscritte. Entrambe trattano la spec e l'eval come verità di riferimento.
L'intent debt si accumula al livello superiore. Il costo vive nel divario tra ciò di cui il cliente aveva bisogno, ciò che il brief dichiarava e ciò che la spec ha catturato. Quando il codice arriva davanti a uno strumento di review, la spec ha già fissato l'intent. Il reviewer non può individuare un difetto della spec, può solo segnalare difetti di implementazione rispetto a una spec già difettosa.
Questa è la stessa forma della deriva di Anthropic. Il team di Claude Code aveva gli eval. Gli eval passavano.
La deriva stava in ciò che gli eval misuravano rispetto a ciò che gli utenti sperimentavano realmente. Quarantasette giorni di luci verdi, con utenti reali che incontravano una regressione ogni giorno. La soluzione è un feedback più ravvicinato tra chi decide cosa misurare e chi osserva il segnale di produzione.
Pensare al collo di bottiglia della review tratta questo come un problema di strumenti. È un problema di stratificazione. Si abbini questo articolo al pezzo precedente su perché il software generato dall'AI ha ancora bisogno della review ingegneristica per la metà dell'argomento relativa al livello di build. Per ridurre l'intent debt occorre porre una domanda diversa, prima.
Il Livello Decisionale Non Si Comprime come il Codice
La formulazione di Tan sul perché sia strutturale: "si fornisce il gusto mentre si dialoga con l'agente". L'agente fornisce completezza. L'essere umano fornisce direzione e giudizio. Il gusto non segue la stessa curva di compressione del codice.
Tre componenti del gusto che la generazione di codice non può sostituire.
Scegliere il Problema Giusto
La tesi "services-as-software" di Alex Vacca, pubblicata attraverso il partner Sequoia Julien Bek nell'aprile 2026, ne cattura la versione più ampia. I vendor di software che vendono lo strumento rincorrono il modello per sempre. Le aziende che possiedono il lavoro e usano il modello per erogarlo migliorano ogni volta che il modello migliora.
La stessa logica si applica all'interno dei team. Gli ingegneri che scelgono il problema giusto migliorano ogni volta che il modello migliora. Gli ingegneri che si limitano a eseguire specifiche calate dall'alto diventano commodity da un giorno all'altro.
Sapere Quando Fermarsi
Gli strumenti AI non dicono mai di fermarsi. Un LLM affronta il diciassettesimo angolo dello stesso problema con lo stesso entusiasmo del primo, e ogni risposta sembra un progresso. Senza una condizione di uscita esterna, il ciclo gira all'infinito.
Gli ingegneri esperti imponevano l'uscita annoiandosi o esaurendo il tempo disponibile. Entrambi i budget sono ora illimitati. La condizione di uscita va stabilita esplicitamente in anticipo, prima del primo prompt.
Il Dissenso che Forniscono gli Ingegneri Senior
Il contributo diretto più difficile di un ingegnere senior è il dissenso: il messaggio "questa è la cosa sbagliata da costruire" che previene un trimestre di esecuzione. Gli agenti AI non dissentono. Costruiscono ciò che viene chiesto, completamente, su una curva di compressione da 100 volte.
Si ottiene ciò che si è richiesto, e solo in seguito ci si rende conto di aver chiesto la cosa sbagliata.
Quattro Mosse per Ridurre l'Intent Debt
Sono mosse tattiche. Presuppongono che il team abbia già nominato il problema e smesso di cercare di assorbirlo al livello di review.
Pre-Vendere Prima di Aprire l'Editor
Questa è la mossa che ho dovuto reimparare nel modo difficile. Se si sta costruendo qualcosa per qualcuno che non sia se stessi, occorre ottenere un impegno verbale, un acconto o una lettera di intenti prima che qualsiasi agente scriva una riga.
L'entusiasmo verbale, i voti positivi al lancio e una lista d'attesa senza nulla in gioco sono segnali di domanda deboli. Il costo di sviluppo è così basso che l'unico filtro rimasto è se il cliente pagherà.
Trattare la Spec come l'Artefatto Durevole
Pre-AI, la spec era un documento di lavoro e il codice era l'artefatto. Post-AI, il codice è rigenerabile e la spec è la cosa durevole.
Occorre scrivere spec che nominino esplicitamente il cliente, le modalità di fallimento e la metrica di successo. Si archivino sotto version control accanto al codice. Quando la spec cambia, la rigenerazione è banale; quando la spec è sbagliata, nessuna rigenerazione potrà salvare il progetto.
Eseguire una Decision Review con Due Modelli
Un singolo LLM può razionalizzare qualsiasi direzione; un secondo modello invitato a dissentire intercetta metà delle scelte sbagliate. Il pattern funziona per la code review, dove si usa Claude più Codex più Gemini in cross-check su ogni funzionalità rilasciata.
L'uso ad alto valore è la decision review. Si mostri la spec a due modelli, si chieda loro di dissentire, si pesi il dissenso prima di costruire. Il costo è trascurabile rispetto a costruire la cosa sbagliata.
Tenere un File delle Direzioni Abbandonate
Ogni prodotto, funzionalità o campagna abbandonata prima del rilascio va in un unico documento con la relativa motivazione. La motivazione conta più del numero. Si rilegga prima di avviare qualsiasi nuova iniziativa.
Lo schema del perché le direzioni muoiono è il modo più economico per ripagare l'intent debt, eppure quasi ogni team lo salta. Per valutare dove applicare queste mosse nel proprio team, webvise può aiutare.
Scegliere un Partner Web nell'Era dell'AI
L'errore più costoso che un team dell'era AI commette è ingaggiare un'agenzia che possiede solo il livello di build. La build è ora la parte economica. Il livello decisionale (cosa rilasciare, quando abbandonare, chi sia davvero l'utente) è dove risiede il moltiplicatore.
La maggior parte delle agenzie fa ancora pagare la build perché è ciò che il loro modello di margine sa fare. webvise è stata costruita attorno all'inversione.
Gli engagement di AI automation e di full-stack application iniziano con uno sprint di discovery che produce una spec scritta, un elenco di direzioni abbandonate e una decision review con due modelli su ogni elemento di scope confermato. Una funzionalità può essere rilasciata in un giorno. Non ne verrà rilasciata nessuna finché il team non avrà concordato l'aspetto del successo in produzione.
Se questo trimestre è stato rilasciato più codice che mai eppure ci si sente più lontani da un prodotto funzionante rispetto a sei mesi fa, prenota una chiamata di discovery. Il modo più rapido per ridurre l'intent debt è smettere di accumularne altro.
Le pratiche di webvise sono allineate agli standard ISO 27001 e ISO 42001.