Questo lavoro analizza le principali inefficienze architetturali e i bias euristici che limitano l’affidabilità degli attuali agenti di codifica basati su Large Language Models (LLM). Attraverso una lettura critica della letteratura recente sui bug nei coding agents e sui fallimenti nei sistemi multi-agente, sosteniamo che una parte sostanziale degli errori osservati non derivi da limiti puramente cognitivi del modello, ma da criticità sistemiche di orchestrazione: gestione miope dello stato e della KV-cache, esecuzione rigidamente sequenziale, assenza di ottimizzazione globale del workflow e disallineamento informativo tra agenti. Il lavoro formalizza tali inefficienze tramite una rappresentazione DAG-aware dei flussi di lavoro, evidenziando come pipeline bubbles, mancata coalescenza delle richieste e verifiche solo locali compromettano sia le prestazioni sia la correttezza semantica del task. In conclusione, proponiamo alcune direttrici architetturali per superare questi limiti: orchestrazione globale orientata al DAG, protocolli di verifica multi-livello e meccanismi robusti di quantificazione dell’incertezza e gestione dello stato.
Autore: Marco Bellante – Università degli Studi di Torino, Department Member