La risoluzione delle entità è il problema centrale degli agenti IA
In Revo AI stiamo costruendo un agente IA ambientale basato sull'email. Abbiamo scritto sul perché l'email risolve il problema del cold start per gli agenti IA. Questo post riguarda il problema ingegneristico più difficile che abbiamo trovato costruendolo — e perché pensiamo sia il problema più difficile nell'IA ambientale in generale.
Il problema di cui nessuno parla perché non è glamour
La conversazione sull'IA riguarda i modelli. Qualità del ragionamento, finestre di contesto, uso degli strumenti, velocità di inferenza. Tutto questo è importante. Niente di ciò è dove gli agenti in produzione si rompono davvero.
Gli agenti si rompono sulla risoluzione delle entità.
La stessa persona appare come nome in Slack, nome completo in un contratto, dominio email in un thread, nome aziendale in un record CRM e ID account in un ticket di supporto. Un agente che opera in un contesto professionale vede tutti questi segnali e deve decidere, senza allucinare, se si riferiscono alla stessa entità — e quale sia la relazione di quell'entità con tutto il resto che conosce.
Sbagliare questo e l'agente non fallisce silenziosamente. Redige una risposta usando il linguaggio dell'affare sbagliato. Fa follow-up con il contatto sbagliato. Collega una conversazione sensibile a qualcuno che non dovrebbe vederla. I fallimenti nella risoluzione delle entità in un agente ambientale non sono problemi di UX. Sono rischi relazionali e potenziali violazioni della privacy.
Questo è il problema su cui abbiamo speso più tempo di qualsiasi altro in Revo AI. Non è ancora risolto — è gestito. Ecco cosa abbiamo imparato.
Perché la risoluzione delle entità è strutturalmente più difficile per gli agenti che per la ricerca o i CRM
La risoluzione delle entità non è un problema nuovo. Motori di ricerca, CRM e data warehouse hanno affrontato versioni di esso per anni. Ma gli agenti affrontano una versione più difficile per tre motivi.
Il costo dell'errore è asimmetrico. Un autocompletamento sbagliato in un normale client email è fastidioso. Una corrispondenza di entità sbagliata in un agente che redige e invia per tuo conto è un rischio relazionale. La tolleranza all'errore è un ordine di grandezza inferiore rispetto agli strumenti passivi.
Il segnale è più rumoroso. L'email è informale, incoerente e umana. Le persone si riferiscono alla stessa entità in dozzine di modi diversi attraverso migliaia di messaggi. Non c'è schema. Non c'è convenzione di denominazione forzata. L'agente deve dedurre la struttura dal segnale non strutturato su larga scala.
Il grafo è dinamico. Le entità cambiano. Le persone cambiano ruolo. Le aziende vengono acquisite e i domini cambiano. Il grafo delle entità non può essere costruito una volta e memorizzato nella cache — deve aggiornarsi continuamente quando arrivano nuovi messaggi e segnalare conflitti quando il nuovo segnale contraddice ciò che pensava di sapere.
Cosa abbiamo effettivamente costruito in Revo AI
Manteniamo un grafo di entità vivente che si aggiorna con ogni messaggio elaborato. Il grafo collega persone, aziende, affari, thread e strumenti — risolvendo la stessa entità attraverso diverse convenzioni di denominazione e fonti di dati in tempo reale.
Quando il grafo incontra segnali conflittuali — due contatti di nome James nella stessa azienda, un dominio cambiato dopo un'acquisizione, un nome che potrebbe plausibilmente riferirsi a due persone diverse — segnala l'ambiguità invece di indovinare. Trattiamo l'ambiguità irrisolta come uno stato di prima classe, non un errore da sopprimere.
Questo ci costa copertura dell'automazione. Segnalare l'ambiguità significa che alcune azioni non vengono eseguite automaticamente e vengono invece sottoposte a revisione umana. Abbiamo fatto questo compromesso deliberatamente. L'alternativa — indovinare e sbagliare — produce il tipo di fallimento che fa disattivare permanentemente un agente agli utenti.
La risoluzione delle entità deve anche avvenire all'interno di rigidi confini di privacy. Un agente che legge una casella di posta professionale ha accesso a informazioni sensibili tra clienti, affari, team e livelli organizzativi. Il grafo delle entità deve sapere non solo come le entità sono collegate ma cosa l'agente è autorizzato a collegare. Il controllo degli accessi a livello di dominio non è un'infrastruttura opzionale — è una parte centrale della logica di risoluzione. La risoluzione delle entità senza controlli sulla privacy è una responsabilità, non una funzionalità.
Cosa fa effettivamente l'IA ambientale quando funziona
La maggior parte dei prodotti di IA ambientale è morta nel divario tra "tecnicamente corretto" e "affidabile". La parte difficile non è costruire un agente che può agire — è costruirne uno che sa quando non agire.
Ecco come appare un martedì mattina quando la risoluzione delle entità funziona:
8:14. "Lisa Chen ha segnalato la clausola IP nel contratto Meridian. Bozza di risposta pronta usando il tuo linguaggio standard dall'affare Acme."
8:22. "Nessuna risposta da James Park sul budget Q2 (5 giorni). Follow-up preparato."
9:01. "Sarah ha menzionato che la migrazione è finita. Tre ticket clienti fanno riferimento a quel bug. Aggiornamenti preparati."
Ognuno: accetta, rifiuta o dai feedback. Questa è l'intera superficie di interazione. L'agente ha pianificato il lavoro. L'utente governa l'output.
La conseguenza UX: la fiducia si guadagna incrementalmente
Abbiamo progettato l'agente Revo AI per iniziare in modo ristretto e guadagnarsi la strada verso azioni più ampie. Il primo giorno evidenzia cose semplici: un follow-up dimenticato, una bozza per una risposta in sospeso, un conflitto segnalato. Accetta o rifiuta. Nessuna configurazione, nessun prompting, nessun manuale.
Questo non era il design originale. È stata una risposta al vedere i primi utenti disattivare un agente che era tecnicamente corretto ma si muoveva più velocemente di quanto fossero pronti a fidarsi. La rivelazione progressiva non è solo un pattern UX — è come dai agli utenti abbastanza tempo per verificare che la risoluzione delle entità funzioni prima che l'agente inizi a intraprendere azioni ad alta posta.
Cosa significa questo per l'infrastruttura degli agenti
La risoluzione delle entità è infrastruttura, non una funzionalità. È il livello che determina se un agente IA che opera su un contesto professionale reale può essere fidato per agire — o se è una demo sofisticata che si rompe nel momento in cui i dati diventano disordinati.
La maggior parte dei framework per agenti lo tratta come un caso limite. Non lo è. È il problema centrale. Gli agenti che guadagneranno l'uso a lungo termine saranno quelli che lo risolvono con la giusta combinazione di architettura a grafo, gestione dell'ambiguità, controlli sulla privacy e ritmo di fiducia — non quelli con la migliore inferenza.
L'email è l'ambiente più difficile in cui risolvere la risoluzione delle entità, perché i dati sono i più disordinati e la tolleranza all'errore è la più bassa. Questo è anche il motivo per cui risolverlo sull'email si generalizza. L'infrastruttura che abbiamo costruito in Revo AI per risolvere le entità attraverso una casella di posta professionale è la stessa infrastruttura di cui qualsiasi agente ambientale ha bisogno per operare in modo affidabile su dati non strutturati del mondo reale.
Se questo risuona con te, contattaci: mehdi@revo.ai
You might be interested in
Pronto a provare Revo?
Prova gratuita di 7 giorni. Cancellazione in qualsiasi momento.