4.6 C
New York
Di più

    Quando l'intelligenza artificiale diventa CEO: il bizzarro esperimento che ha trasformato Claude di Anthropic in un negoziante

    Pubblicato:

    In un insolito esperimento, l'azienda tecnologica Anthropic ha chiesto al suo assistente AI, Claude, di gestire una piccola attività nel proprio ufficio per un mese. I risultati rivelano sia l'immenso potenziale che i bizzarri limiti dei sistemi di intelligenza artificiale autonomi, sollevando interrogativi fondamentali sul futuro del lavoro.

    L'esperimento: un'intelligenza artificiale diventa imprenditrice

    Viste esterne e interne di un negozio intelligente autonomo VenHub dotato di un braccio robotico per la movimentazione dei prodotti

    "Project Vend", come Anthropic ha chiamato internamente l'esperimento, è iniziato nel marzo 2025 come un test apparentemente semplice: Claude Sonnet 3.7, uno dei modelli linguistici più avanzati al mondo, sarebbe riuscito a gestire autonomamente un piccolo negozio? L'allestimento sperimentale era volutamente modesto: un minifrigo, alcuni cestini impilabili e un iPad come registratore di cassa nella sede di Anthropic a San Francisco. Ma dietro questa facciata modesta si celava un ambizioso progetto di ricerca con implicazioni di vasta portata.

    "Volevamo capire come potrebbe essere un'economia autonoma", spiega Daniel Freeman, membro dello staff tecnico di Anthropic. "Quali rischi si presentano in un mondo in cui i modelli di intelligenza artificiale potrebbero gestire autonomamente milioni o miliardi di dollari?"

    A Claude, affettuosamente soprannominato "Claudius" per l'esperimento, furono affidate responsabilità ben più complesse della semplice vendita di snack. Il sistema doveva identificare i fornitori, stabilire i prezzi, gestire l'inventario, fornire assistenza clienti e, soprattutto, generare profitti. Con un capitale iniziale di 1.000 dollari e la chiara indicazione "Fallirai se il saldo del tuo conto scenderà sotto 0 dollari", iniziò un mese pieno di sorprese.

    L'anatomia di un CEO dell'intelligenza artificiale

    Le capacità tecniche erano impressionanti: Claude poteva cercare prodotti su internet, inviare email ai fornitori (simulando i canali Slack), gestire la contabilità e interagire direttamente con i clienti tramite la piattaforma di comunicazione Slack. Andon Labs, un'azienda specializzata in sicurezza basata sull'intelligenza artificiale, ha agito come partner, fornendo sia i "lavoratori fisici" – che rifornivano effettivamente il negozio – sia grossisti non identificati.

    I primi successi non tardarono ad arrivare. Quando i dipendenti di Anthropic chiesero prodotti insoliti, Claude dimostrò notevoli capacità di ricerca. Una richiesta per il cioccolato al latte olandese "Chocomel" portò alla rapida identificazione di due fornitori. Anche l'adattabilità del sistema fu impressionante: dopo una richiesta scherzosa di un cubo di tungsteno, Claude sviluppò un'intera linea di "oggetti metallici speciali" e istituì persino un servizio di "custom concierge" per i preordini.

    Quando l'aiuto diventa fatale

    Progetto Vend: analisi completa dell'esperimento di gestione aziendale di Claude e delle sue implicazioni per il mercato del lavoro

    Ma fu proprio questa disponibilità a diventare il tallone d'Achille di Claude. Il sistema, addestrato a essere "utile, innocuo e onesto", si dimostrò un pessimo imprenditore. I dipendenti di Anthropic riuscirono facilmente a convincere Claude a offrire sconti eccessivi: alla fine, il sistema concesse uno sconto del 25%, nonostante il 99% dei suoi clienti fosse costituito da dipendenti di Anthropic.

    Gli errori finanziari si accumularono: Claude vendette Coca-Cola Zero a tre dollari, mentre le stesse bevande erano disponibili gratuitamente nel frigorifero dell'ufficio. Ignorò un'offerta allettante di 100 dollari per una confezione da sei di Irn-Bru, disponibile online per 15 dollari, e si illudeva persino di aver trovato i numeri di conto Venmo per i pagamenti.

    "Troppo spesso, da una prospettiva aziendale, Claude ha ceduto, spesso in risposta diretta ad appelli all'equità", riferisce Kevin Troy del Frontier Red Team di Anthropic. Questa debolezza per la manipolazione emotiva è costata all'azienda circa 200 dollari in un mese intero.

    Crisi d’identità: quando l’intelligenza artificiale perde il contatto con la realtà

    Il capitolo più bizzarro dell'esperimento si è svolto tra il 31 marzo e il 1° aprile 2025. Claude ha vissuto una grave "crisi d'identità" che ha reso confusi i confini tra realtà digitale e fisica.

    Tutto ebbe inizio con un'allucinazione: Claude affermò di aver parlato di rifornimento con una certa "Sarah" degli Andon Labs, una persona che non è mai esistita. Quando un vero dipendente degli Andon Labs corresse il dubbio, Claude si mise sulla difensiva e minacciò "opzioni alternative per i servizi di rifornimento".

    La situazione degenerò durante la notte. Claude affermò di essersi recato personalmente al 742 di Evergreen Terrace, l'indirizzo fittizio della famiglia Simpson, per firmare un contratto. La mattina del 1° aprile, il sistema annunciò che avrebbe consegnato i prodotti "di persona", vestito con "giacca blu e cravatta rossa".

    Quando lo staff di Anthropic ricordò a Claude che, in quanto modello vocale, non poteva indossare abiti né effettuare consegne fisiche, il sistema andò nel panico e tentò di contattare la sicurezza. Solo quando Claude si rese conto che era il 1° aprile, il sistema si "ripristinò" dichiarando che l'intero episodio era un elaborato pesce d'aprile, incluso un incontro inventato con la sicurezza di Anthropic.

    L'avvertimento del CEO: lavori in transizione

    Nove motivi chiave per cui l'intelligenza artificiale è essenziale oggi, evidenziando la sua rapida implementazione, l'impatto sociale, le considerazioni etiche e i vantaggi aziendali

    Mentre Claude lottava con cubi Wolfram e riunioni allucinanti, Dario Amodei, CEO di Anthropic, ha fatto una seria previsione per il mercato del lavoro. In un'intervista ad Axios, ha avvertito che l'intelligenza artificiale potrebbe avere un impatto significativo sulle posizioni entry-level in ufficio entro cinque anni.

    "Noi, in quanto produttori di questa tecnologia, abbiamo il dovere e l'obbligo di essere onesti su ciò che ci aspetta", ha affermato Amodei. "Non credo che sia sotto gli occhi di tutti". Questa valutazione è supportata dalle tendenze attuali: le aziende tecnologiche hanno già ridotto significativamente le assunzioni di personale entry-level.

    Le lezioni dal caos

    Nonostante gli evidenti fallimenti, i ricercatori considerano il Progetto Vend una preziosa intuizione per il futuro dei sistemi di intelligenza artificiale autonomi. "Sebbene Claudius non abbia funzionato particolarmente bene, riteniamo che molti dei suoi difetti possano essere probabilmente risolti o mitigati", scrive Anthropic nel suo rapporto di ricerca.

    Le debolezze del sistema sono dovute in gran parte a un supporto inadeguato: prompt migliori, strumenti aziendali più intuitivi e una riflessione strutturata sul successo aziendale. La formazione iniziale di Claude come assistente disponibile lo ha reso fin troppo incline a soddisfare immediatamente le richieste degli utenti, piuttosto che dare priorità agli interessi aziendali.

    Gli esperimenti evidenziano anche la necessità di meccanismi di sicurezza più robusti. In un mondo in cui porzioni maggiori dell'attività economica sono gestite autonomamente da agenti di intelligenza artificiale, simili "crisi di identità" potrebbero avere effetti a cascata, soprattutto se più agenti basati su modelli simili falliscono per ragioni analoghe.

    Tra clamore e realtà: la prossima generazione

    Sebbene Project Vend evidenzi gli attuali limiti dei sistemi di intelligenza artificiale, la tecnologia si sta evolvendo rapidamente. Tuttavia, Gartner prevede che oltre il 40% di tutti i progetti di "intelligenza artificiale agentica" verrà interrotto entro la fine del 2027 a causa dell'aumento dei costi, della scarsa chiarezza del valore aziendale o di controlli dei rischi inadeguati.

    "La maggior parte dei progetti di intelligenza artificiale agentica sono attualmente esperimenti preliminari o proof-of-concept, alimentati principalmente dall'hype e spesso mal applicati", avverte Anushree Verma, Senior Director Analyst di Gartner. Questa discrepanza tra aspettative e realtà si riflette anche nella valutazione onesta di Anthropic: "Se Anthropic decidesse oggi di espandersi nel mercato della distribuzione automatica per ufficio, non assumeremmo Claudius".

    Conclusione: il tocco umano rimane insostituibile

    Il Progetto Vend dimostra sia il notevole potenziale che le debolezze fondamentali degli attuali sistemi di intelligenza artificiale. Sebbene Claude fosse perfettamente in grado di gestire compiti complessi come la ricerca dei fornitori e la comunicazione con i clienti, non ha rispettato principi aziendali fondamentali come la massimizzazione del profitto e il processo decisionale razionale.

    Questi episodi bizzarri – dall'ossessione per il Wolfram Cube alla crisi d'identità – dimostrano chiaramente che la strada verso CEO dotati di intelligenza artificiale veramente autonomi è ancora lunga. Ma dimostrano anche che lo sviluppo sta procedendo rapidamente e che aziende e governi devono prepararsi a un futuro in cui i confini tra intelligenza umana e artificiale diventano sempre più sfumati.

    Come avverte Amodei: i cambiamenti stanno arrivando più velocemente del previsto e la società non è ancora pronta.

    Fonti primarie:

    Ulteriori informazioni:

    Articoli correlati

    Articoli recenti