Punture di spillo. Modelli di agenti guidati dall’IA: quando il gioco si fa duro, i duri…Â
- a cura di Pietro Terna
- 13 ore fa
- Tempo di lettura: 6 min
a cura di Pietro Terna

Intorno a noi tutto è complicato o complicatissimo, meglio ancora: intrinsecamente complesso. Per capire, possiamo tentare di costruire dei modelli e cioè cercare di rappresentare la realtà in un modo trattabile, ma non semplicistico. Modello nella nostra lingua ha molti significati e usi.[1] Qui si impiega il termine per indicare una costruzione in scala che rappresenti, in un modo che sia il più fedele possibile, le caratteristiche di una qualche realtà . Per il gioco dei bambini, una bambola o un trenino; nel nostro caso una collettività , un insieme di utilizzatori di un servizio, un gruppo di opinione, un’impresa, un’organizzazione, e così via, sempre nel modo più fedele possibile. Due esempi su cui impegnare riflessione e immaginazione: un sistema di prenotazione del sistema sanitario che tenga conto della cartella clinica di ciascuno per gestire le priorità , chiedendo al modello di mostrarci che cosa accadrebbe se lo si applicasse; una dislocazione dei punti nevralgici dello stesso sistema sanitario sul territorio (i pronto soccorso, le maternità , le terapie specialistiche, …) che tenga conto delle caratteristiche sociosanitarie delle microaree del territorio. In entrambi i casi, con un fondamentale uso dell’intelligenza artificiale. Attenzione: se il modello ci dice che una certa soluzione è possibile, proviamo a riflettere se è praticabile nel mondo reale; se già il modello fallisce… scappiamo lontano.
Sono possibili da qualche mese applicazioni costruite con agenti o attori dotati di intelligenza artificiale, anche collegati ad agenti umani che possano essere chiamati in causa quando serve un livello di discernimento maggiore.[2] Quegli agenti interagiscono con l’ambiente e tra loro, secondo le loro capacità e specializzazioni.
Presento un piccolo esempio che ha richiesto solo un decina di ore di lavoro. Sviluppare i modelli per gli scenari che ho immaginato nell’introduzione richiederebbe invece centinaia di ore di impegno e l’opera di gruppi di lavoro multidisciplinari.
Ho scelto un gioco economico, l’Ultimatum Game,[3] titolo che rendo in italiano con Gioco Ultimativo, più chiaro di Gioco dell’Ultimatum.[4] Due persone, che non si conoscono e non si incontreranno più, devono divedersi una somma di denaro trovata su un tavolo, supponiamo cento monete da un euro. Ecco come si gioca. Si sceglie a caso chi fa la prima mossa; chiamiamo A quella persona, l’altra è B. Il giocatore A decide quanto vuole prendere per sé dal tavolo, da 0 monete a tutte, lasciando il resto a B che può accettare o rifiutare l’offerta. Se B accetta prende la sua parte e anche A se ne va con la quantità di monete che ha indicato; se B rifiuta, entrambi restano a zero.

Provate a immaginare quel che fareste nei panni di A o di B. Nel mondo reale, A preleva più o meno la metà e B accetta; se A esagera, per lo più B non si accontenta di quel poco che resta. Razionalmente si vorrebbe che poco sia meglio di niente, ma prevale la percezione dell’ingiustizia, dell’arroganza, addirittura il disgusto; insieme, portano a punire l’interlocutore facendogli perdere la somma esagerata che vorrebbe per sé. Così accade in moltissimi esperimenti ed è interessante sapere che la decisione di rifiutare è dettata dalla parte emozionale del nostro cervello.[5] La teoria che descrive l’homo oeconomicus[6] aderisce al principio che poco è meglio di niente. L’homo oeconomicus non è la persona… più felice del mondo e l’IA Grok l’ha ben disegnato nella figura.
Proviamo a far giocare degli agenti artificiali. All’indirizzo https://terna.to.it/UG.pdf si trova una micro-presentazione, due sole pagine: le scritte in blu sono link ad altre pagine web. La seconda delle pagine contiene: un link che ci porta alla voce di Wikipedia dedicata al gioco ultimativo; un altro link che ci porta al modello con gli agenti artificiali; in basso, la possibilità di esaminare il codice informatico che sta alla base del gioco; infine, un collegamento a una pagina di traduzione.
Prima di descrivere l’uso del programma, un cenno a come l’ho realizzato. Ho chiesto a una IA dedicata alla programmazione, Codex[7] di OpenAI, di scriverlo utilizzando il sistema di agenti di OpenAI.[8] Ho spiegato il gioco ultimativo e ho chiesto di sviluppare le caratteristiche da collegare ai diversi tipi di partecipanti al gioco, indicati da me. Codex l’ha fatto, ma forse – come vedremo – con un sovraccarico di precisione. Con qualche mio ritocco, il programma preparato è risultato ben funzionante. I diversi tipi di giocatori sono: homo oeconomicus, economista comportamentale, persona normale, persona generosa, persona avara, persona egualitaria, sociologo, psicologo, persona che si comporta a caso, persona egoista.

Andiamo a https://terna.to.it/UG.pdf e clicchiamo su «Run the Ultimatum Game»: seguiamo le istruzioni con un clic in alto a destra per accedere a Binder, che è il sistema che esegue direttamente online il programma. Dopo una breve attesa, qualche minuto al massimo,[9] eccolo funzionante per fare delle prove. Lo si avvia nel suo complesso con un clic sul segno della doppia freccia; nelle prove successive è sufficiente, dopo aver cambiato i giocatori nella cella «Choose two of the characters above and run the game»,[10] restando con il cursore in quella cella, il clic sulla freccia semplice.
Alla domanda «choose if you prefer personality prompts: highly specified (enter 1) or only descriptive (enter 2) or or over simplified (enter 3) »[11] rispondiamo: 2.
Nel confronto tra due homines oeconomici il risultato è sicuro: il primo trattiene 99 e lascia 1, il secondo accetta. Se invece, com’è inizialmente nell’esempio, al primo posto come proposer abbiamo una persona egoista e per responder una persona generosa, vediamo una varietà di risultati, ma sempre con l’accettazione della proposta. Se invece per secondo indichiamo una persona normale, le cose si complicano e a tutte le proposte dell’egoista la risposta sarà un rifiuto. Anche se per secondo mettiamo lo psicologo, le cose non migliorano. Se invece in quella posizione compare l’homo oeconomicus, un grande evviva per l’egoista.
Se alla domanda sopra rispondiamo 1, le azioni degli agenti sono molto rigide, senza varianti. L’autore artificiale Codex è stato molto preciso e anche numericamente dettagliato nelle sue descrizioni; ne ho aggiunte di mie, come dire, più sfumate: indicando 2 alla domanda sopra, abbiamo usato quelle. C’è anche la possibilità di rispondere 3, con delle definizioni molto stringate, con pochissimo aiuto all’intelligenza artificiale che deve decidere, e i risultati cambiamo ancora.
A che cosa serve questa presentazione? Ha lo scopo di mettere il lettore il più possibile a contatto con quello che effettivamente è la tecnica degli agenti dotati di intelligenza artificiale e mostrare a chi sta ora studiando nella scuola superiore e all’università quanto è importante mantenere un ruolo guida in queste costruzioni e anche trovare lo spazio per far intervenire la nostra creatività . Il numero di May/June 2025 della MIT Technology Review[12] dedica la copertina e alcuni articoli alla creatività al tempo dell’IA. La grande studiosa Melanie Mitchell ha dedicato pochi giorni fa un post[13] a David Cope: Composer, computer scientist, and pioneer of computer generated music, scomparso da poco; all’inizio ci presenta un esempio di musica artificiale nello stile di Bach, ma soprattutto discute di creatività .
Se avete letto sin qui, meritate un premio ed è la chiosa scritta dal nostro (piccolo, dice lui, facendo il verso[14] a Guccini) baccelliere di musica, titolare ogni martedì (prendete nota) di una rubrica della Porta di Vetro. La quantità di elementi di cui deve tenere conto un modello costruito per rappresentare una realtà mediamente complessa è così grande da far venire il mal di testa. Le variabili da considerare sono tante e non tutte hanno lo stesso peso. E poi c’è il buon senso che è difficile da instillare in una macchina – a volte non ce l’hanno neanche le persone. In musica ci sono due figure, umane, che devono porsi un simile problema.

Sono il direttore d’orchestra, che l’orchestra la dirige, e il batterista, che suona un’orchestra di tamburi. Sono tante le odi al direttore d’orchestra. Ce ne siamo occupati anche in queste code musicali degli spilli e in effetti se le merita. Questa volta dedichiamo allora poche righe al batterista. La batteria è probabilmente l’unico strumento completamente americano. Prima del ‘900 non esisteva e in un periodo relativamente breve ha conosciuto uno sviluppo eccezionale. La batteria si suona con tutti e quattro gli arti. La sfida sta nello sviluppare indipendenza fra questi. Il jazz moderno ha richiesto al batterista performance sempre più complesse, fondate su poliritmi nei quali linee contrastanti si intrecciano. La difficoltà di esecuzione in questo caso non è fine a sé stessa, ma costituisce un mezzo espressivo. L’impulso ritmico guida il solista verso il senso complessivo della musica. Uno dei punti più alti di questa tecnica è quello raggiunto da Max Roach, uno dei padri della batteria bebop, grandissimo accompagnatore,[15] meraviglioso solista.[16] Insomma un modello.
Note
[2] Può darsi che tra qualche hanno questa opzione non abbia più motivo di esistere.
[5] Suggerisco: Limbic justice--amygdala involvement in immediate rejection in the Ultimatum Game, https://pubmed.ncbi.nlm.nih.gov/21559322/Â
[8]Â https://openai.github.io/openai-agents-python/Â con https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdfÂ
[9] Consiglio l’uso al mattino, quando gli utilizzatori americani… dormono.
[10]Â Scegliete due dei personaggi di cui sopra ed eseguite il gioco.
[11] Scegliere se si preferisce che le richieste di personalità siano: altamente specificate (inserire 1) o solo descrittive (inserire 2) o iper semplificate (inserire 3)