Linx

»

Linx Magazine

»

teoria dei giochi

Matematica per strategie ed equilibri

26 Apr. 2011 | categoria N.09 - Aprile 2011, matematica | Leggi tutto | Nessun commento

Ovvero: dal dilemma del prigioniero all’ordigno fine di mondo con la teoria dei giochi.

di Loretta Salino

Vi siete mai trovati nel bel mezzo di una partita a briscola senza la minima idea di quale carta giocare? Guardate i vostri avversari e cercate di intuire che cosa faranno, quali carte hanno in mano, rovistate nella vostra memoria in cerca di un segno… Forse, però, in casi come questi conviene non farsi prendere dal panico e analizzare la situazione in modo lucido, cercando di capire a quali vantaggi e a quali rischi possono portare le varie mosse possibili. Ecco che allora, senza saperlo, state “facendo matematica”: e quando la matematica viene applicata a una situazione di questo tipo, essa prende il nome di teoria dei giochi.

La parola gioco in questo caso vuole indicare una situazione in cui due o più giocatori si trovano a dover interagire secondo determinate regole in prospettiva di un potenziale guadagno, il cui ammontare dipenderà dal decorso del gioco, e che ciascuno cercherà di rendere il più alto possibile. I domini di studio e applicazione di questa teoria sono i più diversi, dall’etologia all’economia: per esempio, nel caso di un mercato finanziario, i broker si comportano come giocatori che cercano di ottenere il maggior guadagno (economico) possibile adottando quelle che ritengono le strategie ottimali.

In generale lo studio della teoria dei giochi sviluppa la capacità di analisi in tutte le situazioni in cui ci sono da prendere decisioni e individuare strategie di comportamento: è quindi interessante dal punto di vista didattico perché fornisce all’individuo strumenti di ragionamento efficaci che possono supportarlo nei processi decisionali in cui può trovarsi coinvolto, a vari livelli, nel corso della vita.

In questo articolo partiremo dall’analisi di un particolare gioco, trarremo spunto da questo per dare un’idea del concetto di punto di equilibrio e proveremo infine a dare un’interpretazione del conflitto della guerra fredda in termini matematici. Lasceremo da parte i formalismi superflui e proveremo a concentrarci sull’idea. Pertanto invitiamo il lettore a immedesimarsi di volta in volta in uno dei giocatori coinvolti negli esempi che faremo e a chiedersi “che cosa farei io al suo posto?”, provando ad apprezzare come la teoria proposta può servire nel fare scelte e individuare strategie.

Il dilemma del prigioniero

La polizia arresta due criminali sospettati per una rapina in banca. I due vengono rinchiusi in due celle lontane, in modo che non possano comunicare, e a ciascuno viene offerta la possibilità di fare la spia sul compare. In cambio della soffiata viene promessa la libertà immediata e l’incarcerazione dell’altro per 10 anni. Se però entrambi fanno la spia, vengono condannati a una pena ridotta di sei anni. Infine, se nessuno confessa entrambi scontano un anno di carcere.

Questo problema è noto come dilemma del prigioniero ed è un esempio di gioco non cooperativo, in cui cioè i partecipanti non hanno modo di collaborare. La domanda interessante posta dal dilemma è: qual è la strategia ottimale da tenere per ciascun giocatore? Prima di rispondere dobbiamo però fissare il concetto di strategia ottimale: per noi una strategia sarà tale nel momento in cui massimizza il guadagno ottenuto dal giocatore facendo tale scelta. In questo caso massimizzare il guadagno significa minimizzare la pena.

Supponiamo quindi di trovarci nei panni di uno dei due criminali (chiamiamoli A e B; i due sono perfettamente equivalenti quindi non ha importanza quale scegliamo). Le situazioni possibili sono quattro: A e B confessano; A confessa ma non B; B confessa ma non A; A e B non confessano.
Guardiamo le cose dal punto di vista di A: nel caso in cui B confessi (prima colonna), si può avere che anche A confessa e prende 6 anni, oppure non confessa e ne prende 10. In questo caso ad A conviene confessare. Se invece B non confessa (seconda colonna), si può avere che A confessa e viene liberato oppure non confessa e sconta 1 anno. Anche in questo caso ad A conviene confessare.

In conclusione, la scelta migliore per A è confessare, a prescindere da quello che farà B. Dal punto di vista di B, la situazione è esattamente la stessa e quindi anche a lui conviene confessare, a prescindere dalla scelta di A.

Puntare al massimo guadagno

Una situazione come questa viene detta punto di equilibrio: una scelta di strategie per la quale tutti i giocatori massimizzano il proprio guadagno quando sono fissati i comportamenti di tutti gli altri. Osserviamo che il punto di equilibrio che abbiamo individuato per il dilemma del prigioniero non porta al massimo guadagno “in assoluto” per i due giocatori. La situazione in cui nessuno dei due confessa porta sicuramente a un risultato migliore per entrambi (solo un anno di reclusione invece di sei) ma presenta un “rischio” più elevato: non sapendo come si comporterà l’altro, ciascun prigioniero ha paura a tacere perché dovrà scontare la pena massima nel caso in cui il compare decida di parlare. Vediamo allora come nei giochi “reali” la decisione effettiva presa da ciascun giocatore sia influenzata anche da fattori quali l’attitudine al rischio o l’aspettativa di vincita, fattori che potrebbero non far percepire il punto di equilibrio come scelta strategica ottimale. Il dilemma si presta a impostare un’efficace attività didattica per introdurre in classe il tema della teoria dei giochi: basterà suddividere gli studenti in coppie, “simulare” la situazione descritta nel dilemma del prigioniero, poi confrontare le scelte prese dagli studenti con quella suggerita dalla discussione qui proposta. Successivamente si può riproporre l’attività a partire dalla versione “cooperativa” del dilemma del prigioniero, in cui cioè i giocatori sono autorizzati a mettersi d’accordo sul comportamento da tenere. Si vedrà che la scelta ottimale per entrambi sarà quella di non confessare: la possibilità di cooperazione cambia radicalmente la natura del gioco.

Un criterio di equilibrio

Vediamo ora un criterio che ci aiuti a stabilire se una determinata posizione è di equilibrio nel caso di giochi strutturati come il dilemma del prigioniero, cioè dove due giocatori effettuano in simultanea una sola mossa a scelta tra due. Un gioco di questo tipo è schematizzabile con la matrice di due righe e due colonne riportata nella tabella seguente, in cui le lettere minuscole rappresentano i valori del guadagno.
A titolo di esempio, supponiamo di voler stabilire se la combinazione “A compie la Scelta 1, B compie la Scelta 2” (in azzurro) è una posizione di equilibrio. Se vale a22 ≤ a12 e b11 ≤ b12, la posizione segnalata risulta di equilibrio, mentre non lo è se le due condizioni non sono entrambe verificate. In altre parole: il guadagno di A non aumenta se questi cambia la propria scelta e B invece la conferma (corrisponde alla condizione a22 ≤ a12); il guadagno di B non aumenta se questi cambia la propria scelta e A invece la conferma (corrisponde alla condizione b11 ≤ b12).

In generale, immaginiamo di segnare la posizione da esaminare con una pedina: la posizione di equilibrio è quella per cui il guadagno di A deve rimanere invariato oppure diminuire quando la spostiamo in verticale, mentre il guadagno di B deve rimanere invariato oppure diminuire quando la spostiamo in orizzontale.

Un caso storico

La situazione appena descritta può servire per schematizzare un caso storico: la guerra fredda. Per farlo saremo costretti a semplificare la storia e a trascurare la complessità politica che caratterizzò lo scenario mondiale di quegli anni. D’altra parte crediamo che la guerra fredda possa costituire il punto di partenza di un’interessante riflessione sul comportamento che può essere tenuto in situazioni di “gioco”. Crediamo altresì che questo approccio possa servire a gettare una nuova luce su un tema che viene generalmente affrontato in altro modo e potrebbe costituire la base per la costruzione di un percorso multidisciplinare. Il conflitto della guerra fredda si può modellare per mezzo del dilemma del prigioniero. Abbiamo due potenze militari A e B che hanno la possibilità di investire ingenti somme di denaro in armi. Se entrambe decidono di non investire, il guadagno ottenuto dal punto di vista militare sarà zero sia per A sia per B. Anche nel caso in cui entrambe investano il guadagno sarà zero, perché nessuna delle due otterrebbe un vantaggio relativo dal punto di vista militare. Nella situazione in cui A investe e B non lo fa, il guadagno per A sarà positivo (perché avrà un vantaggio militare), mentre per B negativo. Quantificheremo questi guadagni con numeri arbitrari, +10 e –10; nella situazione simmetrica i guadagni sono invertiti. Possiamo schematizzare la situazione nella tabella seguente.
Come nel caso del dilemma del prigioniero, si ha un punto di equilibrio quando sia A sia B investono in armi e questa è esattamente la situazione verificatasi. Osserviamo che la situazione in cui nessuna delle due potenze investe non è di equilibrio. Vediamo infatti che, dalla posizione in cui entrambi non investono, se A sposta la sua scelta e B no – cioè se A decide di investire mentre B non lo fa – A aumenta il suo guadagno. Utilizzando il criterio descritto sopra concludiamo che questa non è una posizione di equilibrio. Osserviamo che questo modello è in realtà applicabile a qualsiasi situazione in cui due potenze militari si sentono minacciate l’una dall’altra: anche la costruzione di mura difensive attorno alle città medioevali può venir vista in questi termini. Che cos’è, allora, che rende unica la situazione della guerra fredda?

Dal punto di vista storico, sicuramente, il conflitto deve la sua unicità alla presenza di armi atomiche che minacciavano l’intero pianeta. Ma in che modo questo elemento influisce sul gioco?

“Giocare” con l’atomica

Proviamo a “prolungarlo” e a rimodellarlo a partire dalla situazione di equilibrio che abbiamo individuato: entrambe le potenze hanno arsenali nucleari costruiti in seguito agli investimenti. Adesso le mosse possibili sono: attaccare l’avversario oppure non attaccarlo. Se entrambe le potenze decidono (in maniera indipendente) di attaccare, si ha un risultato pari alla distruzione di entrambe. Se una delle due decide di attaccare, allora l’altra – che ha armi a disposizione e la possibilità di attuare una rappresaglia – attaccherà di conseguenza e con la stessa forza, per cui anche in questo caso si avrà lo stesso risultato (distruzione di entrambe). Se infine entrambe decidono di non attaccare, il risultato sarà zero perché la situazione rimarrà invariata.
In questo caso abbiamo due situazioni di equilibrio: quella in cui entrambe attaccano e quella in cui nessuna delle due attacca. Sappiamo dalla storia che si è verificata solo la seconda situazione. Questo perché, benché entrambe fossero di equilibrio, le due situazioni non erano equivalenti rispetto alle conseguenze reali che avrebbero comportato. La scelta della prima possibilità, infatti, avrebbe portato sicuramente a conseguenze devastanti per entrambe le nazioni coinvolte. Per una mirabile e surreale descrizione di quest’ultimo scenario, rimandiamo al celebre film Il Dottor Stranamore di Stanley Kubrick, in cui la follia di un generale invasato porta allo scontro le due superpotenze in conflitto e apre all’idea di un ordigno incontrollabile e devastante, l’ordigno fine di mondo. Buona visione.

Multimedia

Il teorema di Nash: traduzione commentata delle prime sezioni dell’articolo Non-cooperative games di John Nash (“Annals of Mathematics”, 1951) di Loretta Salino. Scarica il pdf

Download

L’autrice

Loretta Salino è lo pseudonimo di un gruppo di matematici, ex studenti della Scuola Normale di Pisa, che unisce esperienze nel campo dell’editoria digitale, della didattica e della ricerca pura.

torna su

N.09 - Aprile 2011