6 x 9 = 42

“Ho sempre detto che c’era qualcosa di fondamentalmente sbagliato nell’universo…” (Arthur Dent)

Il Dilemma dell’Avventuriero

Posted by scardax su settembre 16, 2011

Ci sono alcune tematiche scientifiche che possiamo solo definire trasversali: si ripropongono un po’ ovunque. Una di queste, forse leggermente meno conosciuta al di fuori del mondo accademico, è il cosidetto dilemma dell’exploration vs. exploitation che, in mancanza di una miglior traduzione italiana, chiameremo qui col nome originale. E’ un dilemma al quale tutti noi, seppur inconsciamente, siamo abituati fin dalla più giovane età, e deriva principalmente dal dover agire in un mondo di cui abbiamo solo un’informazione incompleta. Conoscendo solo una porzione di tutto quello che ci circonda, ad ogni decisione da prendere siamo confrontati con due possibili opzioni:

  1. Selezionare l’azione che, secondo la nostra conoscenza, è la migliore in quella circostanza (exploitation),
  2. Esplorare alternative al momento sconosciute, con la possibilità di un rendimento scostante ed eventuali perdite di tempo e risorse (exploration).

Dobbiamo continuare a lavorare sul progetto fallimentare che ci ha tenuti impegnati nelle ultime settimane? O è ora di abbandonarlo per dedicarsi ad altro? Meglio andare alla spiaggia che conosciamo benissimo? O cercarne un’altra? Esempi del genere riempiono la nostra attività cosciente in ogni istante.

La formulazione del problema in questi termini è relativamente recente, fine degli anni ’80, e si è presentata durante lo studio del multi-armed bandit, che in sostanza è una slot machine con N diverse leve, ciascuna delle quali ha una probabilità diversa di vittoria per il giocatore. Senza conoscere questa probabilità a priori, qual’è la strategia migliore a questo gioco? La soluzione dell’americano Gittins prevedeva il calcolo di determinati indici, detti appunto indici di Gittins, e nonostante il grande numero di assunzioni che dovette fare, contribuì a dare una prima formulazione rigorosa di questo dilemma.

Da allora, lo stesso dilemma è ricomparso sempre più spesso, soprattutto (come ci si potrebbe aspettare) nei campi di ricerca interessati a comportamenti “intelligenti” da parte di robot e agenti software: pensiamo ad un giocatore di Poker che può scegliere di sacrificare parte dei suoi guadagni per apprendere qualcosa sul tipo di gioco dell’avversario, o ad un robot mobile che deve decidere come arrivare da qualche parte senza però conoscere ancora la mappa del luogo in cui si trova. Soluzioni tipiche di questo genere di problemi richiediono generalmente alti livelli di esplorazione iniziali (quanto l’ambiente è ancora altamente incerto), e sempre più exploitation man mano che il mondo diventa più conosciuto.

Eppure, fino ad ora i ricercatori si sono concentrati su situazioni sostanzialmente statiche, nelle quali l’ambiente non cambia o, se cambia, cambia poco. Provate a pensare a quanto è difficile, invece, bilanciare questo dilemma in un universo complesso come quello umano, nel quale le informazioni cambiano (a volte anche rapidamente) e spesso sono anche sbagliate di partenza (pensate ai pregiudizi, alle supposizioni errate ecc.). In effetti, ricercatori che indagano sulle modalità neurologiche di questo bilanciamento stanno scoprendo meccanismi sempre più complessi ed affascinanti che regolano il nostro comportamento di tutti i giorni, rendendoci a tratti più avventurosi, a tratti più cauti.

Come semplice esempio per concludere, pensate alla noia: questa non è altro che un modo per dirvi che state sprecando le vostre risorse in un comportamento che non vi porta nulla, e che invece sarebbe meglio investite per esplorare qualcosa che ancora non conoscete. Riusciremo un giorno ad implementare comportamenti similmente complessi in esseri artificiali?

Annunci

5 Risposte to “Il Dilemma dell’Avventuriero”

  1. Dipende cosa si intenda per “esseri artificiali”… 🙂 Basti pensare all’ingegneria genetica: naturali, artificiali… chissà! Io cambierei la domanda con la seguente: “Riusciremo mai a sviluppare un linguaggio che descriva efficacemente e esaustivamente oggetti (se ci fosse una parola più generica userei quella) tanto complessi?”

  2. floppino said

    Il problema per me non è tanto trasferire questa capacità agli esseri artificiali (anche se sarebbe affascinante), quanto far capire alla gente che non deve sprecare il proprio tempo come abitualmente fa…so per esperienza che il mondo è così vasto e interessante che non ci sarebbe nemmeno il tempo di dormire se lo si volesse esplorare adeguatamente…
    vorrei aggiungere un’osservazione che feci molti anni fa osservando le formiche 😀 . Quando trovano una fonte di cibo, ad esempio un po’ di zucchero, non si preoccupano di cercare la strada più breve verso il formicaio (exploration), bensì seguono il percorso tortuoso che ha seguito la prima formica che ha trovato lo zucchero…dunque sprecano più risorse seguendo un itinerario più lungo ma sicuro e non cercano un’alternativa (exploitation)

  3. Questa citazione mi ha semplicemente entusiasmato proprio perché è l’argomento in cui mi sono imbattuto pochi mesi fa. Ed è bello ritrovarselo citato in un commento come il tuo, non credi? E’ vedere il proprio riflesso allo specchio… Ma bando alle ciance… L’articolo è questo: http://www.scienzagiovane.unibo.it/intartificiale/8-intart-sistnat.html

    E’ vero… la fase iniziale dell’esplorazione delle formiche costituisce un “transitorio” per il raggiungimento dell’ottimo (ovvero trovare il percorso più breve). Ma l’ottimo è per la colonia, non per la singola formica. Non c’è spreco di risorse per l’obbiettivo della colonia. Anzi… è un modo efficientissimo per risolvere il problema.

    Le formiche sono appendici di un’entità superiore, ovvero l’informazione codificata nel loro DNA. Le formiche sono portatrici di questa informazione e la mettono anche in atto, ma quello che va preservato per la natura non è tanto una singola portatrice quanto l’informazione che essa porta. La pura informazione non è soggetta al secondo principio della termodinamica (ma questo è un altro paio di maniche) e perciò in questa si può osservare un’evoluzione.

    La domanda adesso è questa: qual è il più piccolo brandello di informazione da cui si è partiti e qual è il processo che rende necessaria l’evoluzione?

  4. scardax said

    Ciao e grazie ad entrambi dei commenti!
    Il campo degli algoritmi di ottimizzazione ispirati alla Natura è estremamente interessante e vasto (ne esistono anche alcuni ispirati alla musica!). Tempo fa scrissi un post proprio sugli algoritmi genetici, e ne avevo giusto in mente uno sull’ottimizazzione basata su “formiche”, sono felice di sapere che interesserebbe. 🙂

  5. Aki said

    Uff mi scuso perché è un bel pezzo, com’è evidente, che non mi faccio vivo! Purtroppo ho “abolito” google reader dalle mie abitudini e solo adesso sta tornando in auge 😀

    Bell’articolo e interessanti gli spunti!

    Contribuisco con i “m2c”: personalmente sono molto propenso all’exploration 😀 a volte fin troppo, a costo di perderci; ma trovo che sia un evento molto raro, perché il 90% (stima percepita) delle volte una maggiore conoscenza fornisce indicazioni per decidere meglio quando è il caso di smettere di esplorare (e dunque iniziare con l’exploit), sia perché l’exploit con maggiore conoscenza rende solitamente di più.

    In ogni caso, è una deformazione che arriva dai giochi RTS (a conoscenza non perfetta), dove la prima regola è che esplorare è la cosa fondamentale.

    Chiaramente, con delle slot machines sarei più prudente 😀

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

 
%d blogger hanno fatto clic su Mi Piace per questo: