Sunday, November 18, 2012

Το Δίλημμα του Φυλακισμένου (Prisoner’s Dilemma)


Κλασσικό παράδειγμα της Θεωρίας Παιγνίων (Game Theory) αποτελεί το Δίλημμα του Φυλακισμένου (Prisoners Dilemma, PD):

Δυο άτομα (Α & Β) συλλαμβάνονται ως ύποπτοι για ένα έγκλημα. Επειδή όμως η αστυνομία δεν έχει τα απαιτούμενα στοιχεία για να τους καταδικάσει, τους ανακρίνει σε ξεχωριστά δωμάτια, χωρίς δυνατότητα επικοινωνίας μεταξύ τους, και στον κάθε ένα κάνει την εξής πρόταση:
  •  Αν ο ένας καταθέσει εναντίον του άλλου (και ο άλλος δεν καταθέσει), τότε αυτός που θα καταθέσει θα αφεθει ελευθερος και ο άλλος θα καταδικαστεί σε φυλάκιση 10 χρόνων
  •  Αν δεν καταθέσει κανένας από τους δυο, τότε και οι δυο θα καταδικαστούν σε φυλάκιση 1 χρόνου, για άλλα μικρά αδικήματα για τα οποία η αστυνομία έχει αποδείξεις
  • Αν και οι δύο καταθέσουν ο ένας εναντίον του άλλου, τότε θα καταδικαστούν και οι δυο σε 5 χρόνια φυλάκισης, με το ελαφρυντικό της κατάθεσης

Τι θα κάνουν οι ύποπτοι?

Οι επιλογές τους μπορούν να συνοψιστούν στον παρακάτω πίνακα (οι αριθμοί αντιστοιχούν στα χρόνια φυλάκισης των Α,Β, δηλ 0,10 σημαίνει οτι ο 'Υποπτος Α θα αφεθεί ελεύθερος ενώ ο Β θα καταδικασθεί σε 10 χρόνια φυλάκιση, κ.ο.κ.):



Και τους δυο ύποπτους τους συμφέρει να μην καταθέσουν, έτσι ώστε να φυλακιστούν από 1 χρόνο, δηλ. να επιλέξουν (Δεν καταθέτει, Δεν καταθέτει) = (1,1).

Ο κάθε ένας όμως φοβάται, ότι αν δεν καταθέσει, μπορεί ο άλλος να καταθέσει, κι έτσι να καταδικαστεί σε 10 χρόνια φυλάκισης, δηλ. (Δεν καταθέτει, Καταθέτει) = (10,0) ή (Καταθέτει, Δεν Καταθέτει) = (0,10).
Έτσι και οι δυο επιλέγουν να καταθέσουν, οπότε η ποινή είναι 5 χρόνια φυλάκισης στον κάθε ένα, δηλ. (Καταθέτει, Καταθέτει) = (5,5)
Ενώ λοιπόν θα συνέφερε και τους δυο να συνεργαστούν και να φυλακιστούν από 1 χρόνο, ο φόβος του ενός έναντι του άλλου τους οδηγεί στο να μην συνεργαστούν και να καταλήξουν σε 5 χρόνια φυλάκισης ο κάθε ένας!

Η γενική περίπτωση του Διλήμματος του Φυλακισμένου εκφράζεται ως (όπου d > a > b > c):



Το Σημείο Ισορροπίας Nash ενός παιχνιδιού (Nash Equilibrium) ορίζεται σαν το σημείο εκείνο όπου κανείς από τους δυο παίκτες δεν μετανιώνει ποτέ για την επιλογή του, ότι και αν διάλεξε ο άλλος.

Το σημείο αυτό στο αριθμητικό παράδειγμα είναι το (Καταθέτει, Καταθέτει) = (5,5), και στο γενικό παράδειγμα είναι το (Καταθέτει, Καταθέτει) = (a,a).

Γιατί?

  • Αν ο Α δεν καταθέσει και ανακαλύψει ότι ο Β κατέθεσε, τότε ο Α μετανιώνει για την επιλογή του (φυλακίζεται 10 χρόνια ενώ αν είχε καταθέσει θα φυλακιζόταν μόνο 5 χρόνια). Θα ήθελε δηλ. εκ των υστέρων  να είχε κάνει διαφορετική επιλογή!
  • Αν ο Α καταθέσει, τότε δεν μετανιώνει ποτέ για την επιλογή του. Αν ανακαλύψει ότι και ο Β δεν κατέθεσε, τότε απελευθερώνεται. Αν ανακαλύψει ότι και ο Β κατέθεσε, τότε φυλακίζεται 5 χρόνια (και όχι 10 αν δεν είχε καταθέσει). Δηλ. δεν θα ήθελε εκ των υστέρων να έχει κάνει διαφορετική επιλογή σε καμία περίπτωση!

Έτσι η Ισορροπία Nash προβλέπει την τελική έκβαση ενός παιχνιδιού, και όχι την καλύτερη έκβαση

Στο παράδειγμα των φυλακισμένων η ισορροπία είναι (Καταθέτει, Καταθέτει) ενώ η καλύτερη έκβαση θα ήταν (Δεν καταθέτει, Δεν καταθέτει), η οποία όμως δεν αποτελεί ισορροπία!