viernes, 1 de febrero de 2013

Tit for tat


El Toma y daca (Tit for tat en su expresión original en inglés) es una estrategia óptima en teoría de juegos para el dilema del prisionero iterado.
Robert Axelrod organizó un concurso para encontrar una estrategia válida para el dilema del prisionero iterado. Se jugaría un torneo con 200 rondas por partida, y el programa con mayor puntuación sería el ganador.
Entre los 14 participantes, Anatol Rapoport presentó un programa que consistía en 4 líneas en BASIC, y al que llamó Toma y daca. Sólo tenía dos reglas:
  1. Comenzar colaborando
  2. Hacer lo que tu oponente hizo la ronda anterior
Era la más sencilla de todas las estrategias presentadas, y fue la que obtuvo la puntuación más alta.
Después de la publicación de los resultados, se organizó un segundo torneo, en el que el número de rondas a jugar por partida sería aleatorio (para no crear una ronda especial, la final, en la que se favorece la deserción). A esta competición se presentaron 62 participantes, entre ellos el mismo Toma y daca. De nuevo, obtuvo la mayor puntuación.

El dilema del prisionero.

El Dilema del Prisionero (Prisoner's dilemma) es un modelo de conflictos muy frecuentes en la sociedad que ha sido profundamente estudiado por la Teoría de Juegos.
Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos.  El alguacil sospecha que han participado en el robo del banco, delito cuya pena es diez años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito menor, tenencia ilícita de armas, cuyo castigo es de dos años de cárcel.  Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco.
Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos. La estrategia "lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero. Llamaremos "traición" a la estrategia alternativa.