Regístrate | Conectar
El Tamiz Libros Recursos Series Únete 8 Users Online
Skip to content

Teoría de juegos XXI – Juego del ciempiés en estrategias mixtas




Un ciempiés mixto (Image*After)

El juego del ciempiés es uno de los que más cancha nos ha dado a lo largo de la serie, así que vamos a dedicarle  un artículo completo a estudiarlo desde la nueva perspectiva de las estrategias mixtas.

Este será un artículo relativamente cortito, que ya estuvo a punto de ser incluido en el último sobre los tenistas (aunque cuando me pongo a escribir…), y en el que no incluiremos conceptos nuevos. Solo le daremos vueltas a lo que ya sabemos. Pero requiere manejar probabilidades y darle al razonamiento una vuelta de tuerca que quizá no es fácil de hacer, y por eso al final hemos preferido dejarlo, y que tenga su propio artículo.

Seguiremos deduciendo sobre las reglas que ya vimos en la descripción del juego, así que, si no lo tienes fresco, dedica unos minutos a repasarlo, aunque sea por encima.

En aquel artículo buscamos una solución teórica al juego, buscando qué era lo que Ana debía hacer, y nos salía que debía Interrumpir en el primer turno (en realidad, podríamos extrapolarlo a decidir que cualquier jugador, cuando le llegue el turno, debe Interrumpir).

Pero parecía que los experimentos no acompañaban esa deducción teórica e intentamos decir “claro, es que los jugadores empíricos son irracionales“… pero aquello no encajaba. No encajaba porque nos dimos cuenta de que los jugadores irracionales en realidad ganaban más que nuestros jugadores teóricamente óptimos.

Así que lo intentamos bajo la hipótesis de hombre social. Aunque a algunos esa aproximación les sirve, algunos otros nos quedábamos con el sabor agridulce de que aquello tampoco terminaba de explicarlo del todo, como si se inventara un concepto nuevo para poder explicarlo.

Pero ya hemos aprendido un montón desde entonces. Ahora sabemos que aquella “solución teórica” estaba aplicando una estrategia maximin, que era conservadora.

Así que vamos a estudiarlo desde el punto de vista de las estrategias mixtas. Al final, acabaremos viendo cómo incluso quien no exhibe comportamiento social puede querer colaborar para maximizar su beneficio (lo que llamábamos hombre superracional), difuminando la frontera entre el hombre social y el hombre egoísta.

Recordemos por un momento la forma extensiva del juego:

Plantear una fórmula general es difícil, así que vamos a ponernos en un caso particular y a confiar en que, una vez estudiado, tu mente hará ella sola la inducción y verás obvio el caso general. Al final alguien podría decir “pues claro, eso ya lo decía yo hace cuatro meses, ¿y para eso tanto artículo?“. Pero por el camino habremos pensado en ello, y quizá algún otro día podamos aplicar el mismo razonamiento a un caso más real en que la solución no esté tan clara como en el ciempiés.

Estamos en el turno 3 y Ana tiene que elegir qué hacer. Para ello vamos a ir dos pasos hacia el futuro, buscando cuáles serían las decisiones en los pasos 4 y 5, y luego a retroceder (cuando lleguemos al final de la explicación habrás entendido por qué avanzamos dos pasos).

Llamaremos pn a la probabilidad de Interrumpir en el paso n. Y consecuentemente 1-pn es la probabilidad de Continuar en el paso n. Por si acaso alguien no lo tiene claro, en los n pares quien decide es Alberto y en los n impares decide Ana.

La mejor elección de p3 para Ana (es decir, con cuanta probabilidad debe Interrumpir) depende del valor de p4. Si Alberto fuera a Interrumpir con seguridad en el turno 4 (es decir, p4=1), entonces a Ana le convendría Interrumpir ya. Eso es lo que ya vimos en artículos anteriores.

Pero, ¿y si p4 no es 1? Si p4 no es 1 entonces Interrumpir ya no es necesariamente la mejor opción de Ana en el turno 3. Y… ¿por qué podría p4 no ser 1? Dicho de otro modo: ¿por qué podría Alberto no querer Interrumpir indefectiblemente? Pues Alberto no querría hacerlo si p5 no fuera 1. Así que ahora retrocedemos y vamos calculando esperanzas (medias) en el camino hacia atrás.

Si Alberto decide Interrumpir en el turno 4, su pago es 5. ¿Y si decide Continuar? Depende de p5. En el peor de los casos será 4 (si Ana decide Interrumpir en el turno 5)… pero podría ser más. Cuanto más pequeño sea p5, mayor será su pago. ¿Entendido hasta aquí?

Así que Alberto en el turno 4 puede elegir entre:

  • Interrumpir y cobrar 5.
  • Continuar y cobrar algo, que será más grande cuanto menor sea p5.

Decimos que Alberto está usando una estrategia mixta, así que no buscamos una decisión concreta, sino un valor para p4. Y dado que el pago esperado en caso de Continuar en el turno 4 depende de p5, es obvio que el p4 óptimo depende del valor de p5. Y además, lo hacen en relación directa: cuanto menor sea p5, menor es el p4 óptimo.

Reléelo si lo necesitas.

Bueno, pues ahora damos un paso más hacia atrás, y hacemos de nuevo el mismo razonamiento. En el turno 3 Ana puede elegir entre:

  • Interrumpir, y cobrar 4.
  • Continuar, y cobrar algo que será más grande cuanto menor sea p4.

De nuevo, el p3 óptimo depende de p4. Cuanto menor sea p4, menor es el p5 óptimo. Recuerda que pn es la probabilidad de Interrumpir en el paso n.

Atentos a lo que hemos dicho: el p3 óptimo depende directamente de p4, cuyo óptimo a su vez depende directamente de p5. Recordemos que en los turnos impares decide Ana y en los pares decide Alberto. Así que ahora traduzcamos esto a roman paladino: la decisión óptima de Ana en el turno 3 depende de la decisión que ella misma va a tomar en el turno 5. Mejor dicho: en realidad depende de lo que Alberto cree que Ana va a decidir en el turno 5. Mejor dicho aún: en realidad depende de la probabilidad que Alberto cree que Ana utilizará en el turno 5 para tomar su decisión.

Claro, ahora el problema es encontrar los valores de pn para n entre 1 y 100.

Vale, el de n=100 ya lo tenemos claro, porque en el turno 100 Interrumpiremos sí o sí. Y eso quiere decir que en el 99 también, porque sería estúpido dejar llegar al 100 y ganar menos. Pero claro, eso implica que el del turno 98 también está claro… ¿sigo? Esto fue lo que hicimos en el primer artículo del ciempiés y acabamos diciendo que siempre había que Interrumpir…

Pues bien, ya hemos visto que pn no es 1 para todos los valores de n. No sabemos por qué, pero sabemos que no lo es. Tampoco sabemos dónde deja de ser 1 para ser algo menor, ni cuánto menor es.

Fijaos en que lo importante aquí no es que cada jugador conozca sus probabilidades, sino las de los demás. ¿Y cómo lo sabe? Si es una decisión política, puede basarse en encuestas de intención de voto. Si es una decisión comercial, en análisis de mercado. Si es su vida cotidiana, se basará en su experiencia. Si es una cuestión genética, estará implícita en el propio mecanismo de la evolución. Etcétera.

Parece que quienes jugamos al ciempiés, aun sabiendo que en el turno 100 la probabilidad es 1, también sabemos, en base a nuestra experiencia, que en turnos anteriores la probabilidad no es 1… y por eso jugamos unos cuantos turnos. Si están compitiendo jugadores muy confiados ambos, es probable que lleguen por ejemplo hasta el turno 80, mientras que si están compitiendo jugadores más desconfiados probablemente no pasarán del 10…

Se trata de una especie de profecía autocumplida: si todos creemos que lo mejor es Interrumpir cuanto antes, entonces es verdad que lo mejor es Interrumpir cuanto antes. En cambio, si todos creemos que es mejor Continuar lo máximo posible, entonces lo mejor es Continuar lo máximo posible. Una profecía autocumplida.

Y este es el motivo de que unos actores y otros hagan tanto hincapié en la confianza. Imaginad que en vez de un juego fueran el comercio, las pensiones o la bolsa: la mejor decisión de un jugador depende de la probabilidad de Interrumpir del otro jugador (o jugadores). Es por eso por lo que el gobierno o las empresas a menudo se empeñan en transmitir confianza en el sistema. En caso de que esa confianza se vea debilitada porque los ciudadanos, consumidores o accionistas teman una Interrupción en el futuro, entonces serán ellos los que Interrumpan ahora, autocumpliendo la profecía.

Ya hemos visto un caso real, el de las pensiones, en que aplicábamos en realidad esta misma aproximación. Si no lo recuerdas, reléelo después de haber terminado este.

Lo mismo aplica al juego de la confianza, que también hemos visto (y que decíamos que podía asimilarse con facilidad al comercio): si el juego no acaba nunca, ya no es cierto que haya un turno en que la probabilidad de Interrumpir sea indefectiblemente 1. Es más: lo mejor será que la probabilidad sea indefectiblemente 0. Reléelo también, si no lo tienes fresco, porque ahora lo entenderás con otra cabeza.

Ya en su momento vimos los conceptos de “hombre social” y de “hombre superracional”, y vimos cómo la distinción entre ambos es difusa… pues quizá este artículo nos haya permitido ver cómo, aunque el resultado de ambas hipótesis, la social y la superracional, es el mismo, quizá cada una hace énfasis en cosas distintas. De hecho, para muchos autores la distinción no es que sea difusa: es que no existe. Ya hemos visto cómo el comportamiento que parecía social era en realidad un comportamiento egoísta en un nivel superior (aquí lo llamaríamos superracional). Por ejemplo, la Wikipedia inglesa, en su artículo sobre la superracionalidad hace referencia a la colaboración en el dilema del prisionero, cuando nosotros hemos visto que el egoísmo en él lleva evolutivamente a la cooperación, y por lo tanto quizá la superracionalidad no es necesaria… o quizá lo que no es necesario es el concepto de hombre social… o ninguno de ellos… en fin… tratamos de dar toda la explicación y que cada lector saque su conclusión.

 


Sobre el autor:

J ( )

 

{ 1 } Comentarios

  1. Gravatar SlowBait | 28/02/2011 at 12:00 | Permalink

    ¿Un buen libro de teoría de juegos? No importa que sea técnico, pero preferiría que fuera introductorio.

    Gracias

{ 1 } Trackback

  1. [...] XXI – Juego del ciempiés en estrategias mixtas, de Javier “J” Sedano, que pode lerse en El Cedazo. Toda a serie Teoría de juegos está publicada en forma de libro, [...]

Escribe un comentario

Tu dirección de correo no es mostrada. Los campos requeridos están marcados *

Al escribir un comentario aquí nos otorgas el permiso irrevocable de reproducir tus palabras y tu nombre/sitio web como atribución.