En este capítulo de la serie presentaremos un juego introducido por primera vez por Robert Rosenthal: el juego del ciempiés.
La reglas del juego son las siguientes:
- Dos jugadores, Ana y Alberto, que además de jugar con espejos, rayos láser y pelotas superrápidas, también se dedican a los ciempiés en sus ratos libres.
- Empieza con dos montones de monedas de 1€. En el primer montón hay 2 monedas y en el segundo, 0 monedas (bueno, son montones pequeñitos, ya crecerán), y se ponen delante de Ana.
- En cada turno, el jugador tiene dos opciones:
- 1.- Puede quedarse con el montón grande y darle el pequeño al otro jugador.
- 2.- O puede pasar ambos montones al otro jugador y que empiece otra ronda.
- Cada vez que un jugador elige la opción 2, los montones crecen: 1 moneda en cada montón.
- Si el juego llega a los 100 turnos y nadie ha decidido nunca la opción 1, el juego termina y nadie gana nada.
Una pausa de unos minutos para que pienses qué harías tú si fueras uno de los jugadores.
.
.
.
Forma extensiva del juego
Este es un juego que no puede representarse mediante una matriz de pagos. La mejor manera de representar este juego es la forma extensiva.
No todos los juegos pueden representarse adecuadamente mediante la matriz de pagos: algunos es mejor representarlos mediante la forma extensiva. Para aclarar la definición, veamos el ejemplo de nuestro juego del ciempiés.
En cada nodo representamos con un icono si quien toma la decisión es Ana o Alberto. En un árbol más formal o con más jugadores suele indicarse con un círculo y un número indicando el número de jugador, pero aquí me gustaron más los muñequitos de colores. Nótese que en este juego Ana y Alberto se van alternando, pero en otros juegos podría ser que el mismo jugador deba tomar más de una decisión seguidas (aunque a menudo se puede agrupar eso en una especie de “nodo de multidecisión”, si realmente son decisiones consecutivas sin nada en medio).
Para ayudar en este juego, junto a cada nodo hemos anotado el estado de los montones de monedas.
Las salidas de cada nodo son el número de la decisión que toman (ver más arriba: 1 es repartir, 2 es pasar los dos montones al otro). En este juego es una decisión binaria, pero en otros juegos podría haber más de 2 decisiones posibles.
Las hojas son un array donde mostramos primero la recompensa para Ana y a continuación la recompensa para Alberto. Si hubiera más jugadores, tendríamos un elemento por jugador.
Así, si las decisiones fueran 221 (Ana pasa, Alberto pasa, Ana reparte), la recompensa sería 4,2 (Ana recibe 4€ y Alberto 2€).
Esta forma extensiva es muy apropiada para representar juegos deterministas y complejos, como por ejemplo el ajedrez. Existen formas teóricas de, dado el árbol completo, calcular cuál es la mejor decisión. De hecho, esto es lo que intentan hacer los jugadores artificiales de ajedrez: calculan todo el árbol de todas las posibles decisiones (mías y del oponente) a partir de la situación actual, y luego encuentran el mejor movimiento (veremos más sobre esto en futuros artículos). Decimos “intentan” porque la complejidad computacional de dicho cálculo está muy por delante de lo disponible hoy en día, de modo que los jugadores artificiales disponibles utilizan algoritmos heurísticos (se dice que un algoritmo es heurístico cuando no podemos demostrar que es óptimo, pero nos parece que es lo bastante bueno) para podar ramas completas del árbol y reducirlo a un problema abordable. Hoy en día parece ser que la calidad de un jugador artificial de ajedrez se define básicamente por la calidad de sus heurísticos.
¿Por qué se le llama a esto juego del ciempiés? Porque podemos hacer el dibujo de otra forma (nótese que es el mismo de antes, simplemente recolocándolo):
Si hubiéramos pintado los 100 turnos del juego, parecería un ciempiés con 100 patas. De hecho, en la mayoría de la literatura respecto a este juego, directamente lo pintan así. Nosotros hemos preferido mostrar ambos dibujos para que sirviera también de ejemplo genérico para ilustrar la forma extensiva.
Tradicionalmente se llama juego del ciempiés a todos los juegos que siguen esta estructura… aunque no tengan 100 turnos.
Resultado teórico
El resultado teórico óptimo puede encontrarse por inducción. Más adelante en la serie veremos que estamos aplicando una estrategia maximin, y la formalizaremos. De momento, hagámoslo de forma más o menos intuitiva.
Supongamos que se llega al turno 100. Los montones tienen 101 y 99 monedas respectivamente. Ese turno le tocaría jugar a Alberto. Si Alberto decide 2, los montones desaparecen, así que Alberto debe irremediablemente decidir 1. De ese modo, Ana se llevaría 99€ y Alberto se llevaría 101€.
Pero claro, antes del turno 100 se debe jugar el turno 99, en que es Ana quien decide. En el turno 99 los montones tienen 100 y 98 monedas respectivamente. Si Ana decide 1, obtendrá 100€ (y Alberto, por lo tanto, obtendrá 98€). En cambio, si decide 2, se llegará al turno 100… pero Ana ya sabe lo que Alberto hará en el turno 100, y sabe que ella recibirá 99€. Recapitulemos: puede decidir 1 (y llevarse 100€) o decidir 2 (y llevarse 99€). Así que nunca decidirá 2, sino que decidirá 1, quedándose con el montón grande.
Pero claro, antes del turno 99 se debe jugar el turno 98, en que es Alberto quien decide. En el turno 98 los montones tienen 99 y 97 monedas respectivamente. Si Alberto decide 1, obtendrá 99€ (y Ana obtendrá 97€). En cambio, si decide 2, se llegará al turno 99… pero Alberto ya sabe lo que Ana hará en el turno 99, y sabe que él recibirá 98€. Así que nunca decidirá 2, sino que decidirá 1, quedándose con el montón grande.
Pero claro, antes…
Y así llegamos hasta el turno 1, donde Ana siempre debe elegir 1, quedándose con 2€.
Resultado empírico
Pues no, no coincide mucho. Cuando se repite este juego se observa que raramente el primer jugador decide repartir en el primer turno. No solo eso, sino que el otro jugador tampoco suele repartir en el segundo turno. Y así sucesivamente. Hasta dónde se llegue dependen de muchos factores, como la cantidad inicial en los montones, la diferencia entre el montón grande y el pequeño, la cantidad y forma en que se incrementan, el número máximo de turnos, el número de jugadores,… pero en general menos del 10% de los jugadores deciden repartir en el primer turno (y solo pasan de ese 10% cuando la recompensa inicial es muy alta).
Se han buscado explicaciones para este resultado empírico contradictorio con el resultado teórico, pero no vamos a verlas en este artículo, sino en otros posteriores donde se verán aún más claras. También veremos en futuros artículos una situación real (y peligrosa) que puede estudiarse mediante este juego. Pero antes, dedicaremos otros artículos a dos o tres conceptos más.
Para que te vaya sirviendo para abrir boca, y que no creas que no vamos a tratarlo: si el resultado teórico y el empírico no coinciden, puede ser por dos cosas. Puede ser porque el resultado empírico esté mal (el experimento esté mal diseñado, estamos midiendo otra cosa sin saberlo, las condiciones de frontera no están bien,…) o bien es la teoría la que está mal (no tiene en cuenta todo lo que debe, las condiciones de frontera de las que parte no se pueden reproducir, las premisas eran falsas…). Veremos que puede haber un poco que cada.
The Teoría de juegos VII – Juego del ciempiés by , unless otherwise expressly stated, is licensed under a Creative Commons Attribution-Noncommercial-No Derivative Works 2.5 Spain License.
{ 25 } Comentarios
Aquí lo que falla es suponer que todo el mundo entiende y REALIZA el razonamiento inductivo a las primeras de cambio No he tenido yo problemas (y gordos) en explicar este tipo de razonamiento en alumnos de matemáticas e informática.
¿Podrías poner enlaces a los resultados empíricos? Y tampoco estarían mal algún ejemplo “real” de este juego porque no se me ocurre ninguno.
De todas formas muchas felicidades por la serie, me esta gustando un motón.
Cruzki,
veremos que la explicación de “es que no entienden el razonamiento” es una de las explicaciones… pero también veremos que no es satisfactoria del todo. Ya te voy adelantando que en este momento estoy escribiendo el artículo XXI de la serie y aún allí le seguimos dando vueltas a esta discrepancia teoría-experimento.
También veremos algún ejemplo real en el que podremos aplicar lo aprendido en el ciempiés.
Pero como son artículos que ya están escritos, con dibujitos y todo, me vas a permitir que no los cuente en este comentario sino dentro de unos cuantos artículos.
En la propia Wikipedia tienes algunas referencias a artículos con experimentos. Desgraciadamente, solo en inglés, no existe página española de eso. http://en.wikipedia.org/wiki/Centipede_game
No se me ha ocurrido cómo plantear el juego usando los comentarios para dejaros jugar a vosotros, así que he tenido que poner simplemente los resultados de otros. Algo que, desgraciadamente, ocurrirá mucho a lo largo de la serie, porque si son juegos para 2 jugadores me resulta difícil adaptarlos para que podáis jugar muchos lectores.
Bueno, como veo que no empieza nadie ya empiezo yo.
Me quedo los 2€ y no reparto, J se queda sin nada.
Ala, fin del juego
Llevo una temporada siguiendo la serie y solo puedo darte la enhorabuena J, lo estás poniendo todo realmente claro y me está sirviendo para recordar la teoría de juegos (poca) que aprendí en la universidad…
Una pequeña sugerencia, uno de los juegos / estrategias que podías analizar es la conocida como Martingala, que consiste en ir doblando apuestas mientras pierdes. Esta claro que no funciona, pero cuesta mucho explicarle a la gente el porqué, bien por falta de conocimientos como dice Cruzki, bien porque directamente piensan que les estás engañando…
Pues yo intentaría seguir hasta el turno 100 independientemente de si gano 98,99 o 100. Eso sí, buscaría que mi oponente supiera algo de teoría de juegos
@Brigo: No me extraña que hayas tenido problemas para explicar el “razonamiento” a tus alumnos. Yo, que hace lo menos treinta y tantos años que no soy alumno de ná, soy de los que no lo entiendo.
Mejor dicho, sí que entiendo el razonamiento, pero no lo entiendo. No me voy a explayar, para eso está nuestro profesor, J, pero lo que yo haría siempre es pasar, sin dudar y sin pensar, hasta el turno 100, y entonces, al que le toque, repartir. De esta manera, en el mejor de los casos, te llevas 101€, y en el peor, 99€. Aplicando el razonamiento inductivo perverso, efectivamente soy yo quien me llevo 2€ más que mi pobre oponente, pero… sólo me llevo 2. Y 99 es ligeramente mayor que 2. ¡Y 101, aún mayor!!
Creo que la duda puede venir por pensar que el objetivo del juego es ganar más dinero que tu oponente, en cuyo caso es obvio que debes repartir. Pero si de lo que se trata es de “desplumar a la banca”, y de paso, forrarse… yo lo tengo claro.
En fin, seguro que el artículo da origen a una larga y constructiva discusión… porque creo que J esta vez se ha salido, poniendo el típico ejemplo contraintuitivo que precisamente alienta las discusiones civilizadas al amor de la lumbre… eeeh, de la pantalla, quiero decir.
Creo que la clave la ha dado Macluskey: cuál es el objetivo del juego? Si es ganar más que el otro, obviamente no superaremos el primer turno, pero si es llevarse la mayor cantidad de dinero a casa parece obvio que llegaremos al último turno. No veo ninguna deficiencia empírica ni teórica, simplemente la contradicción se da en que el objetivo que explicas en el razonamiento inductivo parece ser llevarse más que el otro, y a las personas cuando se nos plantea el juego sin objetivo interpretamos que éste es llevarse la mayor cantidad de dinero.
Además has empezado el razonamiento desde arriba, desde el último turno. Si empezamos por abajo: si cojo en el primer turno me llevo 2 euros, pero si espero y mi compañero tambien me llevo 4. Mi compañero pensará: si cojo ahora me llevo 3, pero si espero y mi compañero pasa me llevo 5. Si no pasa? Tan sólo pierdo 1 euro, comparado con los 99 que puedo ganar si el pasa…Me sale a cuenta.
Muchos sabrán, o intuirán, que yo he escrito el artículo y Macluskey ha hecho la edición. Así que lo que voy a escribir, ya lo hemos discutido Macluskey y yo por email previamente. Explicito esto para que el que lea esta discusión entre él y yo sepa que no intentamos engañar, ni es una actuación; simplemente, aunque ya lo hemos discutido antes, creo que la mera discusión es interesante hacerla pública.
Donde digo Macluskey, puedo decir Andrés, que parece opinar lo mismo que Macluskey.
Si estuviéramos jugando Macluskey y yo (empieza él), y yo llegara al turno 100, repartiría. Yo me llevaría 101 y Macluskey 99. Hasta ahí, nada que objetar.
Pero ¿y si empiezo yo? Si empiezo yo, entonces el turno 100 lo jugará Macluskey (en cuyo caso él se llevaría 101 y yo 99). Pero no, yo no voy a dejarle. Porque yo voy a interrumpir en el 99, llevándome 100 (que él se lleve lo que sea, a mí no me importa, lo que me importa es que yo me llevo más si interrumpo en el 99 que si paso; mi objetivo no es ganar más que Macluskey, sino ganar yo más sin importarme lo que gane Macluskey).
Que después de eso cada uno induzca lo que quiera, que yo ya he escrito el artículo (aunque adelanto que daré otras interpretaciones en el futuro, incluso contradiciéndome a mí mismo).
Correcto. No se trata de discutir con J lo que ya hemos discutido largo y tendido por emilio… Se trata de introducir la discusión entre nuestros ávidos lectores…
Su turno, señoras y señores.
@MAC
Es que en ese caso estaríamos ante una estrategia cooperativa que, en principio, estaría prohivida por hipótesis, que no se si la ha escrito J pero si no he entendido yo mal la teoría de juegos es:
Los jugadores siempre van a jugar de forma racional itentando maxizar SU (ojo SU y solo SU) benefcio.
@J
a lo que me referia con un juego real no era a uno para jugar nosotros, sino algún tipo de situación real (subasta publica, venta de productos, supervivencia de la especie x, o algo por el estilo) que encajara con el “juego”.
@Cruzki: ¿He dicho Brigo en mi comentario anterior? Si es que estoy gagá… yo lo digo, y lo repito. Mis disculpas.
Dices que: “Los jugadores siempre van a jugar de forma racional itentando maxizar SU (ojo SU y solo SU) beneficio.“.
Pues eso es lo que hago yo con mi estrategia. No será racional, pero me llevo como poco 99 pavos, mientras que si soy racional me llevo 2. A eso le llamo yo “maximizar el beneficio”…
Genial serie, J.
Me vienen a la mente conceptos económicos que podrían influir: expectativas, costes de oportunidad, aversión al riesgo… No se si existen conceptos análogos en la teoría de juegos o si se podrían aplicar a este caso, pero estoy deseando descubrirlo.
@Macluskey Tu jugarías los cien turnos porque es una estrategia simple con beneficios casi máximos para ambos jugadores, pero qué harías si en un montón hubiese al final 100€ y en el otro 1.000.000€ ? ¿No pararías en el 99?
Cómo me está gustando esta serie… es tan ¿lógica? y a la vez irracional el comportamiento de los jugadores. Me encanta.
Me parece que Brigo ha dado en el clavo. Está claro que si “sólo” pierdes 2 euros te da lo mismo, pero ¿y si son “millones de euros” la unidad de medida? El valor de lo que pierdas parece determinante y la avaricia es un mal de la humanidad que juega en contra…
Cruzki: sí que veremos una situación real que podríamos atacar con el juego del ciempiés (aunque en mi opinión, no será suficiente; también la daré en ese momento). Pero será en el ¿capítulo XI?, porque antes quiero introducir un par de conceptos más.
Eagle, Brigo: me encanta que sigáis ese hilo de razonamiento. Ya adelanté que simplemente pensando un poco podéis llegar a conclusiones que yo contaré más adelante de un modo un pelín más formal. Solo un pelín, que al fin y al cabo estamos en El Cedazo y no queremos supeditar la utilidad al formalismo. Lo que no debéis pensar es que diciendo eso habéis desmontado el argumento de Macluskey… en realidad, ya lo veremos, ¡le estáis dando la razón! Solo que para ver eso hace falta darle un par de vueltas de tuerca más al razonamiento (unos 15 artículos dedicaremos a eso, ahí es nada). Si releéis el antepenúltimo párrafo después de estos dos comentarios, ahora tiene más sentido.
AntonioE: sí, esos conceptos influyen. Aunque utilizaremos otros nombres, vienen a ser eso. No en vano, muchísimos teóricos de juegos eran en realidad economistas. Acuérdate de enviar otro mensaje recordándolo cuando lleguemos a eso.
Se me ha adelantado J. Así que no digo nada más.
Y, claro, si en un montón hubiera 1.000.000€ y en otro 100€… pues sería otro juego. Reglas diferentes, estrategias diferentes…
Glup, me callo, qye me parece que me estoy adelantando.
A mí lo que me parece clave para el comportamiento en el juego es de dónde viene el dinero. Quiero decir, si el dinero lo van poniendo por igual los jugadores e sus bolsillos en los montones, o lo pone “la banca”. Si es lo primero, claro que interesa cortar el juego cuando antes… pero en el 2nd caso (que creo que es del que estamos hablando), los jugadores sólo pueden obtener beneficio, y lo lógico es incrementar ese beneficio lo máximo posible, más cuando no incurre en pérdida para ninguno de los jugadores, en ningún caso.
ataraxia: el dinero viene de la nada. Llámalo la banca, si prefieres. Al principio utilicé ese término pero luego lo quité para que el lector no pensara que existía un tercer jugador que era el banco.
Si quieres una explicación económica, tienes que buscarla en el valor percibido de las cosas. Pero como eso también está ya escrito y planificado para dentro de 2 o 3 artículos, lo dejo aquí.
(jo, llevo 4 comentarios en este post y en todos he dicho “ya lo veremos”)
J: En ese caso, yo opino igual que Macluskey…
Estas estudiando la teoría de juegos desde un punto muy “informático y racional”.
Hay una tercera que puede hacer que la teoría (formalmente) esté bien, que el resultado empirico esté bien y que sin embargo no obtengas el resultado empírico.
Creo que se conoce con un nombre similar al “umbral de sucesos”.
El ser humano tiene (por evolución) una capacidad para “considerar relevantes” determinados eventos.
Aquellos eventos que se situan mas allá del unbral de sucesos se descartan.
En cuestiones temporales, hemos evolucionado para contemplar sucesos (y planificar nuestras vidas) a mas o menso un año vista, esto se cree que es así por que los años tienen 4 estaciones y por lo tanto para sobrevivir en invierno era necesario plantar en primavera y cosechar env erano suficiente para todo el año.
Pero rara vez las sociedades acumulaban alimentos para mas de un año vista.
A nosotros nos pasa igual, cuando contratamos una hipoteca, la percepción del solicitante es que su situación económica es “estable” si tiene asegurado un sueldo para mas de un año de duración, aunque en realidad no lo sea.
Igualmente ocurre con las iteraciones, aunque el umbral de sucesos varía mas en cuestiones matemáticas que enlas temporales.
Si me explican un juego y requiere de mas de ¿10? iteraciones ver que es un “mal negocio” lo normal es que el ser humano pique.
te voy a proponer un juego mas sencillo que el del cienpies pero qeu la idea es la misma:
Un día se te aparece un tipo y te dice que te vende una lámpara de 3 deseos que se te van a conceder seguro seguro por 100.000€ no tienes de que preocuparte proq ue tu primer deseo puede ser recuperar los 100.000€ sin problemas.
las únicas condiciones son que: antes de qeu acabe el día siguiente tienes que encontrar a un comprador que compre la lampara por un precio menor del que pagaste en la misma moneda sin usar fracciones o si no sufriras lo indecible(para que extendernos en detalles escabrosos).
Pero no tienes de que preocuparte pro que seguro qe encuentras a alguien que la compre por 99.999€… ¿o no?
(spoiler mas adelante) . . . . . . . . . . . . . . . . . . . . . .. . . . . . . .. . . . . ..
Te aseguro que si que lo encontrarás.
Sin embargo… ¿alguien la compraría por 1€? esta claroq eu no, por que no podría venderlo.
¿Alguienla compraría por 2? está claroq ue no por que nadie lo compraría por 1 así qeu el que la compre por 2 no podría venderla.
¿alguien la compraría por 3? Esta claroq ue no por que nadie la compraría por 2 así que no podría venderla.
¿Alguien la compraría por 4?
etc etc
¿alguien la compraría por 50? Si, por que ya has pasado el umbral de sucesos de la mayoría de los humanos, así que habrá gente que considere que podrá venderla por 49, aunque le demuestres la infalibilidad del sistema.
Por supuesto al final el marron se lo come el que tenga el umbral de sucesos mas bajo.
Ese tipo muere, y la evolución sigue su curso con una población mas preparada geneticamente para sobrevivir a una invasión de lámparas de deseos.
javier: aunque obviamente era “inconscientemente consciente” de ese efecto, nunca lo había leído como tú lo has planteado, en términos evolutivos. Muy interesante. Eso explica por qué “es seguro invertir en ladrillo, porque siempre sube” o “las pensiones no necesitan ser arregladas, están bien como están” o nos cuesta tanto invertir en nuestra propia educación cuando somos jóvenes.
La clave es la siguiente: Un jugador que es “RACIONAL” y ocupa la LÓGICA, NUNCA va a violar la siguiente LEY:
No se le debe regalar NUNCA al contrincante una jugada o una oportunidad para que tome ventaja y se coloque en una posición superior a la mía, y a la vez quedándome yo en una posición inferior a la anterior, eso es una ley de la LÓGICA y no se puede romper para las personas racionales.
Es importante decir que estas personas racionales piensan que todos son racionales.
Si yo tuviese que jugar con alguien, pues pasaría el turno a mi amigo. Si mi objetivo no es ganar y simplemente participar indiferente del resultado del juego, dejaré pasar el turno. Así, si es el otro jugador quien decide quedarse con el dinero, al menos habré obtenido 3 euros y no 2.
También considero que una opción válida es obtener un beneficio, independiente si mi adversario es quien obtiene mayor dinero. Ambos jugadores pueden pensar igual y entonces terminar la jugada antes de la 100.
Soy Estudiante De Licenciatura en Matemáticas, mi proyecto de investigación va encaminado a crear escenarios didácticos en los que pueda compartir nociones básica de la teoría de juegos con mis estudiantes y hacer un estudio del resultado de dichas actividades. Estuve Leyendo varios de sus artículos y son geniales. Quisiera compartir los resultados con usted una vez termine la investigación.
Andres D. Anaya,
me alegro de que te gusten, verás que en esta serie hemos intentado hacer algo parecido con nuestros lectores.
La mejor forma de contactar conmigo es a través de Pedro. En el menú superior verás un enlace que apunta a El Tamiz, y allí uno que dice “Contacto”. Pedro puedo ponernos en contacto a través de ese enlace.
Un saludo,
{ 1 } Trackback
[...] 2010 Teoría de juegos VII – Juego del ciempiés, de Javier “J” Sedano, que pode lerse en El Cedazo. Toda a serie Teoría de juegos está publicada en forma de libro, dispoñible [...]
Escribe un comentario