Regístrate | Conectar
El Tamiz Libros Recursos Series Únete 11 Users Online
Skip to content

Teoría de juegos XXIV – La guerra de sexos (y II)




En el último artículo nos quedamos con las ganas de ver cómo se solucionaba la guerra de sexos entre Ana y Alberto… bien, vamos a ello.

Comenzamos recordando la matriz de pagos que habíamos propuesto:

Ana
Gusta Odia
Alberto Gusta 1,1 3,2
Odia 2,3 0,0

Si no tienes fresco aquel primer artículo, conviene que lo refresques.

Solución Maximin

Si ambos jugadores aplican una estrategia Maximin, Alberto elegirá Tenis y Ana elegirá Discoteca. No vamos a contar cómo hemos llegado a esa conclusión, porque la estrategia Maximin ya la hemos contado antes. Si alguien quiere resolverlo como ejercicio en los comentarios, bienvenido sea. Y si no, que cada uno se lo resuelva en su cabeza.

El caso es que ambos cobran 1, por lo que no parece una solución muy buena, ¿no? Bueno, ya dijimos que Maximin era una estrategia conservadora…

Además, es una situación inestable: cualquiera de los dos mejora si cambia su decisión.

Equilibrio de Nash en estrategias puras

En este juego existen dos equilibrios de Nash en estrategias puras: Tenis/Tenis y Discoteca/Discoteca. De nuevo, si no tienes claro por qué esos son equilibrios de Nash, revisa el artículo correspondiente y resuélvelo como ejercicio en los comentarios si quieres.

Por un lado, cada uno de los equilibrios de Nash es “injusto”, en el sentido de que uno de los jugadores gana más que el otro. Así que si Ana tiene la mala suerte de caer en el equilibrio Tenis/Tenis, ella siempre ganará 2… Alberto estará contentísimo, pero Ana… siempre le quedará el reconcome de que no sale ganando tanto como ella querría.

Por otro lado, son… ¿cómo llamarlo?… “equilibrios inestables”… en el sentido de que si uno de los jugadores, incluso en contra de su interés, cambia, el otro está “obligado” a cambiar también.

Ejemplo: están en Tenis/Tenis (cobrando 3/2). Ana decide “tirarse un farol” y pasar a Tenis/Discoteca (cobrando 1/1) incluso en contra de su propio interés. Si Ana sostiene su farol, la mejor solución para Alberto es pasar a Discoteca/Discoteca (pasando a cobrar 2/3). Pero claro, entonces puede ser Alberto el que se “tire el farol”, pasando a Tenis/Discoteca. ¿Qué hará Ana?

¿Cuál es el riesgo entonces? Que ambos se “tiren el farol” y sostengan el estado Tenis/Discoteca (cobrando 1/1).

Equilibrio de Nash en estrategias mixtas

Como ya hemos avanzado mucho en la serie, sabemos que una alternativa es usar estrategias mixtas. Si intentamos un método del gradiente como hicimos en el juego de los tenistas, veremos que no se alcanza una solución. Esto es algo que podíamos haber deducido, ya que tanto Tenis/Discoteca como Discoteca/Tenis son dos pozos de la curva, y ambos son igual de profundos.[1] Si intentamos aplicar un método de gradiente en una curva que tiene dos pozos, y ambos iguales… a veces caeremos en uno, otras en otro, otras veces iremos saltando… Si recordáis el artículo de los tenistas, metíamos “ruido” para provocar saltos en la bolita que eventualmente nos sacaran de un mínimo local y nos llevaran a un mínimo global; pues bien, podemos asimilar ese ruido a los “faroles” que se tiran uno y otro para obligar a cambiar. Solo que aquí no existe uno de los mínimos que sea local y el otro global: ambos mínimos son igual de importantes. En resumen, ese procedimiento no nos lleva a ningún lado nuevo.

Esto no debería sorprendernos, ya que las estrategias puras no son sino un caso particular de las mixtas.

Así que, ¿cómo descubrimos el otro equilibrio de estrategias mixtas? Mejor dicho, ¿existe algún otro equilibrio en estrategias mixtas? Pues sí, existe.

En este punto, voy a hacer un poco de trampa. Primero voy a presentarte resultados numéricos, para que veas de manera obvia que ese equilibrio existe, y luego vamos a utilizar ese conocimiento para resolverlo analíticamente.

Hemos hecho unas hojas de cálculo con la esperanza de pago según la probabilidad de uno y otro de elegir lo que le Gusta. Nótese que son dos hojas, una para el pago que recibe Alberto y otra para el pago que recibe Ana:

Hay una columna del pago de Alberto que nos resulta curiosa, y por eso la hemos resaltado en verde. Resulta que, para cualquier una estrategia mixta de Ana, Alberto recibe el mismo pago (1,50) independientemente de la probabilidad con que él elija. Curioso, ¿no? Evidentemente, dado que el juego es simétrico, ocurre lo mismo con una de las filas del pago de Ana.

Tomaos un minuto para volver a mirar esas tablas, porque es fácil no darse cuenta del siguiente detalle: cuando está decidiendo Alberto, la tabla que debemos mirar es la de Alberto; y cuando esté decidiendo Ana, la de Ana. Por lo tanto, en la primera tabla, la de Alberto, siempre nos moveremos en vertical, hacia arriba o hacia abajo. Consecuentemente, en la segunda tabla, la de Ana, siempre nos moveremos en horizontal.

Así que, si por el motivo que fuera, Alberto hubiera usado una estrategia 0,75 y Ana hubiera usado una estrategia 0,75, estaríamos en la posición 0,75/0,75, y el pago sería 1,50 para cada uno. Si Alberto se moviera, en vertical, modificando su estrategia mixta… ¿mejoraría su pago? No, seguiría siendo 1,50. ¿Y si se moviera Ana en horizontal en su tabla? Lo mismo, sigue cobrando 1,50. ¡Justo eso es la definición de equilibrio de Nash![2] ¡0,75/0,75 es un equilibrio de Nash!

Y… Uhm… qué casualidad… ambos valores coinciden, son el mismo número, 0,75… ¿será casualidad? Pues no, no es casualidad. Esto es lo que se llama equilibrio simétrico, y se demuestra que todo juego simétrico tiene un equilibrio simétrico en estrategias mixtas.[3]

¿Cómo encontramos ese punto analíticamente? Una vez vistas las tablas, es fácil. Solo tenemos que darnos cuenta de que, por ejemplo para Ana, cuando estamos por encima de la línea verde, sus pagos crecen cuando se mueve hacia la derecha; y cuando estamos por debajo de la línea verde, sus pagos crecen cuando nos movemos hacia la izquierda. Una vez más, el concepto de derivada, que ya hemos usado antes.

Si existen filas donde la derivada es positiva, y filas donde la derivada es negativa, existe necesariamente una fila donde la derivada es nula (que es justo lo que estamos buscando).

Así que podemos llamar PanaG a la probabilidad de que Ana elija lo que le Gusta (y análogamente definimos PalbG). Luego calculamos la esperanza del pago para Ana de la siguiente manera:

Eana(PanaG, PalbG) = 1·PalbG·PanaG + 2·PalbG·(1-PanaG) + 3·(1-PalbG)·PanaG

Podemos calcular su derivada respecto a PanaG:

Eana’(PanaG, PalbG) = 1·PalbG -2·PalbG + 3 – 3·PalbG

Sabemos que en la línea verde, esa derivada es 0, así que igualamos a 0, resolvemos la ecuación y nos sale:

PalbG=0,75

Análogo procedimiento podemos hacer, con Ealb(PalbG, PanaG) para obtener la columna verde de la primera tabla.

En el caso general, en que los pagos sean:

Ana
Gusta Odia
Alberto Gusta C,C A,D
Odia D,A B,B

la fórmula del punto de equilibrio es \frac{(A-B)}{(A+D-B-C)}

¿Es un buen equilibrio? Pues no, no mucho. Podemos fijarnos en los otros dos equilibrios, los de estrategias puras, que parece que no nos gustaban porque uno ganaba menos que el otro; vemos que en aquellos, incluso el que menos gana de los dos, gana 2 (y el otro gana 3). Y en este otro equilibrio, ambos ganan 1,5…

¿Y eso como es posible? Es posible, porque en los otros dos casos (Gusta/Odia y Odia/Gusta), siempre elegían lo mismo. Es verdad que uno de ellos no ganará tanto como podía, pero bueno. En cambio, en este caso, ambos eligen al azar, con un 75% de probabilidades de elegir lo que a ellos les gusta. Eso conlleva que algunas veces (con un probabilidad nada desdeñable) elegirán Gusta/Gusta o incluso Odia/Odia, lo que hace bajar mucho la media. Es lo que se llama un equilibrio ineficiente. Ni siquiera es que uno gane más y otro menos que antes, es que ambos ganan menos que antes.

Pero es que además, si los otros equilibrios nos parecían inestables, porque alguien podría intentar tirarse un farol… aquí es más inestable aún. Basta con que uno de ellos se desvíe mínimamente del 0,75 para que la tendencia natural sea a incrementar aún más esa desviación, acabando una vez más en Gusta/Odia u Odia/Gusta (dependiendo de hacia dónde fuera la desviación inicial). Un ejemplo: si en lugar de 0,75/0,75 están en 0,80/0,75, el pago es 1,50/1,45. Pero ahora Ana ya sale ganando si reduce su PanaG, así que lo reducirá hasta llegar a PanaG=0 (que es con lo que más gana ella, en concreto 1,60) y entonces Alberto aumentará su PalbG hasta llegar a 1. Es decir, la estrategia pura Gusta/Odia.

Por si alguien se lo estaba preguntando, este es el motivo de que el método del gradiente no encuentre este equilibrio: a menos que estemos exactamente en 0,75/0,75, el gradiente tenderá a alejarse, no a acercarse. Es porque es un equilibrio que no está en un máximo, sino en un punto arbitrario.

A lo largo de la serie algún lector ha confundido, probablemente por la forma en que hemos ido explicado las cosas, la idea de que un punto sea equilibrio de Nash con el hecho de que sea la mejor estrategia. A menudo es verdad que los equilibrios son la mejor estrategia (al menos para alguna de las definiciones de “mejor”), como por ejemplo en Piedra-Papel-Tijera… pero no siempre. Como demostración trivial, en este caso tenemos 3 equilibrios posibles y no pueden ser todos a la vez la mejor estrategia; luego no puede ser cierto que el equilibrio de Nash sea la mejor estrategia.

Estrategia mixta máxima

Aún podemos mejorar. Ana y Alberto pueden saber mucho de teoría de juegos y saber que, como hemos visto más arriba, todo juego simétrico tiene un equilibrio simétrico en estrategias mixtas. Así que podrían autolimitarse a buscar estrategias simétricas. Es decir, estrategias en que PalbG = PanaG. Llamemos a eso P, para abreviar.

Es decir, nos estaríamos moviendo por la diagonal de las dos tablas que veíamos antes, y dado que el juego es simétrico, esa diagonal es la misma para ambas tablas. O dicho de otro modo: podemos reducir esas funciones, que eran de dos dimensiones y con resultado compuesto por dos valores,[4] a una función de una sola dimensión y con un único resultado que aplica a ambos, Alberto y Ana:

E(P) = P·P·1+ P·(1-P)·3 + (1-P)·P·2 + (1-P)·(1-P)·0 = -4P2+5P

Podemos dibujar esta curva, que tiene la siguiente forma:

Si queremos encontrar analíticamente el máximo, podemos simplemente derivar e igualar a 0, como hacíamos cuando estábamos en el cole, y encontraremos que el máximo es para P=5/8=0,625, que nos da una esperanza de 1,56.

No olvidemos que el juego es simétrico y nos estamos moviendo por la diagonal, así que ambos deben elegir lo que les gusta con probabilidad 0,625 y obtendrán un pago esperado de 1,56.

Fijaos en esto: si uno de los dos cediera, y siempre hiciera lo que quiere el otro, obtendría un pago de 2 (y además su pareja obtendrá un pago de 3). Pero si ambos aplican la máxima estrategia mixta simétrica, ambos cobran 1,56 de media. Algo hemos ganado respecto al equilibrio del 0,75/0,75 de antes, pero no mucho. Y además, si aquel era un equilibrio inestable y eso nos molestaba… es que este no es ni siquiera equilibrio.

Cooperación

¿Aún te extraña que llevemos intentando resolver esta guerra de sexos desde que aprendimos a caminar erguidos?

Menos mal que la reproducción es un fuerte incentivo para llegar a un entendimiento, que si no…

A pesar de que dijimos inicialmente que el juego no permite la coordinación previa a la decisión, no te sorprenderá si decimos que la única solución satisfactoria es romper las reglas y negociar ir la mitad de las veces a cada sitio coordinadamente.[5]

Genéricamente, se llama a eso un juego de coordinación. El juego de coordinación clásico y paradigmático es la elección del sentido de la conducción (por ejemplo, en España estamos acostumbrados a conducir por la derecha, mientras que en Reino Unido conducen por la izquierda). Dos conductores puede decidir ir cada uno de ellos por la derecha o por la izquierda:

Conductor B
Izquierda Derecha
Conductor A Izquierda 0,0 -100,-100
Derecha -100,-100 0,0

Si ambos coinciden en la elección, todo perfecto. Si no coinciden, acaban chocando.

Existen 3 equilibrios en este juego: los dos de estrategias puras I/I y D/D y otro de estrategia mixta en el que los conductores eligen con un 50%. Este último es obviamente peor que los otros dos, pero en realidad no hay, desde este punto de vista, nada que diga que I/I o D/D sea mejor uno que otro, así que la Ley determina una forma arbitrariamente y listo.

¿Qué sería el equivalente a la Ley en nuestro ejemplo de la guerra de sexos? Pues la propia evolución. Ya lo hemos visto cuando estudiamos los algoritmos genéticos en el dilema del prisionero iterado. Si no cooperamos, difícilmente sobreviviremos como especie… o dicho de otro modo: “la reproducción es un fuerte incentivo para llegar a un entendimiento” (eso ya lo he dicho, ¿no?)… ¿o hay alguna otra solución?

Calzonazos

Como decía un amigo, parafraseando un refrán sobre moteros: “solo hay dos tipos de hombres y nada más que dos: los que saben que son unos calzonazos y los que no lo saben”.

Me vais a permitir este toque de humor sexista (aunque no sé si machista o feminista) para explicar la modificación más habitual al juego: uno de los jugadores rompe la simetría. Si uno de ellos en realidad prefiere su actividad más que la compañía del otro, la matriz puede parecerse a esta otra:

Ana
Tenis Discoteca
Alberto Tenis 3,1 1,2
Discoteca 0,0 2,3

Es decir, Ana sí que quiere ir con Alberto… pero le Gusta más ir a la Discoteca, aunque sea sola, que ir al Tenis, aunque sea con Alberto.

Ahora el juego ya no es simétrico, y el único equilibrio en estrategias puras es Discoteca/Discoteca.

Si acaso estuvieran en Tenis/Tenis, Ana cambiaría a Discoteca, pero no por “tirarse un farol” como veíamos antes, sino porque realmente ella sale ganando, así que no tiene ningún incentivo para volver al Tenis, y Alberto acabará cediendo y cambiando también a Discoteca. Y a Alberto no le vale de nada “tirarse un farol”, porque si vuelve a Tenis/Discoteca, Ana jamás cambiará a Tenis/Tenis.

Cuidado: que sea el único equilibrio en estrategias puras no quiere decir que sea el único equilibrio.

Puede existir otro equilibrio en estrategias mixtas, porque no todos los posibles valores de la asimetría llevan a que Discoteca/Discoteca sea el único equilibrio. No vamos a demostrarlo, pero sí a dejarlo aquí por completitud. En un juego de coordinación, si la matriz tiene la forma genérica:

Ana
Gusta Odia
Alberto Gusta C,c A,a
Odia D,d B,b

existe un equilibrio de Nash en estrategias mixtas en el punto:[6]

 PalbG=\frac{(d-b)}{(a+d-b-c)}

 PanaG=\frac{A-B}{A+D-B-C}

Han sido un par de artículos duros, y además la conclusión parece que nos deja un sabor agridulce: por mucho que analizamos, no acabamos de encontrar una solución satisfactoria… pues sí… real como la vida misma. A veces no podemos encontrar una solución buena y tenemos que conformarnos con una solución no demasiado mala.

  1. En realidad son máximos, y lo que buscamos es maximizar, pero me resulta más sencillo seguir usando la analogía de la canica que está buscando el fondo del cuenco. []
  2. Recordemos que no es necesario empeorar, basta con no mejorar. []
  3. O puede que más de uno, por ejemplo si la matriz de pagos no es de solo dos decisiones, como es la nuestra. []
  4. Lo que se llama un resultado vectorial. []
  5. Ojo: eso no es lo mismo que decir P=0,5 en el caso de la decisión simétrica del epígrafe anterior. []
  6. Si comparáis con la fórmula que vimos antes, veréis que aquella es una particularización de esta cuando hay simetría. []

Sobre el autor:

J ( )

 

{ 4 } Comentarios

  1. Gravatar J | 25/04/2011 at 06:37 | Permalink

    Acabo de encontrar un error grave al explicar las tablas. Podría decir que es una errata, pero es que desvirtúa completamente el sentido de la frase. Corregido para la posteridad.

  2. Gravatar Eodun | 29/04/2011 at 09:42 | Permalink

    Vale, ¡llegué!

    Conocía lo básico de teoría de juegos, pero estoy aprendiendo mucho más y sobre todo, me gusta ;)

    Ya de paso, gracias a todos los colaboradores, para no nombrar a ninguno en especial, pero sobre todo a Pedro, que ésta es una de las mejores páginas que he encontrado en “la intenné esa” desde que llevo navegando (y empecé en el 97… com mi “magnífico” módem de 28800 baudios XD)

    Por cierto, yo me llamo Alberto y mi hermana Ana, es una tontería pero resulta gracioso (para mí) ;) .

  3. Gravatar Loren | 02/12/2012 at 06:40 | Permalink

    Fantástico post. Me surge una duda, en este juego, juegan los dos a la vez. Si uno de ellos, por ejemplo Alberto, tuviera que elegir primero, cuál sería la solución? jugar primero supondría una ventaja?

  4. Gravatar J | 02/12/2012 at 10:06 | Permalink

    Loren, si has seguido el resto de la serie, puedes hacer tú el análisis y compartirlo con nosotros.

{ 1 } Trackback

  1. [...] de juegos XXIV – La guerra de sexos (y II), de Javier “J” Sedano, que pode lerse en El Cedazo. Toda a serie Teoría de juegos está publicada en forma de libro, [...]

Escribe un comentario

Tu dirección de correo no es mostrada. Los campos requeridos están marcados *

Al escribir un comentario aquí nos otorgas el permiso irrevocable de reproducir tus palabras y tu nombre/sitio web como atribución.