Casi desde el principio de la serie hemos ido proponiendo juegos, introduciendo conceptos sencillos sobre la teoría de juegos y aplicándoselos a esos juegos, y hemos ido refinando nuestro conocimiento sobre los juegos que estudiábamos.
Hoy vamos a introducir el concepto de estrategias mixtas, para lo cual vamos a invitar a Ana y a Alberto a jugar al tenis.
Siempre que he leído sobre este juego o alguna variante, ha sido con jugadores de baseball, que tienen que decidir si tirar una bola rápida o una bola lenta. Pero como en España apenas existe tradición baseballística, y ni siquiera sé lo que diferencia a una bola rápida de una lenta (supongo que una irá más deprisa que la otra, ¿no? Pero no sé en qué afecta eso), nosotros vamos a hacer el juego con tenistas.
Por supuesto, no vamos a escribir un tratado sobre tenis (entre otras cosas porque además soy bastante malo jugando), pero sí vamos a utilizar alguna de su terminología para darle color al artículo. Aunque espero que puedas seguir el artículo sin ningún problema sin conocer el argot tenístico, puedes echarle un vistazo a la Wikipedia, o irte a ver algún partido y luego volver aquí.
Alberto está al servicio, y Ana al resto. Ana puede decidir prepararse para recibir un servicio a su drive,[1] dando un pasito hacia su derecha (su derecha, no la derecha del dibujo), o puede prepararse para recibir un servicio a su revés,[2] dando un pasito a su izquierda. Alberto, a su vez, puede decidir sacar hacia el drive de Ana o hacia el revés de Ana.
Y además, supondremos que los dos deben tomar la decisión a la vez. Podríamos pensar que Ana se pondrá en su sitio, Alberto la verá y sabrá qué es lo que ha decidido Ana, y entonces decidirá él. Bueno, pues no. Ana se colocará en el centro y dará el pasito en el último momento, cuando Alberto ya ha decidido y está sacando, así que supondremos que ambos toman la decisión a la vez. En un juego real, además cada uno podría intentar engañar al otro, colocándose hacia un lado y moviéndose luego hacia el otro, o mediante su lenguaje corporal, de forma parecida a lo que hacen jugador y portero en un penalti de fútbol. Pero vamos a simplificarlo, y digamos que simplemente ambos deciden a la vez.
Veámoslo con un dibujo:[3]
No es difícil darse cuenta de que si la decisión de Ana coincide con el saque que Alberto pretende hacer, le resultará mucho más fácil restar,[4] mientras que si no lo consigue, Alberto probablemente conseguirá un ace.[5]
Así que vamos a estimar una matriz de recompensas, en la que mostraremos la probabilidad de que Ana no consiga restar y por lo tanto Alberto consiga el ace.[6]
Ana se prepara para… | |||
Drive | Revés | ||
Alberto saca… | Al drive | 10% | 30% |
Al revés | 50% | 20% |
Nótese que lo que mostramos son probabilidades de que Alberto consiga el ace, no certezas absolutas. Así, si Ana se preparó para un drive, pero Alberto se la tira al revés, logrará un ace la mitad de las veces; mientras que si se la tira al drive, lo logrará solo un 10% de las veces. A pesar de ello, y para no liarnos, podemos suponer que los números que aparecen ahí son pagos que recibe Alberto, y su objetivo es maximizarlo (y el de Ana minimizarlo, claro).
Pongámonos en el lugar de Alberto. ¿Qué debe hacer Alberto? ¿Tiene Alberto alguna estrategia dominante que le permita maximizar su probabilidad de conseguir un ace?
No. Con los conocimientos que hemos visto hasta ahora, no tiene una estrategia dominante. Si Ana se preparó para el revés, la mejor estrategia de Alberto es tirar al drive, y si Ana se preparó para el drive, lo mejor es tirársela al revés.
Podríamos pensar que Alberto debería tirarla siempre al revés, porque si da la casualidad de que Ana se va al drive ¡tiene un 50%! ¡Ya tiene medio punto ganado! Así que debería tirarla siempre al revés… pues no. Porque si hace eso sistemáticamente, Ana le calará en seguida, se preparará siempre para el revés, y Alberto solo conseguirá un 20%.
Bueno… pero si Ana hace eso, Alberto puede cambiar y empezar a tirar al drive, consiguiendo un 30%. Hombre, no es el 50% que tenía antes, pero no está mal… solo que si empieza a hacer eso siempre, todos los saques, Ana también se dará cuenta rápidamente y se preparará siempre para el drive.
¡Ya lo tengo! Entonces, lo mejor es sacar unas veces a un lado y otras veces al otro.
Bien pensado: eso es una estrategia mixta.
Estrategias mixtas
No te sorprenderá que menudo se utilice el término estrategia pura como contraposición al término estrategia mixta…
Teniendo esto en cuenta ahora, ¿existe una estrategia mixta que sea la mejor estrategia mixta?
Sí, existe.[7] John Nash demostró que todos los juegos tienen al menos un equilibrio de Nash en estrategias mixtas.
Así que antes de seguir, tenemos que refinar un poco nuestra definición de equilibrio de Nash para acomodar el concepto de estrategias mixtas.
Como ahora ya no estamos hablando de que los jugadores tomen una determinada decisión, sino de que las tomarán con una cierta probabilidad Pi, no podemos utilizar el pago como medida de bondad de la estrategia, sino que debemos utilizar la esperanza del pago.[8]
Lo mejor es verlo con un ejemplo.
Imaginemos que Alberto decide usar una estrategia mixta: el 90% de las veces tirará al revés (y consecuentemente, el 10% restante sacará hacia al drive). Por su parte, Ana decide prepararse para recibir un drive el 60% de las veces (y para recibir un revés el 40% restante).
Cuidado, porque aquí no debemos confundir las probabilidades de elegir una decisión con las probabilidades de conseguir el ace una vez estamos en un punto determinado. Como hemos dicho más arriba, a estos efectos debemos considerar los números de la matriz como pagos, y punto. Así que para evitar esa confusión, vamos a quitar todos los símbolos de porcentaje de la matriz de pagos:
Ana se prepara para… | |||
Drive | Revés | ||
Alberto saca… | Al drive | 10 | 30 |
Al revés | 50 | 20 |
Ahora ya no debemos preocuparnos de qué representan esos números, solo debemos saber que el objetivo de Alberto es conseguir el pago más alto y el de Ana es que Alberto consiga el pago más bajo.
¿Entendido hasta aquí? Relee estos últimos párrafos antes de seguir.
Así que hemos dicho que ambos usarán una estrategia mixta:
Ana se prepara para… | |||
Drive (60%) | Revés(40%) | ||
Alberto saca… | Al drive (10%) | 10 | 30 |
Al revés (90%) | 50 | 20 |
La esperanza matemática de esas distribuciones de decisiones resulta de multiplicar cada uno de los puntos de la matriz por las probabilidades correspondientes a sus decisiones (ojo: en tanto-por-uno, no en porcentaje), y luego sumarlo todo. Es decir:
E = 10·0,6·0,1 + 30·0,4·0,1 + 50·0,6·0,9 + 20·0,4·0,9 = 0,6 + 1,2 + 27 + 7,2 = 36.
La esperanza de pago para Alberto resultante de esa distribución de probabilidades es 36.
Por supuesto, una distribución de probabilidades distinta dará una esperanza distinta. Alberto intentará elegir una distribución de probabilidades tal que esa esperanza de pago se maximice, mientras que Ana intentará elegir una que la minimice.
¿Podemos averiguar cuál es la distribución de probabilidades óptima?
…
Pues desgraciadamente, al menos hasta donde yo sé, no siempre podemos. Existirán juegos en los que encontrar ese equilibrio de forma más o menos intuitiva será fácil (incluso veremos alguno en el futuro), pero en el caso general no es posible fácil.[9] La demostración que hizo Nash es lo que los matemáticos llaman una demostración no constructiva. Es decir: demuestra que existe una solución, pero no dice cómo conseguirla. Es decir: Nash demostró que para cualquier juego existe al menos un equilibrio de Nash en estrategias mixtas, pero no demostró cómo averiguar cuál era ese equilibrio. En la segunda parte veremos una forma de encontrar un punto de equilibrio usando un método de gradiente (y por lo tanto vamos a dejar el artículo aquí de momento, que ya está quedando largo), pero si algún lector conoce un método analítico que contradiga este párrafo, que lo diga, porque esta vez no es que esté dando suspense para luego refinarlo: es que yo no conozco que exista tal método analítico.
No puedo terminar el artículo sin meter un poco de humor friki de economistas:
Quien juega con una piedra, una tijera y un papel es John Nash. Por si no domináis la lengua de Shakespeare, dice:
-He encontrado la estrategia óptima para piedra-papel-tijera.
-Enhorabuena, ¡has ganado el Nobel!
En realidad le dieron el Nobel por toda su contribución, pero bueno, es un chiste. Además, ni siquiera eso: como hemos visto, demostró que existía una estrategia óptima para piedra-papel-tijera (en realidad, para cualquier juego), pero no cuál era.
La imagen es una captura de un vídeo humorístico del Dr. Yoram Bauman. Hace falta conocer algo de macroeconomía (no mucha) para coger la mayoría de los chistes (y además defenderse con el inglés, porque habla bastante rápido).
En la segunda parte, más.
- En el argot tenístico se suele denominar con el nombre inglés, drive, al golpe “normal” cuando eres diestro y la pelota viene por tu derecha. [↩]
- En el argot se denomina revés al golpe que das cuando eres diestro y la pelota te viene a la izquierda. Lógicamente, si eres zurdo, las posiciones cambian. [↩]
- Suponemos que Ana es diestra, y por lo tanto su drive es a su derecha, y su revés es a su izquierda. [↩]
- En argot tenístico, restar es devolver la pelota correctamente tras el saque del contrario. [↩]
- Un ace se produce cuando el que saca lo hace tan bien que el que resta ni siquiera es capaz de golpear la pelota (vamos, que ni huele la pelota); por lo tanto, consigue el punto directo. [↩]
- Ponemos valores muy altos, probablemente mucho más altos de lo que serían en un partido de verdad entre tenistas profesionales, pero lo hago solo para exagerar los números y que nos quede claro. [↩]
- Al menos para alguna noción de “mejor”. Veremos más adelante que puede ser un “óptimo local”. [↩]
- Aquí estamos utilizando la palabra “esperanza” en su sentido matemático. Es decir: media. “Y entonces”, se dirá el lector astuto, “¿por qué no usas media y punto?” He estado tentado de hacerlo, siguiendo la filosofía comprensible de El Cedazo, pero al final he preferido no hacerlo porque casi toda la literatura al respecto usa “esperanza” y conviene acostumbrarse al palabro. [↩]
- cruzky nos cuenta en los comentarios que sí hay una forma, resolviendo un sistema de ecuaciones polinomiales multihomogéneas. Pero ni siquiera sé lo que es eso, así que el que dude, que le pregunte a él. [↩]
The Teoría de Juegos XIX – Los tenistas (I) by , unless otherwise expressly stated, is licensed under a Creative Commons Attribution-Noncommercial-No Derivative Works 2.5 Spain License.
{ 9 } Comentarios
Si no me acuerdo mal de cuando estudie el tema de estrategias mixtas, se pueden calcular resolviendo un sistema de ecuaciones polinomiales multihomogéneas, vamos un sistema de ecuaciones “especial”. El problema es que resolver dicho sistema es un costoso computacionalmente hablando y no esta muy claro si encontrar soluciones “aproximadas” sera más fácil.
Lo que si que se sabe es que el número de equilibrios que hay es “alto” en general (vamos que hay BASTANTES más que uno).
cruzky: modifico el texto para incluir “al menos un equilibrio”, porque es verdad que daba la impresión de que hay 1 y solo 1 equilibrio. El caso más obvio para ver que puede haber más de un equilibrio es cuando 2 decisiones tienen el mismo pago.
Respecto al sistema de ecuaciones polinomiales multihomogéneas, si no me cuentas más, pongo solo una referencia al comentario, porque no sé ni siquiera a qué se parece eso.
La verdad es que el tema es un poco complejo. Te puedo explicar como “son” los sistemas fácilmente, pero desarrollar que encontrar un equilibrio de nash se puede escribir como un sistema de ese tipo de ecuaciones son un par de paginas de mates que te puedo enviar al correo [1] pero me da que ahora mismo no sabría explicarte facilmente.
[1] mi correo es cruzki123 en gmail
La estrategia óptima existe en cualquier juego de estrategia mixta, como demostró Nash, pero ¿existe a priori, es decir, sin saber la estrategia del contrincante, o existe siempre, dada una estrategia del contrincante conocida? …esto no me quedó claro…
He hecho unos números con el juego de piedra-papel-tijera, con una matriz de pagos 3×3, dándole diferentes probabilidades a cada jugador para cada jugada. Los pagos son -1 derrota, 0 empate y 1 victoria. La fórmula de la esperanza se halla fácilmente, según el ejemplo del texto, pero el óptimo depende de las probabilidades del contrincante. Si las probabilidades no son conocidas, como mucho se puede llegar a asegurar esperanza nula, que corresponde al caso de mostrar piedra, papel o tijera con la misma probabilidad (1/3 para cada una).
Entonces, ¿cuál es realmente la estrategia óptima para este juego? ¿Asegurar a priori esperanza 0 minimizando pérdidas (minimax)? ¿O en función de la estrategia del contrincante?
Argus,
Creo que tu confusión viene de que estás mezclando un par de conceptos distintos. Si es así, no me extraña que lo mezcles, porque en muchos casos son la misma cosa… pero en otros no.
Por un lado el de Equilibrio de Nash. El equilibrio solo tiene sentido cuando hablamos de las estrategias de ambos. Si uno de los jugadores (cualquiera) mejora al cambiar su estrategia, entonces eso no era un equilibrio de Nash.
Por otro, el de la estrategia óptima: mi estrategia óptima es la que me da el mejor pago (aún hay que decir respecto a qué es óptima). Obviamente, esto solo tiene sentido si conozco la estrategia del contrincante.
¿Cuándo conozco la estrategia del contrincante? El caso obvio es cuando el otro ya ha decidido, y ya no pinta más, y entonces solo quedo yo por decidir. Pero también, cuando ambos decidimos a la vez, pero sé que el otro es un ser racional y él sabe que yo lo soy, y entonces, ambos sabemos que la mejor estrategia conjunta es el Equilibrio de Nash.
Otra forma de verlo:
-Si conoces la estrategia del oponente, puedes diseñar una estrategia óptima. -Si el oponente es racional y sabe que tú lo eres, indirectamente sabes su estrategia, y él sabe la tuya, luego también puedes diseñar una estrategia… que “casualmente” será la que el sabía que tú ibas a utilizar.
Y, ¿cuándo puede ocurrir que el equilibrio de Nash no sea una estrategia óptima? Pues precisamente cuando uno de los jugadores no lo elige. Puede que uno de ellos sea irracional. O puede que, aún siendo racional, tenga información parcial o errónea. Fíjate que en la vida real esto muy-muy común.
Ejemplo. Aún no sabemos cuál es el Equilibrio de Nash de este juego de los tenistas. Lo buscaremos en la segunda parte. De momento, imagínate que el equilibrio es que Alberto saque al revés con p=0,6, y que Ana defienda el revés con p=0,2. Pero si Ana es irracional y decide defender siempre su revés, ¿sigue siendo el equilibrio la mejor estrategia de Alberto? No, claro que no, en ese caso, lo mejor es sacar siempre al drive.
Bueno… es que ese es el equilibrio de Nash de ppt.
Te remito a la explicación anterior. Un ejemplo divertido:
-Si vais a jugar a ppt con Bart Simpson (que dice “la piedra es lo mejor, nada gana a la piedra”), lo mejor es elegir siempre papel.
-Si vais a jugar con Lisa, sabemos que ella es racional, y ella sabe que nosotros lo somos, de forma que ambos sabemos que el equilibrio 1/3-1/3-1/3 (esperanza 0) es lo mejor que podemos conseguir. Así que ambos usaremos esa estrategia.
Por cierto, que también veremos juegos (en el capítulo XXIII, que precisamente acabo de modificar para añadir esto, ya que no sabía muy bien donde contarlo, y al final me encaja allí) donde hay varios equilibrios de Nash, y no todos ellos son “lo mejor”. Solo es un equilibrio.
Otro “por cierto”: acabo de acordarme (ya podía haberlo hecho antes de escribir el otro comentario) de que ya hemos visto un juego en que había un equilibrio de Nash (Delatar/Delatar), pero es mejor Callar/Callar, que además es lo que elige la evolución. O también la Caza del Ciervo, donde había dos equilibrios.
Fascinante artículo y muy buen vídeo!
¿Qué hay sobre las curvas de mejor respuesta que propone Varian? También son, hasta donde yo sé, una forma gráfica que explica la forma de hallar equilibrios de Nash en estrategias mixtas.
{ 1 } Trackback
[...] de 2011 Teoría de juegos XIX – Los tenistas (I), de Javier “J” Sedano, que pode lerse en El Cedazo. Toda a serie Teoría de juegos está publicada en forma de libro, [...]
Escribe un comentario