Regístrate | Conectar
El Tamiz Libros Recursos Series Únete 15 Users Online
Skip to content

Teoría de juegos XVII – La caza del ciervo




Antes de seguir avanzando en la serie, vamos a presentar un juego nuevo, íntimamente relacionado con el dilema del prisionero que veíamos antes, y que muchos consideran la mejor forma de modelar la cooperación social. El juego se llama la caza del ciervo.

¿De verdad quieres cazarlo? (Image*After)

Nos servirá para afianzar los conceptos de equilibrio de Nash y estrategia dominante, y además para introducir un concepto nuevo: la suma cero.

El juego dice algo así: tenemos dos lobos, Rómulo y Remo, que pueden decidir ir a cazar un Conejo o cooperar para cazar un Ciervo.

Si uno de ellos decide cazar un Conejo, come. No es que se pegue un festín, pero vaya, come.

Si ambos deciden ir juntos a cazar un Ciervo, ambos se pegan un festín de la leche. No solo comen, sino que además se ponen las botas, y pueden dedicar las energías sobrantes a, por ejemplo, la reproducción.

Pero si uno de ellos decide ir a por el Ciervo, y el otro va a por el Conejo, el que decidió ir a por el Ciervo se queda sin nada, porque él solo no es capaz de cazarlo (no obstante, su “amigo”, que se fue a por el Conejo, sí come).

Podemos representar esto según la siguiente matriz de pagos (primero ponemos la recompensa de Rómulo y luego la de Remo):

Remo
Ciervo Conejo
Rómulo Ciervo 4,4 0,3
Conejo 3,0 3,3

Representamos con un 3 el hecho de que comen, con 4 el hecho de que no solamente comen, sino que se pegan un festín, y con 0 el hecho de que se quedan con el estómago vacío.

La alternativa también es entrañable... en algunos sitios, hasta son animales de compañía (Image*After)

¿Existe una estrategia dominante para alguno de los jugadores? Recordemos cómo se buscaba: para cada una de las posibles decisiones del otro jugador, elegíamos nuestra mejor opción. Si en todos los casos es la misma elección, eso es una estrategia dominante.

Pues no, en este caso no existe estrategia dominante.

Si Remo elige Ciervo, la mejor elección de Rómulo es Ciervo. Pero si Remo elige Conejo, la mejor elección de Rómulo es Conejo. Es decir, Rómulo no tiene una estrategia dominante (ni tampoco Remo, pues su situación es la misma).

¿Existe algún equilibrio de Nash? Sí, existen dos equilibrios de Nash: Ciervo-Ciervo y Conejo-Conejo.

  • Si ambos eligieron Conejo, el que cambie su elección a Ciervo se queda sin nada, así que no está tentado de cambiar. Luego Conejo-Conejo es un equilibrio de Nash.
  • Si ambos eligieron Ciervo, el que cambie su elección a Conejo pasa de cobrar 4 a cobrar 3, así que no le interesa hacerlo. Luego Ciervo-Ciervo es un equilibrio de Nash.
  • Si uno elige Conejo y otro Ciervo, cualquiera de los dos cambios beneficia a alguien. Si el que eligió Conejo cambia a Ciervo, pasa de ganar 3 a ganar 4. Así que está tentado de cambiar. Y el que eligió Ciervo, que actualmente gana 0, también sale beneficiado (pasando a ganar 3) si cambia a Conejo. Luego Conejo-Ciervo y Ciervo-Conejo no son equilibrios de Nash.

Aunque a algunos les parecerá obvio, debemos darnos cuenta de que las situaciones no son las mismas que en el dilema del prisionero, porque la matriz no es exactamente igual, aunque sea parecida. Tomando una matriz de pagos genérica como la siguiente:

Jugador 2
Alfa Beta
Jugador 1 Alfa a,a c,b
Beta b,c d,d

Generalmente se supone que estamos en un juego como la caza del ciervo si se cumple la relación a>b>=d>c (en nuestro juego, 4>3>=3>0), pero estamos en uno como el dilema del prisionero si se cumple la relación c>d>a>b (en nuestro ejemplo, 0>-1>-6>-10).[1] Como estamos considerando solo estrategias puras, los valores exactos de los números no afectan, pero si estudiáramos estrategias mixtas, que veremos más adelante, entonces no solo la relación es importante, sino también su valor exacto. Y también son importantes para saber si el juego es de suma cero o no.

Suma cero

Juego de suma cero: un juego es de suma cero si para todas las combinaciones de decisiones, la suma de las recompensas de todos los jugadores es cero (o cualquier otro número constante).

Obviamente, la caza del ciervo, tal y como lo hemos planteado, es un juego que no es de suma cero:[2] si los lobos coinciden en su decisión (sea Conejo-Conejo o Ciervo-Ciervo), ambos ganan. Incluso en el caso peor, el que no gana nada, tampoco pierde.

Pero si hubiéramos elegido otros números…

A lo largo de la serie hemos visto juegos que sí eran de suma cero y juegos que no:

  • De suma cero: piedra-papel-tijera (al menos alguna de las versiones que dimos), el ultimátum, el dictador; y muchos que no hemos visto, pero que a cualquiera se le ocurren: el ajedrez, las damas, el póker…
  • No de suma cero: alguna de las versiones de piedra-papel-tijera, la subasta del dólar, el ciempiés, el juego de confianza, las pensiones y el dilema del prisionero.

Se utiliza también el término suma cero aunque no sume cero estrictamente, sino cualquier otro número fijo. Por ejemplo, podemos decir que las elecciones al Congreso son un juego de suma cero, porque la suma de todos los diputados de todos los partidos es 350. Si uno gana diputados, es porque los pierde otro (o, mejor dicho, los deja de ganar). Estrictamente, deberíamos decir que es un juego de “suma 350″, pero cuando decimos que suma cero, se entiende, ¿no? Algunos autores utilizan el término suma constante para representar esta situación, pero no todos, así que conviene pensar que suma cero podría referirse a cuando suman un número fijo, independientemente de que sea 0 u otro.

Suma cero y la bolsa

El hecho de saber si un juego es de suma cero o no lo es, es importante. Fijaos que si la suma debe ser cero, para que alguien gane, otro debe perder. Por ejemplo, decidir si el ajedrez es de suma cero o no es una discusión ociosa. Si has perdido la partida, pues la has perdido, solo tu ego sale dañado.

Pero decidir si la Bolsa es un juego de suma cero o no (o mejor dicho: suma constante o no) tiene consecuencias más graves. ¿Para que alguien gane dinero en Bolsa, debe dejar de ganar algún otro (hoy o en el futuro)? O… ¿es posible que todos ganen? Durante años ha parecido que las ganancias de la Bolsa podían seguir creciendo y creciendo indefinidamente y que todo el mundo ganaba… pero las caídas de los últimos años han hecho perder a muchos… ¿la ganancia de aquellos era la pérdida de estos? A menudo se dice sobre la Bolsa que “para que alguien gane, tiene que haber un gilipollas que pierda. Y si no sabes quién es el gilipollas, es que el gilipollas eres tú”. Pues saber si la Bolsa es un juego de suma cero o no lo es es determinar si esa frase es cierta o no.

Falacia de suma cero y la cantidad de trabajo

Por supuesto, también lo contrario es malo. Suponer que un juego es de suma cero cuando no lo es se conoce como falacia de suma cero, y puede llevar a análisis equivocados (o incluso malintencionados).

Una de las falacias de suma cero más habituales es que la cantidad de trabajo disponible es constante y por lo tanto, si las máquinas lo hacen por nosotros, los humanos nos quedaremos sin trabajo. Solo hace falta ver la evolución histórica para ver si es verdad:

  • Siglo XV a.C. Había unos 5M de humanos, y todos trabajaban.
  • Siglo I. Población: 300M de humanos. Se han inventado el acueducto (no hacen falta aguadores), el carro (no hacen falta porteadores), el arado (no hacen falta tantos agricultores)… ¿Quiere eso decir que ahora solo trabajan 3M de humanos? No. Trabajan los 300M de humanos.
  • Siglo XIX. Población: 1.000M de humanos. Se han inventado la máquina de vapor (no se fabrican más carros), la máquina de coser (menos costureras), la imprenta (menos escribanos)… ¿Cuánta gente trabaja? Los 1.000M de humanos.
  • Siglo XXI. Población: 6.000M de humanos. Se han inventado el ordenador (no más contables), el walkman (no más músicos), el email (no más carteros)… ¿hay menos gente trabajando? No, hay más. Trabajan los 6.000M de humanos.[3]
  • Siglo XXX. Población: 10.000M de humanos y 10.000M de androides. El ser humano no vuelve a poner una piedra sobre otra, agachar el lomo, realizar una sola tarea pesada o repetitiva. ¿Y qué? Se dedicará a la ciencia, el arte, el ocio, la enseñanza…

Cuantas más máquinas tenemos, más gente trabaja.

Si creemos que la necesidad laboral es de suma cero, prohibiremos las máquinas. Si sabemos que no es de suma cero, entonces fomentaremos la investigación y construcción de máquinas. Es posible que, a corto plazo, automatizar una planta de producción mande al paro a 10 obreros, pero a largo plazo eso beneficiará a la humanidad en su conjunto. Mientras tanto, si queremos (y esto ya no es teoría de juegos sino política), podemos dar protección social a esos parados y/o formarlos para que dejen de realizar ese trabajo, que ya no es necesario, y aprendan a realizar otro.

Cooperación social

Para muchos autores, el dilema del prisionero (y sobre todo su forma iterada, como hemos visto) es la mejor forma de estudiar la cooperación social.

Para otros autores, en cambio, la caza del ciervo es mejor forma de estudiarla, y de hecho muchos de los ejemplos reales que se nos ocurran pueden corresponderse a uno u otro juego dependiendo de los valores que elijamos en la matriz de recompensas. La especialización de las células en los seres pluricelulares, la caza en manada de los lobos y muchas otras especies, la especialización del trabajo en las sociedades humanas… todo ello son situaciones en que quizá podría aplicarse mejor la caza del ciervo que el dilema del prisionero.

Además del ejemplo que ya hemos visto de los lobos en manada, pensemos por ejemplo en unos hombres prehistóricos. Si toda la tribu se va a recolectar bayas, todos comerán bayas. Al fin y al cabo, no se morirán de hambre, pues los monos llevan milenios haciéndolo. Pero también pueden cooperar. Si quien fabrica buenas lanzas se dedica a fabricar lanzas, el que lanza muy bien podrá usar ese arma para cazar un mamut… mamut que habrá sido avistado por el mejor observador y perseguido por el mejor rastreador; y luego el que mejor cocina podrá ocuparse de conservar ese mamut durante meses; y el que mejor curte la piel se encargará de hacer buenos abrigos; y así respectivamente, hasta que todos ganan más que si simplemente recolectaran bayas. Por ejemplo, pueden dedicar el exceso de ganancia a pensar cómo mejorar sus casas, inventar el arco o simplemente reproducirse más porque hay más comida para las crías.

La explicación de por qué este juego les parece mejor se debe a los matices que existen entre ambos equilibrios. Porque no, no todos los equilibrios son iguales. El equilibrio Ciervo-Ciervo es lo que se llama de recompensa dominante, porque obtienen mayor recompensa,[4] mientras que el equilibrio Conejo-Conejo se llama de riesgo dominante, porque el que lo elige está prefiriendo no arriesgarse a quedarse con 0 (en el próximo artículo veremos la estrategia Maximin y formalizaremos un poco esto). Parece que los equilibrios de recompensa dominante se eligen más a menudo cuando los jugadores conocen bien la matriz de pagos, pero los de riesgo dominante se eligen más cuando hay dudas (sobre las recompensas del otro, fundamentalmente, que son las que nos impiden deducir qué es lo que hará el otro).

Estoy deseando leer en los comentarios las opiniones de los lectores sobre cuál de los dos  representa mejor la cooperación social.

Para ir abriendo el debate, doy la mía: en mi opinión, el dilema del prisionero es una mejor representación de la cooperación social. ¿Por qué opino eso? Porque Ciervo-Ciervo es un equilibrio de Nash, así que el hecho de que los seres sociales elijan Ciervo-Ciervo puede no significar más que el sostener el equilibrio de Nash, y no un comportamiento verdaderamente social. En cambio, el punto Callar-Callar del dilema del prisionero no era un equilibrio de Nash, era un punto inestable que va en contra de las estrategias dominantes de ambos jugadores, y, a pesar de ello, los jugadores sociales lo elijen. Para no sesgar demasiado el debate con mi opinión, doy a la vez el contraargumento: parece que los seres sociales elegimos el equilibrio de recompensa dominante, aún sin conocer realmente al otro. Es como cuando a las 2 de la madrugada, en una carretera desierta, paras para ayudar a un desconocido que está parado en el arcén con el capó abierto y el coche echando humo.

Veamos esas opiniones…

  1. Por supuesto, otras relaciones son posibles, solo que no todas tienen un nombre propio. []
  2. Ya sé que gramaticalmente no tiene sentido escribirlo así, pero es la terminología que se utiliza. []
  3. Incluso con un 20% de paro, que no lo hemos contado aquí, siguen trabajando muchos más que antes. []
  4. Técnicamente se dice que es un óptimo de Pareto o paretóptimo, pero como no vamos a ver el Óptimo de Pareto, lo dejamos ahí. []

Sobre el autor:

J ( )

 

{ 14 } Comentarios

  1. Gravatar Macluskey | 03/01/2011 at 11:28 | Permalink

    Gran artículo, J. Cada día más interesante…

    Mi opinión: Lo que mejor representa el “comportamiento social” es la caza del ciervo.

    ¿Por qué opino eso? Porque los hombres somos seres vivos, y todo ser vivo es egoísta en cuanto a su máximo objetivo: preservar la especie, si hace falta a costa de otras especies. Y si la competencia es entre seres de la misma especie, entonces es preservar el linaje, cueste lo que cueste (y aunque no lo sepamos conscientemente).

    Efectivamente, tanto uno como otro juego modelizan los comportamientos humanos (hasta cierto punto), pero me parece que el ciervo es más realista…

    Claro que, ahora que lo pienso, lo mejor sería un juego de “Caza del ciervo prisionero iterado!”. ;)

    Ah, que… ¿todavía no lo ha inventado nadie? Pues lo patento, hala. Será el “juego de Macluskey”. 8)

  2. Gravatar Pedro | 03/01/2011 at 02:08 | Permalink

    Yo estoy con Mac, y creo que generalizando, éste se me parece más que el otro a la realidad más frecuente, aunque se trate de algo que hacemos sin darnos cuenta –y probablemente estemos programados para ello–. También creo que los dos se dan mezclados, y unas veces uno y otras otro, pero si tengo que elegir el más común, me quedo con éste.

    Por cierto: ¿libro de la serie, o libro de la serie? Tú eliges.

  3. Gravatar Argus | 03/01/2011 at 03:30 | Permalink

    Desde mi punto de vista, el dilema del prisionero representa mejor la cooperación social.

    En cada situación real que imagino siempre hay algo de cooperación necesaria socialmente versus no cooperación ventajosa individualmente, que no se da en la caza del ciervo.

    La caza del ciervo me parece una decisión demasiado fácil. Casi no veo conflicto entre las partes. No hacen falta grandes dotes sociales para salir ganando. El mundo no funciona así: ¿Pagar o no pagar el autobús si te puedes escapar del revisor? ¿Respetar o no respetar el turno en una fila si no te ve nadie? ¿Pagar o no pagar impuestos si puedes evadirlos? ¿Quedarte o no quedarte con el dinero antes de devolver una cartera extraviada? Si he entendido bien, todo esto es más dilema del prisionero que otra cosa.

    Por eso necesitamos revisores, policías, leyes…. para mantenernos alejados de los equilibrios de Nash.

    En la caza del ciervo, lo que se castiga es hacer lo contrario que el resto. Yo casi no conozco ejemplos de algo parecido en la vida real. Conducir por nuestra derecha, por ejemplo, pero vaya, eso no define quién es más social: Como mucho define quién es el suicida.

  4. Gravatar Argus | 03/01/2011 at 10:18 | Permalink

    Por cierto, no me quedó claro lo del ajedrez. Yo diría que es de suma cero, pues cuenta 1 punto para quien gana, 0 para quien pierde y 1/2 para cada uno en caso de tablas. Sería un juego de suma 1, si queremos llamarlo así, ¿cierto?

    ¿Y cuál es el caso del fútbol? 3 para quien gana, 0 para quien pierde, y 1 para cada uno en caso de empate. Yo diría que es de suma 0, pues lo que gana uno lo pierde el otro, pero en este caso no es una cantidad constante: Sería suma 3 en caso de victoria/derrota o suma 2 en caso de empate. ¿Cómo se clasificaría esto?

  5. Gravatar J | 04/01/2011 at 07:45 | Permalink

    Argus: depende de cómo consideres las recompensa.

    Con la puntuación que tú le has dado al ajedrez, sería de suma cero. Bien, bueno… estrictamente sería de “suma 1″, o de “suma constante”, pero ya hemos dicho que muchos autores usan “suma cero” independientemente de lo que sume (incluido yo en este comentario). Lo importante no es el número concreto, sino el concepto: para que uno aumente su recompensa en N, otro debe disminuirla en N.

    Un partido de liga española (o de la fase de grupos del mundial), como bien dices con 3 en victoria y 1 para cada uno en empate, no sería de suma cero.

  6. Gravatar Fernando-C | 04/01/2011 at 07:54 | Permalink

    Un artículo más de esta interesantísima serie que tanto nos está enseñando. Supongo que economistas, sociólogos y hasta políticos deberían tener al menos nociones de teoría de juegos.

    Por otra parte me parece que tanto el Dilema del Prisionero como la Caza del Ciervo modelizan diferentes aspectos de la realidad social y no sabría decidir qué juego la representa mejor en conjunto.

  7. Gravatar piligon | 05/01/2011 at 10:23 | Permalink

    Yo, sin embargo, creo que la caza del ciervo representa mejor la cooperación social. Aunque se puede cooperar tanto para obtener beneficios (cazador) como para evitar perjuicios (prisionero) me parece que la sociedad ha avanzado a lo largo del tiempo porque predomina la cooperación social en positivo.

  8. Gravatar Argus | 05/01/2011 at 10:25 | Permalink

    Todavía me falta asentar ciertas nociones, pero diría que el juego del prisionero no sólo trata de minimizar perjuicios. Puede haber un juego del prisionero en positivo, es decir:

    Si ambos callan ganan bastante (como los cazadores eligiendo ciervo-ciervo). Si ambos delatan ganan menos (como los cazadores eligiendo conejo-conejo). Si uno calla y otro delata, el primero le da 2 ciervos al segundo.

    Se puede cooperar en positivo, aunque siempre bajo la tentación de traicionar y ganar más a costa del resto, cosa que sucede en la vida real pero no así en el juego del ciervo.

  9. Gravatar J | 06/01/2011 at 08:36 | Permalink

    Argus: es cierto. Fíjate que hemos puesto una matriz genérica con a,b,c,d y luego hemos visto la relación que deben cumplir para ser “como el juego del prisionero” o “como la caza del ciervo”. Las diferencias más importante no son los números concretos (ni que sean positivos o negativos), sino sus relaciones, que causan que:

    -En el prisionero, hay un equilibrio de Nash.

    -En el ciervo, hay dos equilibrios de Nash, uno de recompensa dominante y otro de riesgo dominante.

  10. Gravatar Anónimo | 10/01/2011 at 12:26 | Permalink

    Bajo mi punto de vista, la caza del ciervo es mucho más común, pues en la mayor parte de las situaciones reales la cooperación entre diferentes individuos conduce al beneficio individual máximo.

    No obstante, yo creo que cooperación social se refiere más bien a que los diversos seres colaboren entre ellos “desinteresadamente” (lo pongo entre comillas porque en mi opinión no hay nada desinteresado, pero así creo que se me entiende) a pesar de que obtienen mayor “beneficio”, a priori, actuando en solitario. Es decir, que se ayudan entre ellos incluso habiendo una opción, en principio, más rentable; en resumen, no se dejan sobornar (teniendo en cuenta, además, que el soborno en este caso no es una acción ilegal que los ahuyenta).

    En los casos de la caza del ciervo si se actúa en colaboración con otro es porque es la mejor opción posible, la que más beneficios da, se mire por donde se mire; ¿qué aliciente hay para no cooperar? Ninguno. Así pues, en este caso no ha habido cooperación “desinteresada” entre ambos individuos, simplemente han elegido la opción que más beneficios monetarios (puede que también de otro tipo, pero es imposible de dilucidar) les entrega, aunque sea esta la de obrar junto a otra persona.

    Finalmente, no acabo de entender el contraargumento de por qué parar en mitad de un desierto demuestra que ejemplifica mejor la cooperación social la caza del ciervo.

  11. Gravatar Sergio | 14/03/2011 at 12:36 | Permalink

    No iba a comentar hasta haber alcanzado el último artículo escrito de la serie, pero es que está tan interesante que no lo puedo evitar :P

    Creo que tanto el dilema del prisionero como la caza del ciervo se dan en nuestra sociedad e incluso en ocasiones es dificil distinguir si la decisión ha sido tomada teniendo en cuenta uno u otro ya que las variables (beneficio/perjuicio) son difíciles de identificar. El motivo puede ser porque quizá un perjuicio encadena un futuro beneficio etc…

    Sin ánimo de extenderme demasiado, el caso de la caza del ciervo me recuerda a determinados aspectos que se dan en las relaciones laborales (empresa/trabajadores). Simplificando mucho:

    Un grupo de trabajadores decide iniciar el proceso para formar un comité de empresa, si todos se organizan, se forma la lista y pueden negociar con la empresa más beneficios para todos (Ciervo), si nadie se organiza, la empresa sigue manteniendo a los trabajadores con los mismos beneficios para cada uno (Conejo). Si algunos se organizan y otros no, los que se han organizado corren el peligro de no llevar a buen puerto la formación del comité y ser enviados a la rue por la empresa (con la correspondiente indeminzación, eso si, pero no está el patio pa que te dejen en la calle).

  12. Gravatar J | 14/03/2011 at 02:48 | Permalink

    ¡Qué buen ejemplo! Me la apunto.

    Como cada artículo trata temas distintos, no es mala idea ir comentando en donde toque, en vez de esperar al final.

  13. Gravatar Sergio | 16/03/2011 at 11:55 | Permalink

    Jo, pues no comenté antes porque pensaba que ya no se leerían los comentarios… :P

    Muchas gracias J.

  14. Gravatar J | 16/03/2011 at 12:01 | Permalink

    Bueno, eso depende de lo friki que seas ;-)

    En RSS de El Cedazo (y también el de El Tamiz) tienes opción de obtener el de los artículos o el de los comentarios. En el de los comentarios están todos los comentarios nuevos, tenga la fecha que tenga el artículo.

{ 1 } Trackback

  1. [...] 2011 Teoría de juegos XVII – La caza del ciervo, de Javier “J” Sedano, que pode lerse en El Cedazo. Toda a serie Teoría de juegos está publicada en forma de libro, [...]

Escribe un comentario

Tu dirección de correo no es mostrada. Los campos requeridos están marcados *

Al escribir un comentario aquí nos otorgas el permiso irrevocable de reproducir tus palabras y tu nombre/sitio web como atribución.