Hacia el equilibrio de Nash - Teoría económica

El concepto de equilibrio de Nash es un poderoso elemento microeconómico que permite la realización de modelos económicos en los que la interdependencia estratégica entre individuos juega un papel decisivo.

En todos aquellos casos en los que el resultado de una decisión (empresarial, de consumo, etc) no dependa únicamente de la decisión en si misma, sino también de las decisiones de otra u otras personas, cada uno de los individuos intentará reflexionar no solo sobre el resultado que se obtendrá a partir de cada set de decisiones, sino en las decisiones que cada una de estas personas llevará a cabo.
El equilibrio de Nash se define como aquel set de decisiones individuales que, una vez establecidas, hace que ninguno de los individuos quiera, de manera individual, cambiar de decisión. Es un equilibrio precisamente porque, a partir de él, ninguna persona querrá desviarse o elegir de manera diferente. Esto no quiere decir que el resultado final sea el óptimo, o el que mayor beneficio pudiera dar tanto de manera individual como al conjunto de los individuos, simplemente es el equilibrio estable del sistema.

Mucho se ha escrito sobre el tema y seguramente el dilema del prisionero sea uno de los conceptos más conocidos en este ámbito, así que permítanme ir un poco hacia delante y asumir que en general los que leen estas líneas entienden el concepto de equilibrio de Nash. Lo que quiero comentar en este artículo es un concepto algo más complejo que se explica solo de manera sucinta en casi todos los manuales de teoría de juegos: ¿Cómo se llega al equilibrio de Nash? ¿Qué exista un equilibrio implica necesariamente que se llegará a él?

¿Derecha o izquierda?

Partamos de un ejemplo sencillo pero bastante revelador: Las carreteras.
Supongamos únicamente que estamos ante dos jugadores: Uno quiere subir una calle y otro quiere bajarla. ¿Qué podrán hacer los dos para no chocarse por el camino?
Es bastante obvio porque es algo que vivimos día a día. En los términos de un juego estratégico hay cuatro posibilidades, suponiendo que la carretera está dividida en dos carriles: Si ambos van por el lado derecho o izquierdo, se chocarán (supongamos entonces que reciben una utilidad 0 cada uno), si uno de ellos va por el lado izquierdo y otro por el derecho, cada uno llegará a su destino a salvo (dotaremos de este resultado del valor 1, simplemente tenemos que dar cuenta de que no chocar es preferible a chocar).
Individuo 1 \ Individuo 2 Izquierda Derecha
Izquierda A = (0,0) C = (1,1)
Derecha B = (1,1) D = (0,0)
Esto deja abiertos dos posibles equilibrios de Nash, aquel en el que el jugador 1 conduce por la izquierda y el 2 por la derecha y al revés. Son equilibrios de Nash precisamente porque si ambos individuos se encuentran realizando ya dicha estrategia, ninguno de los dos querrá cambiar de carril, pues entonces se encontrarían de manera poco fortuita. Por ejemplo, si el individuo 2 va por el carril de la izquierda y el individuo 1 por el de la derecha, este no querrá pasarse al carril de la izquierda, puesto que entonces chocarían.
Ahora bien, ¿Qué es lo que determina que en un preciso lugar, en un momento determinado, se elija uno de los dos equilibrios? Un equilibrio de Nash es precisamente un equilibrio porque, estando en dicha posición, no habrá incentivos a cambiar, pero ¿y si no se parte del equilibrio de Nash?

Droitwich

Esta es otra situación que no vivimos diariamente, pero que seguro que todos los que leen estas palabras han presenciado alguna vez. Me ha costado encontrar la palabra que definiera este proceso, si bien parece que Douglas Adams y John Lloyd la definen para todos nosotros en “The meaning of Liff” (un libro donde inventan palabras para las situaciones o hechos que todavía no las tienen).
Por Droitwich nos referimos a ese momento en el que dos personas que van caminando por la calle en sentido contrario están a punto de chocarse y a la hora de elegir el lado para el que moverse para evitar el choque los dos se mueven a la vez y hacía el mismo lado. Los dos se van hacia la derecha, los dos se van hacia la izquierda mientras, poco a poco, se van acercando cada vez más. Este pequeño “baile incómodo” es el droitwich. Finalmente o bien llega un momento en el que el movimiento de cada uno de los individuos no coincide o bien chocan y se disculpan cortésmente.

Durante todo este proceso los dos individuos partían de un estado de desequilibrio y ambos pretendían llegar a un equilibrio de Nash. El problema es que no sabían por cual debían decantarse, al no saber lo que haría el otro. Por ejemplo, el individuo 1 podría querer llegar al equilibrio B, y por eso se movió a la derecha. El individuo 2 quería llegar al equilibrio C, y por eso también se movió a su derecha. Como resultado de estas dos estrategias, llegaron a D, que no era ninguno de los dos equilibrios. El droitwich no es más que un baile basado en la persecución individual de un equilibrio de Nash que les permita seguir caminando.

Siempre podemos pensar que con el tiempo uno de los equilibrios será el resultante, y en la mayoría de los casos será cierto. Incluso si las dos personas llegan a chocarse y suponiendo que seguirán vivos tras el golpe y que no pueden atravesarse, tendrán que llegar a algún acuerdo (con que uno de ellos establezca claramente su estrategia valdrá). Pero esta es una clave importante: Si no hay ningún tipo de información sobre o entre los jugadores (acuerdos, estrategias dominantes o amenazas creíbles), llegar al equilibrio de Nash no está asegurado, mucho menos de manera instantánea.

Hacia el equilibrio

En uno de los libros de microeconomía, clásico por excelencia, que suelo tomar de referencia, el de Mas-Colell, Whinston & Green, se encuentran las cinco explicaciones básicas sobre el proceso por el que un sistema llega a uno de los equilibrios de Nash. Si bien hablaremos en términos coloquiales, tanto por lo que apuntan los propios autores, como por el tiempo que dista de la publicación del manual a la actualidad, con casi total seguridad existirán modelos que expliquen de manera más formal el proceso por el cual se alcanza dicho equilibrio. Las cinco explicaciones son las siguientes:
  1. Equilibrio de Nash como inferencia racional: Puesto que los individuos son racionales y pueden inferir, a través del supuesto de racionalidad del resto de individuos, cuales serán las estrategias del resto de jugadores, se puede pensar que los jugadores sabrán predecir lo que harán sus rivales y, por tanto, adivinar cual será el equilibrio de Nash resultante. Obviamente, los propios autores descartan este caso como una explicación del dilema al que nos enfrentamos. Asumir que los individuos son racionales y tienen información del juego no informa sobre lo que realmente van a hacer el resto de jugadores, mucho menos si estamos frente a múltiples equilibrios de Nash. La inferencia solo sirve para identificar de manera individual los equilibrios de Nash, no para explicar cómo se llega a ellos.
  2. Equilibrio de Nash como condición necesaria: Esta es el reflejo simplificado del caso anterior. Si solo existe un equilibrio de Nash, todos los individuos lo tomarán como el único equilibrio al que se puede llegar, el resultado obvio del juego y, por tanto, asumirán que es el reflejo de las estrategias finales del resto de individuos. Esto consigue que todos los individuos realicen la estrategia del set del equilibrio de Nash. Pero, de nuevo, solo es aplicable cuando existe un único equilibrio o resultado final obvio, analizable a priori.
  3. Puntos focales: ¿Qué ocurre si tenemos varios equilibrios de Nash, en el que uno de ellos es Pareto superior al resto? En este caso, si bien todos los equilibrios podrían ser el resultado de un determinado juego o pensamiento estratégico, el equilibrio de Nash con un mayor beneficio se observa como un “punto focal”, un punto que los individuos toman como el más “sensato” de jugar, el más obvio (volvemos al punto anterior). Esto hace que ante varios equilibrios, los jugadores entiendan que se va a tender hacia el mejor (cada uno asume que el resto de agentes también reflexionarán de la misma forma) y que, finalmente, se llegue a este mejor equilibrio de Nash.
  4. Equilibrio de Nash como acuerdo: Si los jugadores pueden comunicarse antes del juego y quedar estratégicamente en la realización de un set de estrategias que sea un equilibrio de Nash, este resultado se vuelve, de nuevo, un resultado obvio, un punto focal derivado del acuerdo. Esto convierte al equilibrio de Nash escogido como el punto de referencia sobre el que tomar las decisiones individuales que, por tanto, acabaran realizando lo acordado.
  5. Equilibrio de Nash como convención social: Uno de los equilibrios puede ser el resultado de haber repetido el mismo proceso varias veces, de forma que con el tiempo “brota” o aparece una cierta convención social innata al sistema: Puesto que el individuo A casi siempre hace X, espero que esta vez haga X. Una vez que se alcanza un cierto equilibrio, se mantiene, puesto que todos los individuos esperan que el resto de agentes hagan las mismas estrategias que determinan el equilibrio de Nash. Esta convención también puede establecerse de manera política o normativa. Por ejemplo, los británicos utilizan en sus carreteras un equilibrio de Nash diferente al nuestro (ellos conducen por su derecha, nosotros por nuestra izquierda). Este resultado (derivado de hechos históricos, creo recordar, pero también por el reforzamiento social) indica que una determinada ley puede garantizar o indicar cual será el equilibrio de Nash a realizar en un determinado momento.

Una respuesta insatisfactoria

Pero tras estas cinco explicaciones nos seguimos encontramos un poco desnudos ante este dilema, pues ninguno da cuenta realmente de cómo se determina qué equilibrio de Nash resultará si estos son iguales, ni mediante qué mecanismo.
El punto cuarto y el quinto implican un acuerdo previo: la transmisión de información privada o social que inicia el análisis reflexivo de cada individuo a partir de uno de los equilibrios de Nash (acordados o ya realizados anteriormente) que, por su condición de equilibrio, será el resultado final.
El punto segundo y tercero tratan de el proceso en el que uno de los equilibrios resulta inicialmente favorecido, bien sea porque es el único equilibrio, bien porque es el mejor. De nuevo, estos serán los puntos focales desde los que comenzar el análisis, con idéntico resultado.
El primero no es tampoco satisfactorio, por ser un análisis preliminar, pero no completo, del proceso por el que se llega al propio equilibrio.
Si bien no hay una simple respuesta satisfactoria, el capítulo acaba con una cita interesante:
“La noción de equilibrio como un punto de reposo al que se tiende tras un cierto proceso de ajuste dinámico implica el uso de la noción tradicional de equilibrio usada en teoría económica. En este sentido, la convención social como la justificación de un determinado equilibrio de Nash es la más cercana a la tradición económica.”
Y en una nota al pie argumenta un poco más lo que esto implica:
“¿Por qué deberíamos esperar alcanzar un equilibrio de Nash en un juego de largo recorrido? Una respuesta es … imaginar que los jugadores siguen simples reglas preestablecidas (a rule of thumb) sobre las estrategias más probables de sus oponentes cuando un juego se ha repetido varias veces”.
Es decir que, a través de la experiencia, los individuos pueden establecer ciertos conocimientos que les permitan analizar de manera indirecta las estrategias probables de sus contrarios. Pero esto, como el propio autor confirma, no es del todo formal, ni nos ayuda a razonar qué ocurrirá cuando la decisión es única (cuando, por tanto, no tenemos información previa sobre lo que pueden hacer el resto de jugadores).
Esto puede no tener ninguna relevancia (en el caso explicado en el que dos personas casi se chocan, no se produce ningún resultado de gran relevancia para la teoría económica) o puede ser decisiva. ¿Qué ocurre cuando la determinación del equilibrio de un sistema económico (quizás no a nivel macro, pero sí a nivel de una cierta competencia empresarial, la distribución de la producción, el resultado de una crisis política…) pasa por la existencia de diferentes equilibrios de Nash.
En estos casos la historia, el proceso por el cual se reflexiona, se decide y se actúa (en definitiva, el camino por el que se transita), tanto de manera individual como agregada, puede ser decisivo para explicar porqué alcanzamos un determinado equilibrio.
Así, una vez alcanzado cualquier estado que podamos denominar de equilibrio, debemos recordar que no podemos explicar el sistema únicamente mediante la constatación de que es un equilibrio, sino que debemos añadir la explicación del proceso por el cual se llego a él y, sobre todo, analizar porqué no se llegó a ningún otro.
“Este problema es una de las preguntas abiertas más importantes en teoría de juegos, sobre todo dado el extendido uso del equilibrio de Nash.”
Miguel Puente Ajovin. @caoticaeconomia