El concepto de equilibrio de Nash es un poderoso elemento microeconómico que permite la realización de modelos económicos
en los que la interdependencia estratégica entre individuos juega un
papel decisivo.
En todos aquellos casos en los que el
resultado de una decisión (empresarial, de consumo, etc) no dependa
únicamente de la decisión en si misma, sino también de las decisiones de
otra u otras personas, cada uno de los individuos intentará reflexionar
no solo sobre el resultado que se obtendrá a partir de cada set de
decisiones, sino en las decisiones que cada una de estas personas
llevará a cabo.
El equilibrio de Nash se define como
aquel set de decisiones individuales que, una vez establecidas, hace que
ninguno de los individuos quiera, de manera individual, cambiar de
decisión. Es un equilibrio precisamente porque, a partir de él, ninguna
persona querrá desviarse o elegir de manera diferente. Esto no quiere
decir que el resultado final sea el óptimo, o el que mayor beneficio
pudiera dar tanto de manera individual como al conjunto de los
individuos, simplemente es el equilibrio estable del sistema.
Mucho se ha escrito sobre el tema y
seguramente el dilema del prisionero sea uno de los conceptos más
conocidos en este ámbito, así que permítanme ir un poco hacia delante y
asumir que en general los que leen estas líneas entienden el concepto de
equilibrio de Nash. Lo que quiero comentar en este artículo es un
concepto algo más complejo que se explica solo de manera sucinta en casi
todos los manuales de teoría de juegos: ¿Cómo se llega al equilibrio de
Nash? ¿Qué exista un equilibrio implica necesariamente que se llegará a
él?
¿Derecha o izquierda?
Partamos de un ejemplo sencillo pero bastante revelador: Las carreteras.
Supongamos únicamente que estamos ante
dos jugadores: Uno quiere subir una calle y otro quiere bajarla. ¿Qué
podrán hacer los dos para no chocarse por el camino?
Es bastante obvio porque es algo que
vivimos día a día. En los términos de un juego estratégico hay cuatro
posibilidades, suponiendo que la carretera está dividida en dos
carriles: Si ambos van por el lado derecho o izquierdo, se chocarán
(supongamos entonces que reciben una utilidad 0 cada uno), si uno de
ellos va por el lado izquierdo y otro por el derecho, cada uno llegará a
su destino a salvo (dotaremos de este resultado del valor 1,
simplemente tenemos que dar cuenta de que no chocar es preferible a
chocar).
Individuo 1 \ Individuo 2 | Izquierda | Derecha |
Izquierda | A = (0,0) | C = (1,1) |
Derecha | B = (1,1) | D = (0,0) |
Esto deja abiertos dos posibles
equilibrios de Nash, aquel en el que el jugador 1 conduce por la
izquierda y el 2 por la derecha y al revés. Son equilibrios de Nash
precisamente porque si ambos individuos se encuentran realizando ya
dicha estrategia, ninguno de los dos querrá cambiar de carril, pues
entonces se encontrarían de manera poco fortuita. Por ejemplo, si el
individuo 2 va por el carril de la izquierda y el individuo 1 por el de
la derecha, este no querrá pasarse al carril de la izquierda, puesto que
entonces chocarían.
Ahora bien, ¿Qué es lo que determina que
en un preciso lugar, en un momento determinado, se elija uno de los dos
equilibrios? Un equilibrio de Nash es precisamente un equilibrio
porque, estando en dicha posición, no habrá incentivos a cambiar, pero
¿y si no se parte del equilibrio de Nash?
Droitwich
Esta es otra situación que no vivimos
diariamente, pero que seguro que todos los que leen estas palabras han
presenciado alguna vez. Me ha costado encontrar la palabra que definiera
este proceso, si bien parece que Douglas Adams y John Lloyd la definen
para todos nosotros en “The meaning of Liff” (un libro donde inventan
palabras para las situaciones o hechos que todavía no las tienen).
Por Droitwich nos referimos a ese
momento en el que dos personas que van caminando por la calle en sentido
contrario están a punto de chocarse y a la hora de elegir el lado para
el que moverse para evitar el choque los dos se mueven a la vez y hacía
el mismo lado. Los dos se van hacia la derecha, los dos se van hacia la
izquierda mientras, poco a poco, se van acercando cada vez más. Este
pequeño “baile incómodo” es el droitwich. Finalmente o bien llega un
momento en el que el movimiento de cada uno de los individuos no
coincide o bien chocan y se disculpan cortésmente.
Siempre podemos pensar que con el tiempo
uno de los equilibrios será el resultante, y en la mayoría de los casos
será cierto. Incluso si las dos personas llegan a chocarse y suponiendo
que seguirán vivos tras el golpe y que no pueden atravesarse, tendrán
que llegar a algún acuerdo (con que uno de ellos establezca claramente
su estrategia valdrá). Pero esta es una clave importante: Si no hay
ningún tipo de información sobre o entre los jugadores (acuerdos,
estrategias dominantes o amenazas creíbles), llegar al equilibrio de
Nash no está asegurado, mucho menos de manera instantánea.
Hacia el equilibrio
En uno de los libros de microeconomía,
clásico por excelencia, que suelo tomar de referencia, el de Mas-Colell,
Whinston & Green, se encuentran las cinco explicaciones básicas
sobre el proceso por el que un sistema llega a uno de los equilibrios de
Nash. Si bien hablaremos en términos coloquiales, tanto por lo que
apuntan los propios autores, como por el tiempo que dista de la
publicación del manual a la actualidad, con casi total seguridad
existirán modelos que expliquen de manera más formal el proceso por el
cual se alcanza dicho equilibrio. Las cinco explicaciones son las
siguientes:
- Equilibrio de Nash como inferencia racional: Puesto que los individuos son racionales y pueden inferir, a través del supuesto de racionalidad del resto de individuos, cuales serán las estrategias del resto de jugadores, se puede pensar que los jugadores sabrán predecir lo que harán sus rivales y, por tanto, adivinar cual será el equilibrio de Nash resultante. Obviamente, los propios autores descartan este caso como una explicación del dilema al que nos enfrentamos. Asumir que los individuos son racionales y tienen información del juego no informa sobre lo que realmente van a hacer el resto de jugadores, mucho menos si estamos frente a múltiples equilibrios de Nash. La inferencia solo sirve para identificar de manera individual los equilibrios de Nash, no para explicar cómo se llega a ellos.
- Equilibrio de Nash como condición necesaria: Esta es el reflejo simplificado del caso anterior. Si solo existe un equilibrio de Nash, todos los individuos lo tomarán como el único equilibrio al que se puede llegar, el resultado obvio del juego y, por tanto, asumirán que es el reflejo de las estrategias finales del resto de individuos. Esto consigue que todos los individuos realicen la estrategia del set del equilibrio de Nash. Pero, de nuevo, solo es aplicable cuando existe un único equilibrio o resultado final obvio, analizable a priori.
- Puntos focales: ¿Qué ocurre si tenemos varios equilibrios de Nash, en el que uno de ellos es Pareto superior al resto? En este caso, si bien todos los equilibrios podrían ser el resultado de un determinado juego o pensamiento estratégico, el equilibrio de Nash con un mayor beneficio se observa como un “punto focal”, un punto que los individuos toman como el más “sensato” de jugar, el más obvio (volvemos al punto anterior). Esto hace que ante varios equilibrios, los jugadores entiendan que se va a tender hacia el mejor (cada uno asume que el resto de agentes también reflexionarán de la misma forma) y que, finalmente, se llegue a este mejor equilibrio de Nash.
- Equilibrio de Nash como acuerdo: Si los jugadores pueden comunicarse antes del juego y quedar estratégicamente en la realización de un set de estrategias que sea un equilibrio de Nash, este resultado se vuelve, de nuevo, un resultado obvio, un punto focal derivado del acuerdo. Esto convierte al equilibrio de Nash escogido como el punto de referencia sobre el que tomar las decisiones individuales que, por tanto, acabaran realizando lo acordado.
- Equilibrio de Nash como convención social: Uno de los equilibrios puede ser el resultado de haber repetido el mismo proceso varias veces, de forma que con el tiempo “brota” o aparece una cierta convención social innata al sistema: Puesto que el individuo A casi siempre hace X, espero que esta vez haga X. Una vez que se alcanza un cierto equilibrio, se mantiene, puesto que todos los individuos esperan que el resto de agentes hagan las mismas estrategias que determinan el equilibrio de Nash. Esta convención también puede establecerse de manera política o normativa. Por ejemplo, los británicos utilizan en sus carreteras un equilibrio de Nash diferente al nuestro (ellos conducen por su derecha, nosotros por nuestra izquierda). Este resultado (derivado de hechos históricos, creo recordar, pero también por el reforzamiento social) indica que una determinada ley puede garantizar o indicar cual será el equilibrio de Nash a realizar en un determinado momento.
Una respuesta insatisfactoria
Pero tras estas cinco explicaciones nos
seguimos encontramos un poco desnudos ante este dilema, pues ninguno da
cuenta realmente de cómo se determina qué equilibrio de Nash resultará
si estos son iguales, ni mediante qué mecanismo.
El punto cuarto y el quinto implican un
acuerdo previo: la transmisión de información privada o social que
inicia el análisis reflexivo de cada individuo a partir de uno de los
equilibrios de Nash (acordados o ya realizados anteriormente) que, por
su condición de equilibrio, será el resultado final.
El punto segundo y tercero tratan de el
proceso en el que uno de los equilibrios resulta inicialmente
favorecido, bien sea porque es el único equilibrio, bien porque es el
mejor. De nuevo, estos serán los puntos focales desde los que comenzar
el análisis, con idéntico resultado.
El primero no es tampoco satisfactorio,
por ser un análisis preliminar, pero no completo, del proceso por el que
se llega al propio equilibrio.
Si bien no hay una simple respuesta satisfactoria, el capítulo acaba con una cita interesante:
“La noción de equilibrio como un punto de reposo al que se tiende tras un cierto proceso de ajuste dinámico implica el uso de la noción tradicional de equilibrio usada en teoría económica. En este sentido, la convención social como la justificación de un determinado equilibrio de Nash es la más cercana a la tradición económica.”
Y en una nota al pie argumenta un poco más lo que esto implica:
“¿Por qué deberíamos esperar alcanzar un equilibrio de Nash en un juego de largo recorrido? Una respuesta es … imaginar que los jugadores siguen simples reglas preestablecidas (a rule of thumb) sobre las estrategias más probables de sus oponentes cuando un juego se ha repetido varias veces”.
Es decir que, a través de la
experiencia, los individuos pueden establecer ciertos conocimientos que
les permitan analizar de manera indirecta las estrategias probables de
sus contrarios. Pero esto, como el propio autor confirma, no es del todo
formal, ni nos ayuda a razonar qué ocurrirá cuando la decisión es única
(cuando, por tanto, no tenemos información previa sobre lo que pueden
hacer el resto de jugadores).
Esto puede no tener ninguna relevancia
(en el caso explicado en el que dos personas casi se chocan, no se
produce ningún resultado de gran relevancia para la teoría económica) o
puede ser decisiva. ¿Qué ocurre cuando la determinación del equilibrio
de un sistema económico (quizás no a nivel macro, pero sí a nivel de una
cierta competencia empresarial, la distribución de la producción, el
resultado de una crisis política…) pasa por la existencia de diferentes
equilibrios de Nash.
En estos casos la historia, el proceso
por el cual se reflexiona, se decide y se actúa (en definitiva, el
camino por el que se transita), tanto de manera individual como
agregada, puede ser decisivo para explicar porqué alcanzamos un
determinado equilibrio.
Así, una vez alcanzado cualquier estado
que podamos denominar de equilibrio, debemos recordar que no podemos
explicar el sistema únicamente mediante la constatación de que es un
equilibrio, sino que debemos añadir la explicación del proceso por el
cual se llego a él y, sobre todo, analizar porqué no se llegó a ningún
otro.
Miguel Puente Ajovin. @caoticaeconomia“Este problema es una de las preguntas abiertas más importantes en teoría de juegos, sobre todo dado el extendido uso del equilibrio de Nash.”