lunes, 19 de mayo de 2014

Así aprendemos a cooperar


Un estudio modeliza por primera vez el proceso por el que los humanos establecemos comportamientos altruistas.
Journal of the Royal Society Interface

¿Qué mecanismos nos impulsan a cooperar? Un estudio formula el primer modelo matemático que reproduce el comportamiento observado en humanos.

Cooperar consiste en sacrificar parte del beneficio propio en aras del bien común. Lejos de ser exclusivo de los humanos, dicho comportamiento se observa en todo tipo de seres vivos, desde las bacterias hasta los simios. Sin embargo, aunque su utilidad resulta clara a posteriori (revierte en el bien del grupo y, por ende, en el del individuo), el mecanismo por el que se establece una conducta altruista no se entiende bien en términos evolutivos. Cuando un macaco despioja a otro, invierte en esa actividad un tiempo y una energía que podría aprovechar para buscar alimento o pareja. ¿No debería una criba darwinista seleccionar los comportamientos que reportan el máximo beneficio para el individuo?
Los humanos somos la especie más cooperativa que existe. Desde hace años, son varios los mecanismos que se han propuesto para explicar la emergencia de la cooperación; entre ellos, corresponder a (o traicionar) quienes antes nos han ayudado (o no), o imitar las acciones de aquellos individuos que vemos que obtienen un mayor provecho. Aunque estos y otros mecanismos resultan satisfactorios desde un punto de vista teórico, hasta hace poco su validez no había sido puesta a prueba mediante experimentos con humanos.
En 2010 y 2012, investigadores de la Universidad Carlos III de Madrid y la Universidad de Zaragoza llevaron a cabo los primeros ensayos a gran escala con sujetos reales. Observaron que, cuando los miembros de una red social jugaban repetidas veces al dilema del prisionero (un juego tipo en esta clase de estudios), la probabilidad de que un individuo cooperase o no quedaba condicionada por sus acciones previas. Quienes habían traicionado una vez volvían a hacerlo en la ronda siguiente con una probabilidad fija; sin embargo, quienes cooperaban eran más propensos a volver a hacerlo si sus vecinos se habían comportado de manera altruista.
Ahora, Giulio Cimini y Anxo Sánchez, del Grupo Interdisciplinar de Sistemas Complejos de la Universidad Carlos III, han referido el primer modelo matemático que reproduce con acierto ese comportamiento. Los resultados fueron publicados hace unas semanas en la revista Journal of the Royal Society Interface.
Los autores simularon numéricamente el dilema del prisionero en redes de jugadores con varias topologías. Tras programar en los agentes un gran número de estrategias plausibles, comprobaron que la única que reproducía el comportamiento observado experimentalmente en humanos era la que denominaron «aprendizaje por refuerzo». En ella, cada agente partía con ciertas aspiraciones sobre el beneficio que esperaba obtener; tras actuar, comparaba el resultado de sus acciones con dichas expectativas y actualizaba su estrategia en consecuencia.
«La cooperación condicional [colaborar o no dependiendo de cuánta ayuda hayamos recibido con anterioridad] parece un intento de que se establezca la cooperación, pero poniendo un límite de hasta dónde está uno dispuesto a que lo exploten», explica Sánchez. «Lo realmente sorprendente es que la disposición a cooperar dependa de haberlo hecho antes. La estrategia debería ser siempre la misma, y no tener ese aspecto de "enfado", de "vaya, como ya me habéis fastidiado, ahora os voy a traicionar un buen rato". No encuentro ninguna intuición clara que justifique esa estrategia, más allá del —por otra parte muy humano— deseo de vengarse.»
Según los autores, el trabajo corrobora los resultados experimentales obtenidos en 2010 y 2012; estos, a su vez, parecen invalidar buena parte de las dinámicas evolutivas propuestas desde hace años para explicar la emergencia de la cooperación, al menos en humanos.
«Muchos de los modelos teóricos previos partían de la hipótesis de que la decisión de un individuo usaba los beneficios de los demás de una forma u otra; por ejemplo, imitando lo que hizo el jugador que ganó más la vez anterior. Nuestros experimentos y este trabajo teórico muestran de manera definitiva que esto no es así, que la gente decide basándose en las acciones de los otros, pero no en lo que ganen», apunta Sánchez. «Creo que cualquiera que lidere un equipo de trabajo tiene que entender que esta es la manera en que se comporta la gente», concluye el investigador.
Más información en Journal of the Royal Society Interface. Una versión gratuita del artículo técnico se encuentra disponible en el repositorio arXiv.

No hay comentarios: