¿Qué ocupa las portadas de los periódicos antes del estallido de una guerra? ¿Qué palabras definen un conflicto? Hannes Mueller, investigador en el Instituto de Análisis Económico del CSIC en Barcelona, y Christopher Rauh, actualmente en la Universidad de Cambridge, estudian cuáles son las claves para predecir un conflicto. En su proyecto, han desarrollado un algoritmo que recoge la información de los principales periódicos y evalúa qué temas son recurrentes justo antes de que estalle un conflicto.
El algoritmo recoge las noticias de los principales periódicos para evaluar qué temas son recurrentes antes del estallido de un conflicto. Imagen: PixaBay.El algoritmo creado por el equipo se basa en el “aprendizaje sin supervisión”, es decir, se le facilitan datos (en este caso, los textos de artículos de prensa) y éste busca patrones de forma automática. En el estudio, estos patrones son temas que resumen el texto, configurados a partir de las palabras que el sistema encuentra y analiza. El algoritmo localiza patrones que se corresponden con temáticas como economía, política, guerra o conflicto, aunque “a veces hay temas que son menos claros”, según el investigador. Todos ellos se utilizan para realizar la predicción.
Mueller destaca que, si bien hay ciertos temas que tienen preponderancia justo antes de una guerra civil, la presencia de otras temáticas baja. Por ejemplo, el estudio ha demostrado que un descenso en la cobertura de noticias de economía o justicia puede señalar la posibilidad de un conflicto. Esta relación, recuerda Mueller, “es correlación, no es causa”. Es decir, estos indicadores sirven para realizar predicciones, pero no apuntan a las causas.
Innovación en el proyecto
Los algoritmos basados en el “machine learning” o aprendizaje automático y las herramientas de predicción son sistemas ampliamente utilizados en ciencias sociales. La novedad del proyecto del IAE-CSIC consiste en combinar tecnologías de “machine learning” para predecir el conflicto. El equipo emplea aprendizaje no supervisado para descubrir los temas dentro de cada texto y, posteriormente, aprendizaje supervisado para realizar la predicción.
La investigación emplea técnicas de aprendizaje automático, tanto supervisado como no supervisado, para realizar la predicción
Los investigadores registran las noticias de cada año y evalúan la eficacia de la herramienta haciendo una comparación con el año sucesivo, es decir, los datos de 2001 sirven para predecir el conflicto en 2002. Esta prueba confirma que el algoritmo es capaz de predecir el conflicto.
El verdadero trabajo, según el investigador, ha radicado en descargar los 3,8 millones de artículos que ha evaluado el algoritmo, un click tras otro. Una tarea tediosa para la cual el grupo contó con algunos ayudantes de investigación. Estas personas hacían la descarga de los artículos y revisaban los contenidos para garantizar su correcto procesamiento. De los casi 4 millones de artículos descargados, 3,1 provienen del BBC Monitor, una herramienta desarrollada durante la Guerra Fría para obtener información de periódicos locales de todo el mundo.
Riesgo de violencia en España a partir de la investigación. Imagen: IAE-CSIC.La muestra recoge las noticias de las últimas dos décadas, donde el impacto de las “fake news” o noticias falsas, que recientemente ha aumentado, era más limitado. No obstante, los resultados de los últimos años indican que el algoritmo no se ve perjudicado por este hecho, ya que “la propaganda siempre ha formado parte de las noticias”, apunta el investigador.
Los factores que llevan al conflicto armado
Hannes Mueller señala la exclusión política como uno de los factores más importantes en el estallido de un conflicto. “Siempre, siempre. Lo puedes ver en cada conflicto, hay un elemento de una gente que se siente excluida del proceso político”, explica Hannes, que además señala los factores económicos y climatológicos (como, por ejemplo, la sequía en Siria) como otros causantes de conflicto. La polarización étnica o la desigualdad económica son otros factores que pueden influir en estos procesos, según apuntan investigaciones previas realizadas en el IAE-CSIC.
La exclusión política es uno de los factores más importantes en el estallido de un conflicto
El objeto de la iniciativa, sin embargo, no se centra en los factores que conducen a un conflicto armado. “Eso es otra parte de la investigación”, explica Mueller, y añade que, si bien lo trabaja, “no tiene nada que ver con predicción”.
La fuerza de la repetición: conflict-trap
El investigador explica que algunos países como Afganistán, Somalia o República Democrática del Congo incurren en lo que se denomina “conflict-trap” (o “trampa de conflicto”, en castellano); es decir, se enfrentan constantemente a guerras o tensiones internas y externas. A pesar de ello, puntualiza, esta trampa no es permanente. “Se puede salir de esa conflict-trap, pero se tarda un tiempo: una década, más o menos. Si la paz dura una década, [se considera que el país] ya ha salido de la fase de conflicto”, señala.
Sin embargo, el desafío no es predecir el conflicto en estas naciones, sino en países que no se enfrentan a él constantemente y que tienen una probabilidad inicial muy baja. En estos casos, una de cada diez proyecciones estimadas con el algoritmo será un conflicto real.
Un país sale de la denominada conflict-trap cuando la paz dura una década, ya que se considera que ha salido de la fase de conflicto
Acertar una de cada diez predicciones parece un índice bajo, pero ha de tenerse en cuenta que predecir el conflicto es difícil y complejo. Varios factores dificultan la predicción. “El primero es que las sociedades son muy complejas”, asegura Mueller, ya que se componen de actores humanos que suman imprevisibilidad a los estudios. En segundo lugar, en que las predicciones y los sistemas sociales se retroalimentan. “Si tú haces proyección en sistemas sociales, los sistemas sociales pueden reaccionar a tu proyección”, elabora el investigador. Por último, la cantidad de datos es determinante para una buena predicción: a mayor número de datos, mejor es el aprendizaje del algoritmo y, en consecuencia, mejor es la predicción.
A pesar de las dificultades para predecir, el investigador asegura que los datos proporcionados por el algoritmo en 2017 indicaban que podría generarse un conflicto en Yemen, un hecho que se ha confirmado. “En el 2017 lo que tuvimos era Yemen. Yemen era uno [de los países en los que se predijo el conflicto] y mira lo que está pasando”, dice Mueller.
Aplicaciones futuras del modelo
Hannes Mueller, investigador del proyecto, en el Instituto de Análisis Económico. Imagen: Sabela Rey Cao.El modelo aún está en fase académica, aunque Mueller espera establecer una colaboración con el Banco de España para ampliar el proyecto fuera del entorno académico y desarrollar un índice de riesgo político. Esta colaboración permitiría realizar una predicción más acertada en todo el mundo y ampliar la base de datos. “Si tenemos tiempo y recursos, vamos a hacerlo con el enfoque de América Latina”, comenta el investigador.
Mueller asegura que prefiere trabajar con actores públicos, como el Banco de España, para que pueda demostrarse que el algoritmo funciona y hacer públicos los datos, evitando así los intereses privados de inversores que se han interesado por el proyecto, porque podrían “aumentar el problema”.
Paula Talero Álvarez y Sabela Rey Cao - Delegación del CSIC en Cataluña