Notas técnicas sobre el estudio de patrones en el análisis de Inteligencia Militar utilizando software libre

Versión para impresiónVersión para impresión

Análisis GESI, 4/2017

Resumen: Este artículo introduce los conceptos de análisis  de patrones en  inteligencia militar para ayudar al comandante en el teatro de operaciones a obtener una visión táctica rápida y permitir la planificación en un tiempo reducido.

También explora las posibilidades que ofrece la utilización de software libre como alternativa a  los software de análisis en inteligencia convencionales como el i2 Analyst´s Notebook  o el Palantir, para ofrecer al oficial de inteligencia posibles alternativas ante posibles contingencias.

*****

INTRODUCCION

La recopilación de información y el análisis de patrones ayudan al comandante a la protección de su fuerza y a la visión del teatro de operaciones porque representan las potenciales amenazas relevantes que pudieran afectar al entorno operativo y táctico.

El estudio y análisis de patrones es una parte esencial en la formación de cualquier oficial de inteligencia militar. Su espectro de aplicación  abarca desde el diseño de operaciones de la guerra convencional hasta los conflictos asimétricos como la lucha de guerrillas o el terrorismo.

La finalidad de estas técnicas es realizar una labor prospectiva a corto o medio plazo que ayude al comandante en el campo de operaciones a la implementación de una táctica precisa y acertada maximizando la utilidad de los medios materiales y humanos disponibles. De igual forma, le suministran información para mantener en todo momento una orientación proactiva y no reactiva. Entre otras utilidades podemos destacar la predicción de futuros ataques o emboscadas, posibles rutas, el establecimiento de índices de riesgo zonal y los cálculos de tiempos de respuesta estimados.

La información se recopila por diferentes medios mientras se realizan las operaciones de combate, esto es, inteligencia humana sobre el terreno (HUMINT), que incluye el patrullaje de los soldados, los puestos de control y las entrevistas de campo, el reconocimiento aéreo, la imágenes de satélites (IMAGINT) y la interceptación de comunicaciones (COMINT).

La predicción mediante patrones espaciales fue ampliamente utilizada en Irak durante la “Operación Libertad duradera” como ha señalado el teniente coronel Stephen R. Riese. (Riese, 2006, pp.42-43). Por describir solo otro ejemplo de la utilización de patrones, la cuarta división de infantería del Ejército de los EE.UU logró capturar a Saddam Hussein gracias al link pattern analysis[1] realizado por dos jóvenes analistas de inteligencia[2], que elaboraron dicho análisis sin apenas medios y sin la ayuda de ninguno de los modernos software en inteligencia. Realizaron el trabajo de forma tediosa, con el uso de post-it en un gran mural, pero el tiempo y la energía dedicados podrían haberse reducido sustancialmente con el uso de los modernos software y las bases de datos actuales.

Tradicionalmente el análisis y la visualización de patrones ha sido un campo abonado para los SIG (Sistemas de Información Geográfica) y los diferentes software de inteligencia convencionales. El hecho de poder realizar dichos análisis con un software libre como R, no ha sido explorado hasta épocas recientes y es poco utilizada hasta el momento pero puede servir de alternativa eficaz para el oficial de inteligencia.

 

1. TIPOS DE PATRONES

Un patrón es una regularidad perceptible en el mundo natural o en un diseño hecho por el ser humano. Los patrones naturales pueden observarse directamente con nuestros sentidos. Tal es el caso, por ejemplo, de meandros, simetrías, espirales, ondas y un largo etcétera. Por otro lado, existen patrones artificiales que sólo pueden ser observados mediante el análisis profundo. Evidentemente la búsqueda de este tipo de regularidades es importante en el análisis de inteligencia porque nos ayuda a predecir eventos y sucesos.

El término “teoría de patrones” fue introducido por Ulf Grenander en los años 70 como un nombre para un campo de las matemáticas aplicadas que proporcionó un marco teórico para un gran número de ideas en campos como la inteligencia artificial, el reconocimiento de voces e imágenes y el modelado estadístico.

Existen muchos tipos de patrones pero, desde un punto de vista metodológico, podemos dividirlos en dos grupos: patrones básicos y patrones híbridos. La conjunción de dos o más patrones básicos da como resultado un patrón híbrido.

En inteligencia militar normalmente se busca conseguir un patrón híbrido llamado patrón de actividad, que, a su vez, es la fusión de dos patrones básicos: el patrón espacial y el temporal. Otro ejemplo podría ser el patrón clima que es, a su vez, la conjunción de patrones básicos como la temperatura, las precipitaciones o incluso la humedad. Evidentemente la forma de estudiar cada patrón viene determinada por su propia naturaleza y la naturaleza de los datos. Así por ejemplo, para analizar un patrón de actividad nos vemos obligados a recurrir a la estadística espacial y para analizar un patrón clima debemos recurrir obligatoriamente a las series temporales.

 

2. PATRÓNES ESPACIALES

2.1. Geocodificación y visualización de Hot Spots utilizando R

Parece claro que, a día de hoy, R se ha convertido en la herramienta Open Source de referencia para análisis estadístico. R es conocido como un potente lenguaje extensible y relativamente rápido de programación estadística, también como proyecto de software de código abierto con una interfaz  de  línea de  comandos  multiplataforma y, en definitiva, como un entorno consistente para el desarrollo de procesos de cálculo estadístico y análisis de datos. 

Lo que es menos conocido es que R es también una herramienta que, debido a su extensibilidad, puede comportarse como un sistema de información geográfica (SIG) con todas las funciones de análisis en el sentido pleno de la palabra, aunque sus capacidades de visualización y representación sean bastante más limitadas que las de los SIG tradicionales como es el caso del ArcGIS de ESRI. 

El paquete ggmap y su uso combinado con los mapas estáticos de Google Maps o de Cartociudad (en el caso de España) permiten la visualización de información espacial. La idea básica que subyace en el ggmap es tomar una imagen de un mapa descargado y trazar en primera instancia una capa de contexto utilizando ggplot2 para, a continuación, trazar capas de contenido adicionales de datos o estadísticas en la parte superior del mapa. El proceso, pues, se divide en dos fases. En una primera fase se descarga la imagen y se le da formato para el posterior trazado con la función get_map. En la segunda fase se construye la trama con ggmap y qmap (Kahle y Wickham, 2013, p.146).

Los Hot Spot son una técnica de análisis popular que tuvo su origen en el ámbito policial y se utiliza para ayudar a identificar dónde dirigir los recursos policiales en aras de la reducción de la delincuencia. En esencia, es una técnica predictiva que, basándose en datos retrospectivos, nos ayuda a identificar las áreas con una alta concentración de la delincuencia. Básicamente, y tal y como lo define Lawrence W. Sherman, un “Hot Spot” o punto caliente es un área reducida donde la frecuencia de los delitos o eventos estudiados es lo suficientemente grande como para establecer predicciones, al menos durante un período de un año. (Sherman, 1995, p.36). Su aplicación al ámbito militar parece obvia y más aún cuando hablamos de los modernos conflictos asimétricos.

Un punto importante a tener en cuenta a la hora de la interpretación es que los Hot Spot no necesariamente se identifican con los valores más altos, sino que se basa en la proximidad entre sucesos o eventos.

Aunque normalmente en inteligencia militar se proporcionan directamente las coordenadas de longitud y latitud, me parece interesante recordar al lector que R también dispone de paquetes para la geocodificación de direcciones. En uno de mis últimos análisis me encontré con, al menos, dos opciones para la geocodificación. La primera de ellas se basa en utilizar el paquete ggmap junto con los mapas de Google y la segunda utiliza el paquete RJSONIO junto con los mapas de Cartociudad. La mayoría de las veces apliqué la primera opción reservando la segunda para casos o direcciones más difíciles.

Una vez obtenidas las coordenadas de longitud y latitud mediante una de las dos formas de geocodificación, estamos en condiciones de poder dibujar los mapas y visualizar los “Hot Spots”. Para ello podemos apoyarnos en los paquetes ggmap y ggplot2.

El primer mapa es una visualización sencilla de los casos mediante puntos, el segundo, en cambio, incorpora un gradiente a color, que nos indica el Hot Spot propiamente dicho. En este caso se sitúa claramente en uno de los lados de la ría de Vigo.

 

 

2.2. Cálculo del Centro de Gravedad

Antes de continuar se hace necesaria una pequeña aclaración para aquellos lectores más familiarizados con el vocabulario de la estrategia militar, pues el término utilizado puede prestarse a confusión. Aquí entendemos el centro de gravedad en términos de localización y no en el sentido que ya le diera Clausewitz, que definió el centro de gravedad como “el centro de todo el poder y movimiento de lo cual todo depende…el punto sobre el cual deben ser dirigidas todas nuestras energías”.

El cálculo del centro de gravedad es una técnica comúnmente utilizada en investigación de operaciones militar con el fin, por ejemplo, de elaborar una estrategia de localización para una base logística o un hospital militar (Role 3)[3] teniendo en cuenta la distancia a los diferentes frentes de batalla y los tiempos de llegada y ponderándolos según su importancia relativa.

Pero más allá de sus usos en estrategia de localización, el centro de gravedad también puede dar al comandante en el área de operaciones una idea precisa de donde se sitúa el centro geográfico de todas las incidencias o cuánto de dispersas están.

Básicamente hay dos procedimientos para calcular el centro de gravedad: utilizando la media o la mediana. El primer procedimiento identifica el centro geográfico de un conjunto de observaciones y el segundo identifica la localización que minimiza la distancia euclídea de un conjunto de observaciones.

Hay que tener en cuenta que la selección del procedimiento no es ni mucho menos arbitrario, pues la presencia de “outliers” hace que la media arroje unos resultados completamente distorsionados (recordemos que la media es muy sensible a la presencia de datos atípicos) y, por tanto, se hace necesaria la implementación de la mediana.

 

A modo de ejemplo, siguiendo con el análisis anterior, se han calculado y graficado el centro de gravedad mediante ambos procedimientos para poder observar así las diferencias.

 

 

Como podemos observar, los resultados aplicando uno y otro método difieren bastante por la presencia de datos extremos o outliers. En concreto, el caso que hemos visto anteriormente es significativo porque, a pesar de que el centro de gravedad calculado mediante la media no está muy alejado del centro de gravedad calculado mediante la media hablando en términos de distancias, sí es significativamente diferente en términos geográficos porque se trataría de escoger un lado u otro de la Ría de Vigo. Y esto, hipotéticamente, para un comandante en un área de operaciones fronteriza bien podría suponer pasar de un país a otro.

 

2.3. Predicción de pautas espaciales (PAI)

La predicción de pautas espaciales es una  de  las  técnicas  emergentes  en  el  campo  del análisis de patrones espaciales. Aunque originariamente proviene del ámbito del análisis criminal su aplicación a otros campos como los escenarios bélicos parece coherente y útil para proporcionar inteligencia accionable en tiempo y forma adecuados para la toma de decisiones del comandante en el terreno de operaciones.

Para  la  elaboración  de  este  apartado  se  ha  seguido  la  línea  del  trabajo  de  Spencer Chainey, Lisa Tompson y Sebastian Uhlig, que, basándose en las ideas de Browers, desarrollan la  elaboración  de  una  metodología, proponiendo un índice de predicción basado en los hot spots; el denominado Prediction Accuracy Index (PAI).

En los últimos años, los analistas de inteligencia militar han comenzado a estudiar medidas que se pueden utilizar para predecir globalmente donde puede ocurrir los nuevos ataques del enemigo, siempre en el corto plazo[4]. Una medida obvia sería la tasa de éxito, esto es, el porcentaje de nuevos ataques que se producen dentro de las áreas donde se ha predicho que ocurrieran gracias a ataques anteriores. Pero es fácil de entender que esta medida no toma en cuenta el tamaño de las áreas en las que se prevé que se produzcan esos ataques. Esto hace que las conclusiones sean de poca utilidad para los profesionales que, entre otras cosas, tienen la necesidad de construir una planificación táctica a corto plazo y  saber dónde dirigir sus recursos para maximizar su utilidad en términos de optimización.

La utilización de esta técnica hace necesario el haber calculado antes los Hot Spots. Se trata, pues, de una técnica dependiente de la anterior.

El Prediction Accuracy Index (PAI) queda formulado de la siguiente manera: 

Donde n = número de incidentes dentro del hot spot objeto de estudio, N = número de incidentes dentro de la zona de estudio, a = área del hot spot objeto de estudio y A = área de la zona de estudio.   

El resultado del proceso se resume en un total de seis ataques en el periodo de estudio, de los cuales 4 se dieron dentro del Hot Spot, con un área (a) de 3.314,40Km2 dentro de una zona de estudio (A) de 14.926 Km2. Finalmente podemos proceder al cálculo de la ecuación PAI.

Este valor PAI nos indica que se ha conseguido predecir ((n/N)*100) un 66,66% de los incidentes totales, dentro del 22,20% ((a/A)*100) del área total de la zona de estudio.

 

3. PATRONES TEMPORALES

La contextualización temporal y horaria puede realizarse de una forma simple con R que, además de graficar los descriptivos, nos da la oportunidad de recodificar nuestras variables originales si esto fuese necesario. Es decir, por poner solo un ejemplo, puede que al comandante en el teatro de operaciones no le interese saber la hora exacta de las observaciones sino si estás se han producido en horario de mañana, tarde o noche. Ello implicaría tener que recodificar nuestra variable original horaria en otra con tres categorías.

No obstante, las capacidades de visualización en R en este tipo de patrones son más limitadas que en un SIG tradicional. Hay que tener en cuenta que los Hot Spots pueden tener un componente dinámico que los haga variar de un periodo temporal a otro. Los incidentes en el teatro de operaciones pueden sufrir cambios significativos en cuestión de semanas. En los SIG podemos observar esas variaciones temporales en forma de animaciones. Esto último es de especial utilidad a la hora de realizar presentaciones o un briefing informativo para los superiores encargados del nivel estratégico. Con la ayuda de R solo podemos ir presentando las imágenes de los diferentes mapas en diferentes periodos de tiempo, pero básicamente la información es la misma.

También se pueden realizar patrones temporales con la ayuda de Excel pero esto solo sirve para los casos más sencillos en los que ni tan siquiera es necesario tratar los datos o recodificar las variables. Debajo aparece la frecuencia de número de número de llamadas interceptadas durante las cuatro semanas de un mes.

 

 

4. PATRÓN CLIMA

El patrón clima es un patrón híbrido resultado de la conjunción de dos patrones básicos, el patrón temperatura y el patrón precipitaciones. Esta es la forma más  usual, pero también podemos construir un patrón clima jugando con otro patrón básico como puede ser el grado de humedad.

Resulta evidente que para realizar este patrón debemos trabajar con series temporales. La información no es sencilla de obtener y, a menudo, se tiene que recurrir a los servicios metereológicos de los distintos cuerpos de las FAS o bien recurrir a medios privados. Un ejemplo de esto último puede ser: www.weathertrends360.com

Para la modelación de la serie se recurre a modelos que aparecen en la literatura usual sobre el tema como el modelo ARIMA, ARMA o el alisado exponencial. El forecast o predicción siempre es la diferencia entre los valores observados y los valores predichos en términos absolutos.

Es importante tener acceso a los datos lo más desagregados posible y con el mayor histórico posible, porque el nivel operativo requiere unas exigencias mayores que el nivel táctico o estratégico. Por ejemplo, si queremos realizar un análisis a nivel operativo, trabajaremos normalmente con la serie en fechado diario, si el nivel es el táctico, quizás debemos trabajar con las series en fechado semanal y si es a nivel estratégico seguramente escogeremos entre el fechado mensual y el anual.

En general, a partir de esta información, podemos realizar estimaciones acerca de cómo será el clima de determinada región en determinados días, meses o años, información de gran ayuda para la planeación estratégica, táctica, logística y operativa.

Normalmente se realizan dos transformaciones a los datos tanto de la serie de temperatura como de la de precipitaciones.  La primera transformación se realiza para obtener la serie del Ciclo, que es la media de temperatura o precipitaciones tomada en el mismo mes o la misma semana esto es, la media de temperatura de todos los eneros, febreros, marzos, etc (o de la primera semana de Enero, la primera semana de Febrero, la primera de Marzo, etc, si el fechado es semanal)

La segunda transformación es normalizar los ciclos para que estén acotados entre 0 y 1.

 

Algunos de los paquetes de R para el análisis de series temporales vienen especificados en el siguiente cuadro:

Juan Pablo Somiedo es analista y profesor de metodología de análisis en Inteligencia en el curso de Experto en Inteligencia de la Universidad Autónoma de Madrid

 

BIBLIOGRAFÍA

BENNET, L., VALE, F. (2015). Spatial Statistics: Simple ways to do more with your data, Technical workshop. Consultado en linea en la web: http://proceedings.esri.com/library/userconf/proc14/tech-workshops/tw_192.pdf el 01/07/2016 el 01/07/2016.

CHAINEY, S., TOMPSON, L. y UHLIG, S. (2008). The Utility of Hotspot Mapping for Predicting Spatial Patterns of Crime, Security Journal, Nº 21, pp. 4-28. Consultado en linea en la web: http://www.palgrave-journals.com/sj/journal/v21/n1/pdf/8350066a.pdf con fecha 22/04/2016

CHATFIELD,C. (1985). The Initial Examination of Data, J.R. Statist.Soc, vol 148, nº3, pp. 214-253. Consultado en linea en la web: https://www.researchgate.net/publication/247914083_The_Initial_Examination_of_Data con fecha 25/04/2016.

KAHLE, D. y WICKHAM, H. (2013). Ggmap: Spatial visualization with ggplot2, The R Journal, Vol 5/1. Consultado en linea en la web: https://journal.r-project.org/archive/2013-1/kahle-wickham.pdf  con fecha 22/04/2016.

SHERMAN, L.W.(1995). Hot spots of crime and criminal careers of places, en Eck, J.; Weisburd, D.(Eds), Crime and Place. Criminal Justice Press, Monsey & Oikuce Executive Research Forum, Washington D.C., pp 35-52. Consultado en línea en http://www.popcenter.org/library/crimeprevention/volume_04/02-Sherman.pdf con fecha 01/07/2016.

RIESE, Stephen R.(2006).Templating and Adaptative Threat. Spatial Forecasting in Operations Enduring Freedom and Iraqi Freedom. Enginner Review.


[1] El link pattern analysis es una de las técnicas de análisis más conocidas aunque solo sea por sus apariciones en el cine. Habitualmente podemos observar cómo los analistas colocan en una pizarra los rostros de los sospechosos de pertenecer a una organización criminal y van situando a cada cual en su puesto dentro de la organización y las relaciones entre ellos. Aunque, para ser sinceros, lo de la pizarra se ha quedado antiguo y ahora todos los software de inteligencia permiten realizar un link análisis incluyendo las fotos de los sospechosos, las relaciones y diversos atributos.

[2] Esos jóvenes analistas fueron la teniente Ángela Santana y el cabo Harold Engstrom de 31 y 36 años respectivamente. Su trabajo consistía en surtir de información a la Cuarta División de Infantería para erradicar las células de resistencia que se oponían a la ocupación estadounidense en Irak.

[3] El término “Role” se emplea para nombrar los cuatro niveles que pueden tener las capacidades médicas de una unidad sanitaria militar. El hospital de campaña está catalogado como Role 3. Esto quiere decir que tiene todos los servicios propios de un hospital en el mismo terreno de operaciones, por lo que no resulta necesario que el paciente sea evacuado, ya que puede ser intervenido, tratado, medicado y pasar la convalecencia en estas instalaciones sin necesidad de ser trasladado.

[4] Evidentemente aquí hablamos de una planificación a corto espacio de tiempo y suponemos que el escenario de confrontación es lo suficientemente estable para no variar en ese espacio de tiempo.

 

Editado por: Grupo de Estudios en Seguridad Internacional (GESI). Lugar de edición: Granada (España). ISSN: 2340-8421.

Licencia Creative Commons
Bajo Licencia Creative Commons Atribución-NoComercial-SinDerivadas 3.0 Unported