Los diarios de la Guerra de Afganistán de Wikileaks: cómo se realizó la
operación periodística con los datos
Simon Rogers The Guardian 28 de Julio de 2010
Traducido para Rebelión por Ricardo García Pérez
La revelación de miles de archivos de la Guerra de Afganistán hecha por
Wikileaks ha sido una labor de periodismo de datos. Con esto fue con lo que lo
hicimos.
• Consulta
el resumen de datos
• Selección
de The Guardian de los sucesos clave procedentes de los archivos
de Afganistán de Wikieleaks: los datos
Datos
de Wikileaks de los ataques con artefactos explosivos en Afganistán
Bueno, siempre quisimos reportajes basados en datos: ahora los tenemos. En
grandes cantidades. Los esperábamos con ansia. Los diarios
de la Guerra de Afganistán de Wikileaks representan una
victoria fabulosa del periodismo sustentado en datos de investigación, no sólo
para nosotros, The
Guardian, sino también para The New York
Times y Der
Spiegel.
También es una muestra de periodismo con datos en acción. Lo que quisimos fue
posibilitar que nuestro equipo de reporteros especializados extrajera de la
información historias cargadas de humanidad; y nos propusimos analizarla para
dibujar una imagen global, para mostrar el desarrollo real de la guerra.
Ha sido un mes muy ajetreado para quienes hemos trabajado con los datos en The
Guardian; así es como hemos llegado hasta aquí.
Lo que pretendíamos hacer nos dejó claro enseguida que no íbamos a publicar
la base de datos completa. Wikileaks ya iba a hacerlo y nosotros queríamos estar
seguros de no revelar los nombres de los informadores ni de poner en peligro
innecesariamente a los soldados de la OTAN. Al mismo tiempo, debíamos facilitar
la utilización de los datos a nuestro equipo de periodistas de investigación: David Leigh, Nick Davies, Declan Walsh, Simon Tisdall y
Richard
Norton-Taylor. También queríamos que al lector le resultara más sencillo
acceder a la información fundamental, la del mundo real, de forma tan clara y
transparente como fuéramos capaces de presentarla.
Los datos nos llegaron en un archivo de Excel inmenso, compuesto por 92.201
filas de datos, algunas de ellas sin nada en absoluto o con los datos en un
formato lamentable. Todo archivo de Excel que sobrepase las 60.000 filas
ralentiza el programa de forma espectacular; guardar información cuesta un
tiempo largo y penoso (seleccionar la primera fila, desactivar la función de
guardado automático en las preferencias,...). No ayuda a los periodistas a
tratar de buscar noticias entre los datos y resulta demasiado voluminosa para
elaborar informes significativos.
Por fortuna, desde que existe COINS, los
grandes grupos de datos no nos dan ningún miedo. Harold
Frayman, que junto a John Houston suele ocuparse de lidiar con
los datos de formatos pdf y otros para el Datablog, elaboró una
base de datos interna muy sencilla. Ahora los periodistas podían buscar noticias
por palabras o sucesos clave. De repente, el conjunto de datos se volvió
asequible y resultó más fácil generar reportajes relevantes.
Los datos estaban bien estructurados (en este mismo artículo se puede leer
más sobre el funcionamiento de esa estructura); por ejemplo, los sucesos estaban
clasificados, unas veces de forma más fiable que otras.
También empezamos a filtrar los datos para que nos resultara más fácil
relatar uno de los episodios más importantes de la guerra: el aumento de ataques
con artefactos explosivos (por sus siglas en inglés, IED, Improvised Explosive
Device): las bombas de fabricación casera que se depositan en las cunetas y cuya
explosión es imprevisible e imposible de combatir. Este subconjunto de datos
seguía siendo inmenso... pero más fácil de manejar. Entre 2004 y 2009 había en
torno a 7.500 explosiones de artefactos o emboscadas (una emboscada es aquella
situación en la que el ataque con explosivos se combina, por ejemplo, con fuego
de armas cortas o lanzamiento de cohetes o granadas). Se encontraron y
desactivaron otros 8.000 artefactos explosivos caseros. Queríamos ver la
evolución de estos acontecimientos a lo largo del tiempo, así como la imagen
comparativa que arrojaban.
El resultado son los datos que aparecen a continuación, que nos muestran lo
siguiente:
• Los ataques con artefactos explosivos a lo largo del tiempo
• En qué regiones se produjeron
• Información sobre bajas recogida en la base de datos
Pincha aquí
para descargar una vista completa de la plantilla de datos
Los datos de las bajas comportaban escollos especiales; a menudo se habían
recopilado sin exactitud y estaban incompletos. Nosotros les hemos añadido,
además, las bajas registradas por la OTAN para verificar la veracidad de los
datos, y se verá cómo varían.
Pero esta panorámica general no transmite la enormidad de los millares de
explosiones. Hay un lapso de tiempo concreto, los tres días previos a las
elecciones presidenciales del año pasado, en el que se registró la explosión de
más de 100 artefactos. ¿Se imagina cómo se vive en una situación así cada vez
que hay que bajarse de un camión en mitad de la carretera?
Aquí es donde entró en escena el desarrollador Daithí Ó
Crualaoich. Nos ayudó a señalar en un mapa la latitud y la longitud de
cada uno de esos sucesos; y no sólo eso, sino que elaboró un mapa que se pudiera
editar (los diseñadores lo llaman «mapa de vectores»). Y luego el diseñador
gráfico Paul
Scruton consiguió ponerlo bonito para el periódico. Se puede descargar
desde Scrib’d: pincha aquí
para ver los ataques con artefactos explosivos en Afganistán desde 2006 hasta
2009.
Lograr transmitir toda esa información a través de la red es un asunto
distinto; Alastair
Dant (con la ayuda de Igor Clark) elaboró dos gráficos interactivos para
la página web:
• Una
guía interactiva de todos los artefactos explosivos depositados,
elaborada a partir de una base de datos que incorpora los datos geográficos
(para la que Paddy
Allen y Mark McCormick
realizaron las labores de diseño)
• Una
«portada» interactiva para nuestra selección de 300 sucesos
fundamentales.
El equipo de investigadores seleccionó esos sucesos fundamentales porque los
consideró particularmente relevantes; la guía de Alastair ayuda a navegar por
ellos, y si se pincha en cada uno, conduce a una página elaborada por Harold
(para la que Daithi y Lisa van
Gelder realizaron labores de desarrollo esenciales), donde los usuarios
pueden leer el informe completo.
Queríamos sacar lo máximo posible de los datos brutos existentes y hemos
publicado dos grandes grupos de datos:
• La
información completa relativa a artefactos explosivos: un total de 16.000, entre
los que explosionaron y los que se descubrieron y desactivaron
• El
conjunto total de incidentes significativos seleccionados por los especialistas
de The Guardian
Se da la inevitable circunstancia de que la labor que contribuye a perfilar
una historia no es tan estimulante como el propio reportaje. Pero en el futuro,
cuando se vayan haciendo públicos cada vez más conjuntos de datos, serán tareas
a las que los periodistas tendrán que hacer frente. Como escribió
Roy Grenslade hace un par de días, la forma de revelación emergente a
través de Internet, de la que con tanto éxito ha sido pionera Wikileaks en los
últimos dos años, merece nuestro elogio y debe ser defendida frente a las
fuerzas reaccionarias que pretenden evitar que se dé a conocer.
¿Hemos publicado lo suficiente? Por desgracia, no. ¿Hemos empezado a dar
sentido a un conjunto de datos increíblemente complejo? Eso esperamos.
Ahora le toca a usted. ¿Puede ayudarnos a dar más sentido a esta información
en bruto?
DATOS:
Descarga de la hoja resumen.
Fuente: http://www.guardian.co.uk/news/datablog/2010/jul/27/wikileaks-afghanistan-data-datajournalism
¡Hazte voluntario para traducir al español otros artículos como este! manda un correo electrónico a espagnol@worldcantwait.net y escribe "voluntario para traducción" en la línea de memo.
E-mail:
espagnol@worldcantwait.net
|