Panama Papers: Mar Cabra, editora de datos del ICIJ, habla del desafío de analizar 11 millones de documentos

Por Natalia Mazotte
7 junio, 2016

Los Panama Papers, la mayor filtración de documentos en la historia del periodismo, dio origen a un esfuerzo global de investigación que contó con la participación de casi 100 periodistas latinoamericanos y que permitió desentrañar el funcionamiento de los paraísos fiscales. Liderado por la periodista española Mar Cabra, el equipo de periodismo de datos del Consorcio Internacional de Periodistas de Investigación (ICIJ por sus siglas en inglés) fue el cerebro de este trabajo, que requirió el análisis de 11,5 millones de documentos y demostró que el manejo de grandes bases de datos es cada vez más esencial en las investigaciones periodísticas.

En la primera etapa del proyecto, que se publicó a principios de abril de este año, Mar Cabra y su equipo estructuraron 2,6 terabytes de información filtradas del bufete de abogados panameño Mossack Fonseca y compartieron los datos con reporteros de diferentes países. El 9 de mayo, el ICIJ hizo pública parte de la base de datos que les tomó casi un año diseñar y analizar, lanzando de manera oficial la Offshore Leaks Database. En los primeros seis días, la página tuvo casi 35 millones de visitas.

“Nosotros trabajamos los datos, determinamos nuestras historias y expusimos los datos al público. Ahora la gente puede buscar sus historias, sean o no parte de nuestros medios asociados. Comenzó una nueva etapa de los Panama Papers, cuando el ciudadano se convierte en un investigador”, resaltó Cabra.

En entrevista con el Centro Knight para el Periodismo en las Américas, la periodista habló sobre el trabajo de su equipo en el ICIJ, las posibilidades que se abren por la colaboración entre periodistas y programadores, y la relevancia del periodismo de datos para volver a despertar el interés del público en los grandes reportajes de investigación.

Centro Knight: ¿Cómo comenzó a trabajar con el periodismo de datos?

Fui a estudiar periodismo de investigación en la Universidad de Columbia con una beca Fulbright. Allí descubrí el trabajo del periodismo de datos y me enamoré. Me ayudó a contar historias de una manera más potente, más sistemática, que no dependía tanto de las declaraciones. Me gradué en 2010, volví a España y me contrataron en el ICIJ para trabajar como periodista de investigación y de datos. En España, ayudé a crear el primer máster de periodismo de investigación, datos y visualizaciones en El País, y continué desarrollando actividades para promover este campo. Por eso, cuando el Consorcio pensó en crear en 2014 un equipo específico de periodismo de datos, me llamaron para liderarlo.

CK: ¿Cómo funciona el trabajo del periodismo de datos dentro del ICIJ?

El ICIJ siempre ha hecho investigaciones que requieren trabajo con datos. Desde el año 2011, no ha habido ninguna investigación en la que haya participado para el ICIJ que no involucre trabajo con datos, solo que antes no había un equipo específico, este comenzó en 2014. Empezamos dos programadores y yo. El equipo ha crecido y ahora tenemos siete personas - cuatro programadores y tres periodistas - entre ellos cuatro mujeres. Trabajamos en tres direcciones: hacer análisis de datos para profundizar y descubrir nuevas historias, ayudar con productos interactivos de investigación y el desarrollo de herramientas para fomentar la colaboración entre periodistas de diferentes países, como la plataforma que creamos para buscar entre los más de 11 millones de documentos de los Panama Papers.

CK: Teniendo en cuenta la estructura del ICIJ, ¿es este un equipo grande?

El equipo de periodismo de datos es aproximadamente el 50 por ciento del personal y es fundamental para el ICIJ, es una de las principales áreas de la organización. Hemos ido creciendo en los últimos dos años porque la demanda fue aumentando. Recuerdo que mis jefes preguntaban ‘pero vamos a contratar dos programadores, ¿será que tenemos trabajo para ellos?’, y yo les decía que sí. En poco tiempo les avisé que teníamos que contratar un programador más. Uno de los programadores llegó a trabajar sólo en los Panama Papers, porque era un desafío muy grande lidiar con una cantidad masiva de datos, así que era necesario procesarlos y necesitamos ayuda extra. El equipo fue creciendo orgánicamente, por las necesidades que fueron surgiendo y el importante papel que los datos y la tecnología tienen en nuestro día a día.

CK: ¿Cuál fue la primera reacción que tuvo cuando vio los documentos filtrados?

Al recibir los documentos la primera reacción fue “Dios mío, ¿cómo vamos a lidiar con esto?”. Fue un reto interesante, ya habíamos aprendido en las investigaciones anteriores hechas con documentos filtrados que necesitábamos invertir tiempo analizando los datos antes de comenzar cualquier reportería. En los Panama Papers aplicamos varias de las lecciones aprendidas en los proyectos anteriores, que nos ayudó a no cometer los mismos errores.

CK: ¿Qué tiene de diferente este proyecto en comparación con los anteriores?

La cantidad de datos. Para los Offshore Leaks, en 2013, trabajamos con 260 gigabytes de información y los Panama Papers fueron de 2,6 terabytes, ¡muchísimo más! También formamos un equipo transnacional con más de 370 periodistas, lo que exigía un trabajo de coordinación y manejo de datos muy grande. ¡Imagina tener casi 400 personas mandándote preguntas! Desde el punto de vista del contenido, esta filtración nos permitió entender el funcionamiento de los paraísos fiscales como nunca antes porque Mossack Fonseca es una de las principales empresas en el mundo en la creación de sociedades en paraísos fiscales y tenía clientes de muy alto nivel. Esto también hizo que periodísticamente el contenido fuera más interesante.

CK: ¿Y cómo trabajaron con esa cantidad de datos?

Ya habíamos creado una serie de herramientas utilizadas en proyectos anteriores y este caso nos sirvió para que pudiésemos mejorarlas. Creamos un foro de comunicación, una especie de Facebook para los periodistas, y todo lo que nos encontrábamos, lo comunicábamos por allí, como una sala de redacción virtual. También teníamos un motor de búsqueda que ayuda a encontrar los diversos documentos, como un Google propio. Finalmente teníamos una herramienta que muestra las conexiones entre las personas con las empresas en paraísos fiscales, porque no siempre aparecen los dueños reales. Estas tres herramientas se crearon en proyectos anteriores, especialmente en los Swiss Leaks [filtraciones suizas], pero este fue el proyecto en el que se les dio su máximo aprovechamiento. Logramos mejorarlas para que pudieran lidiar con tantos datos. Por lo que el conocimiento que tiene el Consorcio para trabajar con las herramientas en la nube y de cómo hacer periodismo colaborativo cruzando fronteras es único. Todos los proyectos que tuvimos nos dejaron la experiencia para manejar esta gran cantidad de datos de una manera más eficiente.

CK: ¿No es un poco arriesgado para el periodista trabajar con datos sensibles en la nube?

Antes de comenzar cualquier proyecto, hacemos un análisis sobre las posibles amenazas. En el caso de los Panama Papers se concluyó que los Gobiernos no eran una amenaza. Que no se trataba de documentos de la NSA, por ejemplo, como fue el caso de Snowden que exigía más cuidado al usar herramientas en la nube. Después de determinar esto y ver que podíamos trabajar de manera remota, lo que hicimos fue establecer diferentes medidas para garantizar la seguridad de los reporteros. Por ejemplo, en la red social interna que tenemos, establecimos una autenticación de dos pasos. Además del usuario y la contraseña, el periodista también tenía que dar un código que llegaba a su celular. Esta autenticación de dos pasos también se hizo para acceder a nuestra búsqueda de documentos y a todas las herramientas hospedadas en nuestros servidores con conexión cifrada. También solicitamos a los reporteros el uso de sistema de encriptación PGP para intercambiar mensajes.

CK: ¿Cree que haya redacciones capaces de hacer el trabajo de periodismo de datos que ustedes hicieron con Panama Papers?

La verdad es que la capacidad técnica del equipo que trabajó en los Panama Papers es muy superior al equipo técnico que trabajó en los Swiss Leaks que publicamos el año pasado. En el último año, he visto crecer los equipos de periodismo de datos de muchos medios de comunicación, pero lo que es diferente es que dentro de las salas de redacción el principal trabajo es cuidar las historias que serán publicadas. El valor del ICIJ es ser un territorio neutral en donde podemos tomar decisiones a nivel internacional, en donde podemos preocuparnos por la historia a nivel global y no tanto en el interés de un medio en particular. Nuestra misión es ayudar en colaboración y mejorar las herramientas que nos permiten esto, buscar historias globales, ayudar a los reporteros a conseguir las mejores historias locales. Y creo que eso es único en el mundo.

CK: ¿Cuáles son los principales retos que enfrentó al trabajar con programadores en su equipo?

Son mundos diferentes, modos diferentes de trabajar y de organizar. Los programadores son mucho más organizados, los periodistas somos más caóticos. El mayor desafío es tratar de comprender la mejor manera de trabajar juntos por lo que es necesario establecer procesos para que eso funcione. Son más de cinco años trabajando con programadores y es fascinante, porque te da superpoderes y te permite buscar periodísticamente cuestiones que no conseguías antes. Sin el trabajo de los programadores de nuestro equipo de datos no habría sido capaz de hacer frente a esos terabytes de información de una forma tan eficiente. Los periodistas necesitan ser cada vez más técnicos y no sólo saber cómo trabajar con Excel y bases de datos, sino comenzar a aprender a programar, tratar de entender los diferentes lenguajes de programación para poder hablar el mismo lenguaje de los programadores. Cuando se trabaja en un equipo, es necesario conocer bien a tu compañero, en este caso tu compañero tiene una profesión diferente, por lo que cuanto más sabes de esa profesión, trabajarán mucho mejor.

CK: Inicialmente ustedes decidieron no publicar los datos de esta investigación, pero recientemente pusieron a disposición una base de datos con la información obtenida de los documentos filtrados. ¿Cómo pensaron en la estrategia de divulgación de esos datos?, ¿la intención de publicarlos vino después?

Desde el principio, la idea era publicar la mayor cantidad de datos posible, pero sabíamos que había un dilema ético y riesgos legales. Eran 11,5 millones de documentos a los que tuvimos acceso. Optamos por no publicarlos de forma bruta, al estilo Wikileaks, porque nos dimos cuenta de que había muchos documentos personales, pasaportes, identidades, números de cuentas bancarias, y publicar eso así, de una manera masiva, desde el punto de vista ético, no tenía sentido para nosotros. Además de tener implicaciones legales. Sin embargo, vimos que había una parte de los documentos que podíamos publicar, con información de los accionistas de las empresas en paraísos fiscales, que es considerada información secreta porque los paraísos fiscales venden precisamente eso, secreto. Si no hay filtraciones, es muy difícil saber quién está detrás de estas empresas. Tuvimos que reconstruir la base de datos de Mossack Fonseca para publicar esas partes de los registros mercantiles y aumentar la transparencia que se requiere en los paraísos fiscales.

CK: ¿Cómo ha repercutido la publicación de la base de datos de los Panama Papers?

La Offshore Leaks Database que publicamos el 9 de mayo es un éxito. En los primeros seis días de la publicación tuvimos casi 5 millones de visitantes y más de 35 millones de páginas vistas. Esto solo en los primeros seis días, para que tengas una idea del gran interés que existe en estos datos. Y eso es lo que nos permite el periodismo de datos, nos da un mayor nivel de interacción con los usuarios. Nosotros trabajamos los datos, determinamos nuestras historias y expusimos los datos al público. Ahora la gente puede buscar sus historias, sean o no parte de nuestros medios asociados. Esto es muy interesante, porque ahora comenzó una nueva etapa de los Panama Papers, cuando el ciudadano se convierte en un investigador. Pero no solo los ciudadanos, también las autoridades. Las autoridades fiscales de Colombia accedieron a los datos y encontraron que más del 60 por ciento de los colombianos tiene cuentas offshore y no han declarado tenerlas. Antes, el periodista publicaba su historia y el trabajo terminaba. Ahora, el periodismo de datos permite ese mayor nivel de interacción con el usuario. Eso también se ve en los productos interactivos. Hicimos un producto interactivo que se llama “The power players” (Los actores del poder), con más de 60 historias de políticos y sus familiares con empresas en paraísos fiscales. Esa fue una de nuestras páginas más vistas, lo que demuestra también el interés del público en este tipo de productos más interactivos que surge a partir del periodismo de datos, demostrando nuevamente su importancia.

Nota del editor: Esta historia fue publicada originalmente en el blog Periodismo en las Américas del Centro Knight, el predecesor de LatAm Journalism Review.

Artículos Recientes

Más Artículos

Panama Papers: Mar Cabra, editora de datos del ICIJ, habla del desafío de analizar 11 millones de documentos

Artículos Recientes

Artículos Relacionados

Nueva generación de periodistas de datos aprende a sortear los retos del acceso a la información en México Leer más >>

Los apagones agravan el bloqueo informativo para periodistas independientes cubanos Leer más >>

Leyes de acceso a información en América Latina brillan en teoría, fallan en la práctica Leer más >>

Corte de Colombia autoriza a periodistas a solicitar registros eclesiásticos sobre abusos de sacerdotes Leer más >>

¿Cómo los periodistas de El Salvador luchan por información pública en un entorno cada vez más opaco? Leer más >>