texas-moody

Panama Papers: Mar Cabra, editora de dados do ICIJ, fala do desafio de checar 11 milhões de documentos vazados

Os Panama Papers, maior vazamento de documentos da história do jornalismo, deu origem a um esforço investigativo global, com a participação de cerca de 100 jornalistas latino-americanos, que permitiu destrinchar o funcionamento dos paraísos fiscais. Liderada pela jornalista espanhola Mar Cabra, a equipe de jornalismo de dados do Consórcio Internacional de Jornalistas Investigativos (ICIJ, na sigla em inglês) foi o cérebro desse trabalho, que exigiu a análise de 11,5 milhões de documentos e demonstrou que lidar com grandes bases de dados é cada vez mais essencial às investigações jornalísticas.

Na primeira etapa do projeto, divulgado no início de abril deste ano, Cabra e seu time estruturaram 2,6 terabytes das informações vazadas do escritório de advocacia panamenho Mossack Fonseca e abriram os dados para repórteres de diferentes países. No dia 9 de maio, o ICIJ tornou público parte do banco de dados que levou quase um ano para estruturar e analisar, lançando o Offshore Leaks Database. Nos seis primeiros dias, a página teve quase 35 milhões de acessos.

"Nós trabalhamos os dados, tiramos nossas pautas, e depois expusemos os dados ao público. Agora as pessoas podem buscar suas próprias histórias neles, sendo de nossos meios associados ou não. Começou uma nova etapa dos Panama Papers, quando o cidadão se torna um investigador", ressaltou Mar Cabra.

Em entrevista ao Centro Knight para o Jornalismo nas Américas, a jornalista fala sobre o trabalho desenvolvido por sua equipe no ICIJ, as possibilidades abertas pela colaboração entre jornalistas e desenvolvedores e a relevância do jornalismo de dados para despertar novamente o interesse do público em grandes reportagens investigativas.

Knight Center: De que forma você começou a trabalhar com jornalismo de dados?

Fui estudar jornalismo investigativo na Universidade de Columbia com uma bolsa Fullbright. Lá descobri o trabalho de jornalismo de dados e me apaixonei, vi que me ajudava a contar histórias de uma maneira mais potente, mais sistemática, que não dependia tanto de declarações. Eu me formei em 2010, voltei para a Espanha e me contrataram no ICIJ para trabalhar como repórter investigativa e de dados. Da Espanha, ajudei a criar o primeiro mestrado em jornalismo de investigação, dados e visualizações no El Pais, e continuei a trabalhar com atividades para fomentar esse campo. Por isso, quando o Consórcio pensou em criar, em 2014, uma equipe específica de jornalismo de dados, fui chamada para liderá-la.

KC: Como funciona o trabalho de jornalismo de dados dentro do ICIJ?

O ICIJ sempre fez investigações que envolviam o trabalho guiado por dados. Desde 2011, não há uma investigação na qual eu tenha trabalhado pelo ICIJ que não tenha envolvido dados, mas antes não havia uma equipe específica, isso começou em 2014. Começamos com dois programadores e eu. A equipe foi crescendo e hoje temos sete pessoas - quatro desenvolvedores e três jornalistas - sendo quatro mulheres. E trabalhamos em três frentes: fazendo análises de dados para aprofundar e descobrir novas histórias, ajudando com os produtos interativos das investigações e desenvolvendo ferramentas para fomentar a colaboração entre jornalistas de diferentes países, como a plataforma que criamos para buscar os mais de 11 milhões de documentos dos Panama Papers.

KC: Para a estrutura e do ICIJ, é uma equipe grande?

A equipe de jornalismo de dados representa cerca de 50% do staff e é fundamental para o ICIJ, é uma das áreas principais da organização. Fomos crescendo nos dois últimos anos, porque a demanda foi aumentando. Lembro que meus chefes perguntavam 'mas vamos contratar dois programadores, será que teremos trabalho pra eles?', e eu dizia que sim. Em pouco tempo os avisei que teríamos que contratar mais um programador. Um dos programadores entrou só para trabalhar no documentos dos Panama Papers. Porque foi um desafio muito grande lidar com a quantidade massiva de dados, era preciso processá-los e precisamos de ajuda extra. A equipe foi crescendo organicamente, pelas necessidades que foram surgindo e o papel importante que os dados e a tecnologia desempenham no nosso dia a dia.

KC: Qual foi a primeira reação que você teve ao se deparar com os documentos vazados?

Quando recebi os documentos, a primeira reação foi 'meu Deus, como vamos lidar com isso?'. Foi um desafio interessante, mas havíamos aprendido nas investigações anteriores feitas a partir de vazamentos que precisávamos investir tempo analisando os dados antes de começar qualquer reportagem. Nos Panama Papers, aplicamos várias lições aprendidas nos projetos anteriores, o que nos ajudou a não cometer os mesmos erros.

KC: O que esse projeto teve de diferente em relação aos anteriores?

A quantidade de dados. Nos Offshore Leaks, em 2013, trabalhamos com 260 gigabytes de informação, e nos Panamá Papers foram 2,6 terabytes, muitíssimo mais! Além disso, também formamos uma equipe transnacional com mais de 370 jornalistas, o que exigiu um trabalho de coordenação e de manejo dos dados muito grande. Imagine ter quase 400 pessoas te mandando perguntas! Do ponto de vista do conteúdo, esse vazamento nos permitiu entender o funcionamento dos paraísos fiscais como nunca antes, porque Mossack Fonseca é uma das principais empresas do mundo na criação de sociedades em paraísos fiscais, e tinha clientes de muito alto nível. Isso também fez com que jornalísticamente o conteúdo fosse mais interessante.

KC: E de que forma vocês trabalharam com essa quantidade de dados?

Já tínhamos construído uma série de ferramentas para utilizar em projetos anteriores e este caso serviu para que pudéssemos melhorá-las. Criamos um fórum de comunicação, uma espécie de Facebook dos repórteres, e tudo o que íamos encontrando, comunicávamos por ali, como uma redação virtual. Temos também um buscador que ajuda a pesquisar em meio a vários documentos, como um Google próprio. E por fim temos uma ferramenta para mostrar conexões entre as pessoas com sociedades em paraísos fiscais, porque nem sempre aparecem os reais donos. Essas três ferramentas foram feitas em projetos anteriores, especialmente no Swiss Leaks, mas esse foi o projeto em que demos a elas seu máximo uso. Conseguimos melhorá-las para que pudessem lidar com tantos dados. Então o conhecimento que o Consórcio tem de como trabalhar com ferramentas na nuvem e de como fazer jornalismo colaborativo cruzando fronteiras é único. Todos os projetos que tivemos nos trouxeram experiência para lidar com essa grande quantidade de dados de uma maneira mais eficiente.

KC: Trabalhar com dados sensíveis na nuvem não é arriscado para o jornalista?

Antes de começar qualquer projeto, fazemos uma análise de ameaças, e nesse caso dos Panama Papers, concluímos que os governos não eram a ameaça. Não estávamos lidando com documentos da NSA, por exemplo, como era o caso de Snowden, que demandava mais cuidado ao utilizar ferramentas na nuvem. Depois de determinar isso e ver que poderíamos trabalhar de maneira remota, o que fizemos foi criar diferentes passos para garantir a segurança dos repórteres. Por exemplo, a rede social interna que temos possui uma autenticação em dois passos, então além do usuário e da senha, o repórter também precisa passar um código que chega ao seu celular. Esta autenticação em dois passos também é feita para acessar nosso buscador de documentos e todas as nossas ferramentas ficam hospedadas em nossos servidores, com conexão encriptada. Também pedimos aos repórteres que usem sistemas de criptografia PGP para troca de mensagens.

KC: Você acha que já há redações capazes de fazer o trabalho de jornalismo de dados que vocês fizeram nos Panama Papers?

A verdade é que a capacidade técnica da equipe que trabalhou nos Panama Papers é bem superior à capacidade técnica da equipe que trabalhou no Swiss Leaks, o vazamento que publicamos no ano passado. No último ano eu vi crescer equipes de jornalismo de dados em muitos meios de comunicação, mas o que é diferente é que dentro dos veículos o trabalho principal é cuidar das matérias que vão sair ali. O valor do ICIJ é ser um território neutro, onde podemos tomar decisões a nível internacional, onde podemos nos preocupar com a história globalmente e não tanto com o interesse de um meio específico. Nossa missão é ajudar na colaboração e melhorar as ferramentas que nos permitem isso, buscar as histórias globais, ajudar os repórteres a tiraram as melhores histórias locais. E creio que isso é único no mundo.

KC: Quais são os principais desafios que você sente ao trabalhar com desenvolvedores na sua equipe?

São mundos diferentes, modos de trabalhar e de se organizar diferentes. Os desenvolvedores são muito mais organizados, os jornalistas são mais caóticos. O maior desafio é buscar entender a melhor maneira de trabalhar junto. E é preciso estabelecer processos para que isso funcione. Estou há mais de cinco anos trabalhando com desenvolvedores e é fascinante, porque te dá super poderes e te permite buscar jornalísticamente questões que você não conseguiria antes. Sem o trabalho dos desenvolvedores da nossa equipe de dados não teríamos conseguido lidar com esses terabytes de informação de uma maneira tão eficiente. Os jornalistas precisam ser cada vez mais técnicos e não só saber trabalhar com Excel e bases de dados, mas começar a aprender a programar, buscar entender as diferentes linguagens de programação, para poder falar a mesma língua dos desenvolvedores. Quando se trabalha em equipe, é preciso conhecer bem seu companheiro, e nesse caso seu companheiro tem uma profissão diferente, então quanto mais você souber dessa profissão, melhor vai ser para trabalharem juntos.

KC: Inicialmente vocês decidiram não liberar os dados dessa investigação, mas recentemente disponibilizaram um repositório de dados com as informações obtidas dos documentos vazados. Como vocês pensaram a estratégia de liberação dos dados? A intenção de liberá-los surgiu depois?

Desde o início, a ideia era publicar o máximo possível de dados, mas sabíamos que havia um dilema ético e riscos legais. Os 11,5 milhões de papéis a que tivemos acesso, optamos por não publicá-los na forma bruta, no estilo Wikileaks, porque percebemos que havia muitos documentos pessoais, passaportes, identidades, números de contas bancárias, e publicar isso assim, de maneira massiva, do ponto de vista ético não fez sentido para nós. Além de ter implicações legais. Contudo, vimos que havia uma parte dos documentos que poderíamos publicar, com informação dos acionistas de sociedades em paraísos fiscais, que só é informação sigilosa porque os paraísos fiscais vendem justamente isso, o sigilo. Sem o vazamento é muito dificil saber quem está por trás dessas sociedades. Tivemos que reconstruir a base de dados da Mossack Fonseca para publicar essas partes dos registros mercantis e aumentar a transparência que é necessária nos paraísos fiscais.

KC: Como tem repercutido a publicação da base de dados dos Panama Papers?

A Offshore Leaks Database que publicamos no dia 9 de maio é um sucesso. Nos primeiros seis dias da publicação tivemos quase 5 milhões de visitantes e mais de 35 milhões de páginas vistas. Isso só nos primeiros seis dias, para você ter uma ideia do grande interesse que há nesses dados. E isso é o que nos permite o jornalismo de dados, nos dá um nível maior de interação com os usuários. Nós trabalhamos os dados, tiramos nossas histórias, e depois expusemos os dados ao público. Agora as pessoas podem buscar suas próprias histórias neles, sendo de nossos meios associados ou não. E isso é muito interessante, porque agora começou uma nova etapa dos Panama Papers, quando o cidadão se torna um investigador. Não só os cidadãos como também as autoridades. As autoridades fiscais da Colômbia acessaram os dados e viram que mais de 60% dos colombianos com contas offshore não declararam essas sociedades. Antes, o jornalista publicava sua história e o trabalho terminava. Agora o jornalismo de dados permite esse nível de interação maior com o usuário. E isso também se vê com os produtos interativos. Fizemos um produto interativo que se chama "The power players" (os atores do poder), com mais de 60 histórias de politicos e familiares com sociedades nos paraísos fiscais. Essa foi uma das nossas páginas mais vistas, o que mostra também o interesse do público neste tipo de produto mais interativo que surge a partir do jornalismo de dados, demonstrando novamente sua importância.

Nota do editor: Essa história foi publicada originalmente no blog de jornalismo nas Américas do Centro Knight, o predecessor do LatAm Journalism Review.