Como a inteligência artificial e as imagens de satélite podem ser aproveitadas para encontrar notícias em potencial?
Essa foi a pergunta que um grupo de jornalistas das Américas se fez durante sua participação no programa Collab Challenge 2021, uma iniciativa global do JournalismAI e da Google News Initiative que reúne meios de vários países para desenvolver inovações no jornalismo por meio da inteligência artificial.
Como resposta a essa pergunta, surgiu From Above, um guia para jornalistas sobre como usar a inteligência artificial para identificar indicadores visuais em imagens de satélite e desenvolver investigações jornalísticas a partir delas.
Enquanto outras equipes do Collab Challenge trabalhavam no desenvolvimento de ferramentas de inteligência artificial aplicadas ao jornalismo, a equipe de From Above, formada por Flor Coelho, de La Nación (Argentina); María Teresa Ronderos, do CLIP (Colômbia); David Ingold e Shreya Vaidyanathan, da Bloomberg News (Estados Unidos); e Gibrán Mena, do Data Crítica (México), decidiu se concentrar em pesquisar e criar um guia de trabalho que pudesse beneficiar jornalistas com pouca experiência na área.
“O produto foi o guia completo, pensando também que outros jornalistas de meios que não tiveram essa experiência anterior também poderiam usar essas ferramentas de análise de imagem, principalmente em investigações que tenham a ver com mudanças na cobertura florestal e a crise climática”, disse Gibrán Mena, do Data Crítica, à LatAm Journalism Review (LJR).
O guia, cujo nome completo é “From Above: A Journalist's Guide to Using AI + Satellite Imagery to Tell Stories” (“De lá de cima: Um guia para jornalistas sobre o uso de inteligência artificial + imagens de satélite para contar histórias”, em tradução livre), consiste em oito passos que exploram como usar a visão computadorizada como uma maneira inovadora de reunir ideias para possíveis reportagens investigativas.
O primeiro passo do guia (1) é precisamente pensar em histórias nas quais indicadores visuais podem fornecer contexto ou evidências adicionais. Em teoria, quase qualquer fenômeno que deixe marcas visíveis na Terra e possa ser capturado do espaço é propenso a ser analisado com inteligência artificial, segundo Mena. Isso pode ser desde a erosão do solo e desmatamento, até a detecção de pistas de pouso usadas por traficantes ou fazendas ilegais.
Para o desenvolvimento de From Above, a equipe optou por investigar o desmatamento devido à pecuária extensiva no México e na Colômbia.
O próximo passo do guia é a aquisição dos dados (2) — ou neste caso, as imagens de satélite da área de interesse — na resolução adequada. Segundo Mena, esta é uma das etapas mais complicadas, pois para que a análise das imagens seja efetiva, elas precisam ter uma resolução de pelo menos 10 metros por pixel.
“Este é um grande desafio que enfrentamos porque […] as empresas proprietárias dos satélites estão naturalmente interessadas em fazer um modelo de negócios a partir das imagens. Elas são extremamente caras e em alguns casos é necessário pedir ao satélite para tirar uma foto específica de uma área”, disse o jornalista.
Uma vez adquiridas as imagens, os próximos passos do guia são a análise técnica (3) e a rotulagem (4). Nessas etapas, os jornalistas examinam manualmente as imagens para encontrar pistas visíveis ao olho humano do que estão procurando e as sinalizam. Esse trabalho deve ser feito por jornalistas ou pesquisadores que tenham experiência em reportagens de campo sobre o tema da investigação.
“A chave é como eu ensino uma máquina a ver, quais são os pixels em uma imagem que significam, para o olho humano, desmatamento causado pela pecuária, neste caso”, explicou Mena.
Esses jornalistas especialistas marcam as imagens por meio de uma rotulagem que consiste em desenhar polígonos sobre o que eles já sabem que são sinais do que estão procurando. Idealmente, as imagens são de lugares que eles conhecem e onde sabem que o fenômeno desejado existe.
A sinalização serve para associar pixels a informações sobre o que ali existe, como refletância de cores, espectro infravermelho, sombras e texturas, entre outras. Posteriormente, é criado um banco de dados com base nessa inspeção visual e nos dados de contexto da área analisada.
“Todo esse processo serve para que quando eu analisar uma área que não conheço com informações de outras áreas, esse fenômeno possa ser detectado automaticamente”, disse Mena.
O próximo passo é o treinamento do algoritmo (5), que é feito combinando as informações da imagem de satélite e a sinalização feita por humanos. Esse tipo de treinamento é conhecido como “treinamento de modelo supervisionado”, no qual humanos fornecem os critérios que o algoritmo deve detectar em outras imagens.
Em seguida, vem a etapa de validação (6), na qual o algoritmo é refinado para melhorar sua precisão. A margem de erro do algoritmo depende da precisão da rotulagem.
“Pode estar acima de 90% de precisão, mas também pode estar bem abaixo, dependendo de como essa tarefa foi realizada. Sempre haverá uma margem de erro e sempre haverá a necessidade de não dar como certo que a categorização automática está correta, mas sim que deve haver um processo de revisão posterior, uma verificação humana”, explicou Mena.
A próxima etapa é a etapa de teste (7), na qual o algoritmo é executado em novas imagens e os resultados são observados. A etapa final do guia é escrever a história (8) usando os dados retornados pelo algoritmo. Se estes suportam as hipóteses iniciais da pesquisa proposta ou dão ideias para novas hipóteses ou ângulos de reportagem.
“A parte mais importante de um processo técnico como esse não é a ferramenta nem a linguagem de programação, mas as discussões que ocorreram em segundo plano entre os jornalistas que estavam participando”, disse Mena. “Porque sem isso, o algoritmo não tem precisão. O conhecimento de campo dos jornalistas é extremamente valioso para esse tipo de processo técnico.”
Para o desenvolvimento do algoritmo gerado a partir do From Above, a equipe utilizou o R, um software gratuito para análise estatística e gráfica que é popular entre a comunidade científica. O referido algoritmo, bem como o banco de dados utilizado para treiná-lo, estão disponíveis abertamente em um repositório no GitHub, para que qualquer jornalista que deseje realizar investigações semelhantes possa utilizá-los.
“A linguagem do guia é feita para jornalistas interessados em saber o que realmente significa usar um algoritmo e que nunca tiveram a menor ideia do que isso significa”, disse Mena. “É uma inovação para que também tenham acesso a essas ferramentas jornalistas do sul global, de redações que não têm a possibilidade de contratar 10 programadores para resolver esses problemas investigativos.
Atualmente, o Data Crítica está colocando em prática o guia From Above, em uma investigação jornalística sobre o desmatamento produzido nas últimas duas décadas pelo cultivo da soja na bacia do Paraná, nos territórios fronteiriços de Argentina, Brasil e Paraguai. O projeto está sendo desenvolvido como parte do Consórcio de Apoio ao Jornalismo na Região (CAPIR), do qual o Data Crítica é membro junto com Animal Politico, Armando Info, Fundación Karisma, Institute for War & Peace Reporting e Vinalnd Solutions.
Embora ainda não tenha data de publicação, a reportagem está prevista para sair em julho próximo, disse Mena.
Como descobriram os autores de From Above, o acesso a imagens de alta resolução do espaço não é fácil. A fotografia de satélite está agora mais amplamente disponível do que nunca, mas as imagens com uma resolução alta o suficiente para detectar objetos têm custos elevados.
A equipe tentou estabelecer contato com as grandes empresas que possuem satélites ou provedores de imagens de satélite, como Maxar, Sentinel e Google Earth. No entanto, eles descobriram que é difícil obter uma resposta quando se trata de pequenos projetos.
No entanto, em sua investigação eles descobriram que existem programas e iniciativas que permitem o acesso gratuito ou de baixo custo a imagens de satélite para organizações ou jornalistas que buscam investigar a crise climática.
“Se você olhar o guia, você pode ter uma ideia de que as imagens de satélite evoluíram muito até agora. Então você tem muitas imagens gratuitas disponíveis na internet graças aos programas de satélite que cada país tem”, disse à LJR Shreya Vaidyanathan, membro da equipe e repórter da Bloomberg News. “Eles disponibilizam essas imagens para que as pessoas possam estudá-las ou usá-las para alguma coisa. Então, se uma pessoa estiver cobrindo as mudanças climáticas ou uma geografia específica como jornalista, ela definitivamente pode obter essas imagens”.
A equipe From Above voltou-se especificamente para a plataforma Planet, uma organização que opera 450 satélites em órbita e cuja missão é registrar e distribuir imagens e dados da Terra do espaço e monitorar mudanças visíveis. Por meio do programa International Climate & Forests Initiative (NICFI) da Noruega, em parceria com o Governo da Noruega, jornalistas e ativistas interessados na crise climática têm acesso a imagens de alta resolução.
Eles também contaram com a colaboração do Bellingcat, site de jornalismo investigativo especializado em checagem de fatos e inteligência de código aberto, que tem experiência no uso de geolocalização e imagens de satélite em investigações. O site treinou a equipe From Above no uso das ferramentas do programa Planet e lhe forneceu algumas imagens de satélite em alta definição.
No entanto, a equipe reconhece que, apesar do apoio dessas organizações e programas, o acesso às imagens de satélite pode ser um desafio difícil de enfrentar, em parte porque para investigar mudanças no terreno, são necessárias séries de imagens ao longo de um período de tempo.
“Você precisa das imagens mais atualizadas. Se o custo de uma imagem for muito alto, será muito mais caro comprar uma todos os dias ou todas as semanas ou todos os anos, e o jornalismo é, de várias maneiras, algo que opera no curto prazo”, disse Vaidyanathan. “Acho que pode ser útil se você tiver habilidades para manipular imagens gratuitas e talvez investir apenas no conjunto de habilidades para processá-las e analisá-las. Mas o dinheiro necessário para comprar imagens novas e atualizadas acho que ainda está longe de estar disponível para o jornalismo ou para redações em geral”.
Mas apesar desses desafios econômicos e técnicos, uma das inovações que From Above traz é a desmistificação dos processos de inteligência artificial e visão computadorizada como elementos inatingíveis para o jornalismo, segundo seus idealizadores.
Embora os criadores do guia tenham conhecimento de jornalismo de dados e programação, eles não possuem a formação técnica de um programador. E ainda assim, eles conseguiram desenvolver o guia e treinar um algoritmo. Por isso, era fundamental para eles que o guia servisse como uma forma de aproximar outros colegas da inteligência artificial de forma acessível.
“[Os meios de comunicação dos países do primeiro mundo] tendem a fazer uma separação disciplinar nas redações entre os aspectos técnicos e a investigação jornalística. Nas nossas redações muito menores e com outros processos diferentes dos do norte, não há possibilidade de fazer essa distinção e as pessoas que fazem a programação são muitas vezes os mesmos jornalistas, por isso exigimos que o guia fosse perfeitamente compreensível para uma pessoa que não tem informações técnicas”, disse Mena.
A equipe inicialmente pretendia integrar o algoritmo em uma interface gráfica do usuário final para facilitar o uso nas redações, mas a duração de seis meses do Collab Challenge não foi tempo suficiente. No entanto, a equipe não descarta a criação de tal interface no futuro.
Segundo os jornalistas envolvidos, From Above serviu para registrar o alcance que a inteligência artificial tem até hoje na análise de imagens de satélite para contar histórias, bem como lançar as bases para que eles ou outros jornalistas apliquem ou aprimorem o processo com novos conhecimentos.
“A parte útil de nossa orientação é apenas dizer: ‘É aqui que essa tecnologia está neste momento. Esses são os recursos e esperamos que vocês possam planejar como cobrir este tema de uma maneira que cause impacto”, disse Vaidyanathan. “Com a escala em que o acesso à inteligência artificial e imagens de satélite está crescendo, parece que pode abrir muitas possibilidades. Se não agora, então em alguns anos."