texas-moody

Conheça cinco ferramentas digitais de código aberto para usar gratuitamente no combate à desinformação

O Projor - Instituto para o Desenvolvimento do Jornalismo lançou a segunda fase do Fundo de Inovação para o Combate à Desinformação (Codesinfo), focada na divulgação e disseminação de cinco ferramentas digitais de código aberto criadas para reforçar o combate à desinformação online. Desenvolvidas por veículos brasileiros no final de 2024, as soluções estão disponíveis gratuitamente para qualquer organização jornalística do Brasil e do exterior. 

Para alcançar veículos internacionais, Francisco Belda, diretor de Operações do Projor e coordenador do Codesinfo, disse que o site do Codesinfo está sendo traduzido para o inglês e o espanhol, e os veículos parceiros que criaram as ferramentas estão recebendo apoio em atividades de network para divulgar as soluções.

"Acreditamos que as cinco ferramentas fortalecem o jornalismo cívico de forma geral," disse Belda à LatAm Journalism Review (LJR). "Isso acontece por seu papel na valorização do conceito de autoria (ferramenta Quem Disse?), da checagem de fatos (Check-up), de evidências científicas nas coberturas do meio-ambiente e mudanças climáticas (chatbot Capí), produção de vídeos curtos a partir de reportagens textuais (Mosaico) e do fornecimento de informações contextuais atualizadas (Xarta).”

Capí: respostas confiáveis sobre o clima

Três pessoas sentadas em frente a computadores observam e discutem a interface de um chatbot exibida em uma das telas. A cena ocorre em um ambiente de escritório moderno.

A Capí combate a desinformação ambiental e climática através de um chatbot alimentado por inteligência artificial. (Divulgação/Codesinfo)

A Capí é um chatbot de inteligência artificial desenvolvido pela Ambiental Media, que foi lançado em versão beta em novembro de 2024. A proposta da ferramenta é fornecer respostas claras, atualizadas e confiáveis para perguntas dos usuários sobre temas climáticos.

“Eu tive a ideia de criar o chatbot climático justamente porque eu percebo que é um assunto que por mais que a gente se esforce, ainda gera muitas dúvidas. Acho que há muita dificuldade da comunidade científica em comunicar os dados com clareza” disse Thiago Medaglia, Diretor-executivo da Ambiental Media, à LJR. “E não é só clareza, né? A premissa da Ambiental Media é que a ciência seja transformada em conteúdo jornalístico acessível, claro e atraente.”

Desenvolvida por uma equipe multidisciplinar, formada por engenheiros, jornalistas, educadores e designers, a Capí utiliza um banco de dados restrito que inclui reportagens da Ambiental Media e documentos de organizações científicas renomadas. Entre suas principais fontes estão os relatórios do Painel Intergovernamental sobre Mudanças Climáticas (IPCC, na sigla em inglês), órgão da ONU que avalia dados científicos sobre o aquecimento global, seus impactos e estratégias de mitigação.

“A gente acredita que a Capí pode ser apoio na produção de uma pauta, ou na etapa de revisão de uma reportagem, ou na busca por fontes ou por temas. Por exemplo: você está trabalhando num edital e quer expandir, fazer um brainstorm. A Capí pode ajudar nisso tudo. Na checagem de informações também”, disse Medaglia.”

Screenshot of the Capí chatbot interface. The screen displays a welcome message encouraging users to chat with the AI about climate change, based on scientific reports. Navigation options are on the left sidebar, including “Chat,” “Question list,” “Teacher’s guide,” and “About Capí.” Logos of supporting organizations such as Ambiental Media, Projor, Codesinfo, and Google News Initiative appear at the bottom.

Captura de tela da interface do chatbot Capí. (Divulgação/Codesinfo)

A tecnologia por trás da Capí é o Gemini, o modelo de linguagem de grande escala (ou LLM, na sigla em inglês) desenvolvido pelo Google. Para produzir respostas confiáveis de maneira eficiente, a ferramenta utiliza a geração aumentada de recuperação (RAG), uma técnica proposta em 2020 para, entre outros objetivos, reduzir alucinações e contextualizar os LLM de acordo com usos específicos.

A Capí não coleta dados pessoais dos usuários, mas utiliza o conteúdo das interações para aprendizagem contínua através da técnica conhecida como prompt tuning. A infraestrutura do chatbot opera em servidores especiais da Google Cloud, otimizados para consumo reduzido de energia e baixa emissão de dióxido de carbono, alinhando-se aos objetivos ambientais da ferramenta.

“A Capí é uma IA beta, então ela com certeza pode cometer alucinações, cometer erros. A gente deixa isso descrito ali no site. Os erros são reportados e a gente corrige, mas ela utiliza fontes confiáveis que a gente selecionou com muito cuidado e muito critério.”

A página da ferramenta no Github pode ser acessada aqui, assim como o histórico do projeto e a arquitetura do sistema.

Check-up: monitoramento de anúncios do setor de saúde

Illustration with the word “check-up” at the top left. The image shows a chaotic explosion of medical pills, coins with dollar signs, stethoscopes, documents, and social media icons (like thumbs-up and hearts), set against a bright yellow background.

O projeto Check-up, desenvolvido pelo Aos Fatos, é uma iniciativa que visa analisar a presença de desinformação em anúncios publicitários de saúde em grandes sites de notícias brasileiros.

Outra ferramenta desenvolvida dentro do Codesinfo é o Check-up, solução criada pelo Aos Fatos para analisar anúncios publicitários de saúde em grandes sites de notícias brasileiros que podem conter informações enganosas. 

“O projeto surgiu de um incômodo com a falta de moderação nas plataformas de anúncios nativos usadas em grandes sites jornalísticos. Essas ferramentas aproveitam a credibilidade do jornalismo para ganhar dinheiro com desinformação — e fazem isso com anuência das empresas de mídia”, disse Bruno Fávero, Diretor de Inovação do Aos Fatos, à LJR. “A gente via que anúncios com desinformação eram comuns, mas não havia dados para analisar o problema de forma sistemática e rigorosa. Então criamos o Check-up para que nossa redação, mas também outros pesquisadores e jornalistas, pudessem estudar o assunto.” 

O processo de coleta e análise dos anúncios usa uma combinação de automação e análise manual. A equipe do Aos Fatos criou raspadores que visitam grandes portais todos os dias e coletam anúncios nativos. Em seguida, eles usam um modelo de linguagem para classificar cada peça publicitária por tema. Por fim, repórteres analisam os anúncios usando a metodologia de checagem do Aos Fatos, que é pública. Frases checáveis são comparadas com fontes primárias, dados públicos, estudos confiáveis ​​ou consultas com especialistas e então recebem uma classificação. 

Screenshot of a dashboard titled “Check-up,” displaying a list of online advertisements.

Captura de tela de uma lista de anúncios coletados pela ferramenta. (Divulgação/Codesinfo)

O código da ferramenta é aberto e está publicado no GitHub do Aos Fatos e pode ser usado por pesquisadores e jornalistas interessados no tema. Na documentação da ferramenta, há uma explicação sobre como adaptar o código para coletar anúncios de outros sites. 

“Organizações jornalísticas que usam serviços de anúncios nativos também podem usar o Check-up para analisar a qualidade dos anúncios que veiculam e pressionar as plataformas por melhorias na moderação”, disse Fávero. “O desafio de financiar jornalismo no Brasil é dificílimo, mas a resposta não pode ser uma prática que vai diretamente contra a razão de existir da profissão."

Mosaico: transformando textos em vídeos

O Mosaico é uma biblioteca Python criada pela Folha de S.Paulo para converter matérias textuais em vídeos curtos com auxílio de inteligência artificial. Construída sobre o MoviePy, uma das bibliotecas de edição de vídeo mais populares em Python, o Mosaico oferece uma interface para trabalhar com ativos de mídia, posicionar elementos, aplicar efeitos e gerar scripts de vídeo.

“O jornal optou por essa solução para enfrentar o desafio crescente da desinformação, num cenário em que o consumo de vídeos curtos aumenta significativamente”, disse Daniela Braga, editora de Inteligência Artificial da Folha, à LJR. “Ao transformar conteúdos textuais em vídeos curtos, utilizando inteligência artificial, a Folha consegue oferecer um tipo de narrativa diferente que, baseada em conteúdo original, pode impactar o público que prefere vídeos a textos, ampliando assim o alcance de suas notícias.” 

A woman is sitting at a desk in a newsroom, looking at a computer monitor. The screen displays a video editing tool with a paused video of a woman speaking on stage.

Mosaico é uma biblioteca Python criada pela Folha de S.Paulo e projetada para criar e gerenciar composições de vídeos programaticamente. (Disclosure/Codesinfo)

Segundo Braga, o diferencial do Mosaico em relação a outras soluções de vídeo automatizado é ser uma ferramenta proprietária, com manutenção em casa, treinada com base em conteúdo da própria Folha e desenvolvida para atender aos parâmetros de qualidade jornalística e padrões do jornal.

"A criação de vídeos é supervisionada por jornalistas da Folha, que revisam e aprovam o resultado final. Texto e imagens são reais”, explicou Braga. 

Para outros veículos que queriam adotar a ferramenta, Braga disse que com o repositório disponível no GitHub é possível personalizar a ferramenta para atender a necessidades específicas. Segundo ela, por ser um software de código aberto, desenvolvedores e jornalistas podem contribuir com melhorias, correções e novas funcionalidades.

“Assim, a própria comunidade pode impulsionar a evolução da ferramenta”, disse Braga. “Essa automação também agiliza a produção de vídeos tanto para atender à demanda por conteúdos curtos e dinâmicos nas redes sociais quanto para diminuir a dependência de equipes dedicadas.”

Quem Disse?: transparência sobre autoria

Pessoa sentada em frente a computado observa a interface de um chatbot exibida em uma tela.

“Quem Disse?” é um plugin para o CMS WordPress criado pela Folha do Mate, jornal de Venâncio Aires, no Rio Grande do Sul. (Divulgação/Codesinfo)

O plugin "Quem Disse?", desenvolvido pela Folha do Mate, veículo focado em jornalismo comunitário com atuação no Rio Grande do Sul, é uma extensão para WordPress inspirada no LinkedIn que facilita a construção e padronização de perfis de jornalistas. A ideia é informar os leitores sobre aspectos profissionais dos jornalistas, como áreas de cobertura e experiência do repórter. O plugin também inclui um banco de dados de fontes recorrentes, como autoridades e especialistas, fornecendo minicurrículos para cada um.

O plugin é uma continuidade de iniciativas anteriores do veículo voltadas ao combate à desinformação, de acordo com Paula Carvalho, diretora comercial da Folha do Mate. Outras atividades incluem oficinas de jornalismo em escolas, um quiz educativo sobre os riscos da desinformação e verificação de notícias enviadas pelos leitores. 

“O plugin ‘Quem Disse?’ surgiu com o objetivo de destacar os autores das matérias, valorizando a credibilidade da fonte e aproximando ainda mais os jornalistas e repórteres dos leitores, promovendo mais responsabilidade e clareza na produção de conteúdo”, disse Carvalho. 

Com mais de 50 anos de atuação, a Folha do Mate conta hoje, segundo Carvalho, com cerca de 4 mil assinantes ativos. 

“Isso demonstra um relacionamento sólido e de confiança”, disse. “Acreditamos que, ao sermos transparentes sobre os nossos processos, autoria e fontes, reforçamos o nosso compromisso com o jornalismo sério e com o desenvolvimento da região onde atuamos.”

O plugin foi desenvolvido apenas para a plataforma WordPress e as instruções para instalação estão no site da Folha do Mate e no Github

Xarta: contexto sempre atualizado

Graphic purple symbols from Xarta's logo in a white background.

O Xarta é um mini sistema de publicação (CMS), de código aberto, desenhado especificamente para automatizar a atualização de conteúdo de contexto em diversas reportagens. (Divulgação/Codesinfo)

O Xarta é um sistema criado pelo Núcleo Jornalismo que automatiza o processo de contextualização nas matérias através de cartões “embedáveis” inseridos em diversas reportagens. O Xarta também ajuda a evitar que conteúdos descontextualizados sejam usados para desinformar a população.

Um exemplo do uso da ferramenta pelo Núcleo aconteceu durante o bloqueio da rede social X no Brasil em agosto de 2024, que teve diversos desdobramentos ao longo de um mês. Ao invés de criar e atualizar os contextos de cada uma das reportagens sobre o assunto, a equipe usou o Xarta para garantir que os textos novos tivessem o contexto mais preciso e atual sobre o assunto, e que mesmo as reportagens antigas estivessem sempre atualizadas.

“Ter um contexto pronto de coberturas que estamos acompanhando ajuda o nosso trabalho, facilita na agilidade da publicação de novas reportagens, além de garantir que o contexto inserido vai ser o mais completo e atualizado. Paralelamente, começamos a observar nos nossos dados de audiência que nem sempre a última reportagem de uma cobertura específica é a que tem mais tráfego. Essas reportagens, com contextos antigos, poderiam então ser utilizadas de forma maliciosa”, disse Jade Drummond, Diretora de Operações do Núcleo, à LJR. “A junção dessas duas percepções foi o que originou o projeto. Criamos uma ferramenta que mantém os textos atualizados por mais tempo, dá um contexto melhor da cobertura e otimiza o trabalho da redação.”

Screenshot of a webpage showing an example of a open source tool.

Exemplo de card do Xarta sobre o bloqueio do Twitter no Brasil. (Divulgação/Codesinfo)

O Xarta elimina a necessidade de reescrever diversas vezes o contexto de um mesmo tema e também evita que o repórter tenha que voltar em reportagens antigas manualmente para incluir informações importantes de contexto.

“Repórteres e editores não precisam de conhecimento técnico específico para usar o Xarta no dia-a-dia. Já quem vai criar a aplicação do Xarta da redação precisa de conhecimento técnico para usar a nossa documentação e código aberto, ou pode contratar o Núcleo para fazer essa aplicação”, disse Drummond. “A partir do momento que a página do Xarta da redação está criada, com as customizações que desejarem e o modelo padrão da identidade visual, o uso é muito fácil e intuitivo.”

Drummond explicou que cada redação pode criar o seu próprio Xarta, mas também podem usar cards de contexto de outros veículos que tenham sido liberados para reprodução, como alguns disponibilizados pelo Núcleo

Temos alguns cards que são públicos e permitimos a reprodução via Licença Creative Commons 4.0, basta a pessoa entrar no card e ir até a página que contém o código de embed, que ela pode copiar e inserir na matéria dela”, disse Drummond. “Todas as redações que criarem um Xarta próprio podem decidir se querem permitir a reprodução ou não dos cards de contexto produzidos.”



Republique gratuitamente este texto em seu site. Consulte nossas regras para republicação