texas-moody

15 conceitos para entender a IA no jornalismo – e os seus usos em redações

A inteligência artificial continua cada vez mais rápida em seu caminho para se tornar parte integrante de muitas indústrias, incluindo a do jornalismo. Nas redações, a tecnologia está mudando o modo de executar tarefas que antes eram feitas por humanos, como escrever notícias, produzir imagens e analisar dados.

O relatório "Tendências e previsões para jornalismo, mídia e tecnologia 2024", publicado em janeiro pelo Instituto Reuters para o Estudo do Jornalismo, afirmou que este seria o ano em que a IA seria totalmente incorporada aos fluxos de trabalho das redações. Dos veículos de comunicação ao redor do mundo entrevistados para o relatório, 16% relataram já ter nomeado uma pessoa responsável por atividades relacionadas à IA em sua redação, enquanto 24% disseram que planejam fazer isso em breve.

No entanto, o jornalista e pesquisador Nic Newman, autor do relatório, afirmou que os veículos latino-americanos demoraram mais para se adaptar à chegada da IA no jornalismo e, por consequência, estão menos preparados para enfrentar essa transformação tecnológica.

Em vista disso, apresentamos a seguir uma lista de 15 conceitos-chave que todo jornalista deve conhecer para navegar com confiança nessa transição do jornalismo para a era da IA.

Acompanha cada a descrição de um caso específico e real de uso no jornalismo, como forma de dar exemplos dos efeitos que a tecnologia está tendo na indústria.

1. Inteligência Artificial

Abreviada como IA, a inteligência artificial é um ramo da ciência da computação que se concentra na criação de sistemas capazes de realizar tarefas que normalmente exigiriam a inteligência humana. Os sistemas de IA têm a capacidade de executar funções complexas e resolver problemas complicados em menos tempo do que levaria um ser humano.

No contexto jornalístico, a IA pode ser aplicada para tarefas como automação de processos, análise de dados, identificação de padrões e tendências, e geração automatizada de conteúdo, entre outras.

Exemplo no jornalismo: Heliograf, o "robô jornalista", tem sido uma das grandes apostas do The Washington Post na aplicação de IA para se posicionar como um jornal na vanguarda. Desenvolvido para automatizar a redação de artigos que envolvem grandes quantidades de dados, o Heliograf foi lançado na cobertura dos Jogos Olímpicos do Rio de Janeiro, em 2016, e naquele mesmo ano foi utilizado para escrever matérias, newsletter e publicações em redes sociais sobre as eleições presidenciais nos Estados Unidos.

2. Algoritmo

Um algoritmo é uma sequência ordenada de instruções preestabelecidas que uma máquina ou sistema segue para resolver um problema ou executar uma tarefa específica. Os algoritmos funcionam a partir de dados fornecidos por seres humanos, que são processados e, em seguida, entregam resultados.

Exemplo no jornalismo: Em 2018, o veículo de jornalismo investigativo peruano Ojo Público lançou o  "Funes", que chamou de "o algoritmo contra a corrupção". Ele usa indicadores de risco para detectar possíveis casos de corrupção em compras públicas. A ferramenta analisou cerca de 245 mil contratos públicos de várias instituições do Peru. Com base nos resultados, o Ojo Público conseguiu revelar casos potenciais de corrupção, lavagem de dinheiro e relações ocultas entre empresas e governos em várias investigações jornalísticas.

3. Aprendizado de Máquina (machine learning)

O aprendizado de máquina é uma subárea da IA na qual as máquinas "aprendem" progressivamente com a própria experiência e com base em dados fornecidos por seres humanos.

O aprendizado de máquina permite que tarefas como análise preditiva, reconhecimento de padrões, personalização e otimização de processos sejam executadas com alta precisão, graças a algoritmos que "aprendem" a analisar grandes volumes de dados.

Exemplo no jornalismo: O Perspective, uma ferramenta desenvolvida pelo jornal espanhol El País em colaboração com o Google, usa modelos de aprendizado de máquina para identificar mensagens inadequadas na área de comentários do site do jornal. A ferramenta trabalha a partir de uma base de dados de comentários rotulados por humanos como indesejáveis. O Perspective analisa esses milhares de comentários e "aprende" a identificar padrões de inadequação. Com esse aprendizado, a ferramenta é capaz de identificar comentários que têm semelhanças com aqueles em sua base de dados e rotulá-los como inadequados ou prejudiciais à comunidade.

4. Redes Neurais

As redes neurais são modelos de aprendizado de máquina inspirados na estrutura e no funcionamento do cérebro biológico. Elas são compostas por unidades interconectadas chamadas "neurônios artificiais" que processam informações e aprendem com os dados. As redes neurais criam um sistema adaptativo que as máquinas usam para aprender com seus erros e melhorar continuamente.

As redes neurais são a unidade fundamental dos Grandes Modelos de Linguagem (LLMs, na sigla em inglês) devido à sua capacidade única de aprender padrões complexos em grandes quantidades de dados. Isso torna os LLMs capazes de executar tarefas como geração coerente de texto, compreensão de linguagem natural ou análise de sentimentos.

Exemplo no jornalismo: A empresa de mídia argentina Grupo Octubre desenvolveu o Visión Latina em 2022. É uma ferramenta de IA para catalogar e identificar personagens latino-americanos em seu material audiovisual. A ferramenta funciona a partir de modelos de reconhecimento de IA que são capazes de aprender a identificar padrões graças a uma rede neural que extrai características de imagens, como bordas, texturas, formas, cores, etc.

O Visión Latina foi treinada com uma base de dados criada pelo Grupo Octubre com imagens das principais figuras da política e cultura latino-americanas, para que o modelo de reconhecimento de IA aprendesse a identificá-las em pesquisas subsequentes.

5. Aprendizado Profundo (deep learning)

O aprendizado profundo é um tipo de aprendizado de máquina em que as máquinas são capazes de "aprender" com a experiência sem a intervenção humana. O aprendizado profundo envolve redes neurais artificiais e várias camadas de processamento de informações, o que possibilita a compreensão de padrões complexos em grandes volumes de dados.

O aprendizado profundo é particularmente útil no processamento de dados não estruturados, como imagens, áudio ou vídeo. Algumas das tarefas em que esse tipo de aprendizado de máquina pode ser aplicado incluem análise de texto, geração automática de conteúdo, reconhecimento de fala, análise de imagens e detecção de padrões.

Exemplo no jornalismo: Pesquisadores do MIT desenvolveram um modelo de aprendizado profundo para detectar notícias falsas. O modelo é capaz de identificar padrões linguísticos de notícias falsas e de informações reais. De acordo com o MIT, o modelo foi treinado com um conjunto de cerca de 12 mil textos com notícias falsas de 244 sites diferentes, e com um conjunto de mais de 10 mil publicações e notícias reais de veículos como The New York Times e The Guardian.

Ao analisar um texto, o modelo escaneia o texto e busca padrões semelhantes aos que aprendeu, e então os processa através de uma série de camadas de processamento até determinar se o texto tem maior ou menor chance de ser falso;

6. Inteligência Artificial Generativa

A IA generativa é o tipo de inteligência artificial capaz de criar novos conteúdos a partir de um aprendizado baseado em dados massivos existentes. Modelos de IA generativa aprendem padrões a partir de grandes volumes de dados e, em seguida, geram conteúdos que seguem esses padrões, seja em formato de texto, imagem, som ou vídeo.

Os modelos de IA generativa atuais foram treinados com enormes quantidades de informações disponíveis online, provenientes de fontes como notícias, livros, páginas da web, bancos de dados abertos, entre outros. Essa diversidade de fontes permite que os modelos aprendam padrões linguísticos, estruturas gramaticais e relações semânticas para aplicá-los na geração de novos conteúdos.

Illustration explaining how the AI-based Quispe Chequea tool works.

O Quispe Chequea, do veículo peruano Ojo Público, utiliza recursos de IA generativa para produzir conteúdo em texto e áudio em línguas originárias. (Foto: Captura de tela do site do Ojo Público)

Exemplo no jornalismo: Em 2023, o veículo de jornalismo investigativo peruano Ojo Público desenvolveu o Quispe Chequea, uma ferramenta que utiliza recursos de IA generativa para produzir conteúdo jornalístico de checagem de fatos em texto e áudio em línguas indígenas. Primeiro, a ferramenta gera um texto no formato de checagem de fatos a partir de informações previamente verificadas por jornalistas. Em seguida, com base nesse texto, o Quispe Chequea gera áudios em espanhol ou nas línguas indígenas quechua, aimará e awajún.

7. Processamento de Linguagem Natural (NLP)

Este é um ramo da IA focado na interação entre sistemas computacionais e a linguagem humana. O NLP, na sigla em inglês, busca tornar as máquinas capazes de entender, interpretar e gerar linguagem de maneira semelhante aos humanos.

Algumas das tarefas que utilizam NLP  são tradução automática, geração de conteúdo em texto ou áudio, e resposta a perguntas.

Exemplo no jornalismo: O VerificAudio é uma ferramenta de detecção de deepfakes de áudio desenvolvida pelo grupo de mídia espanhol ria. Esta ferramenta consiste em dois modelos de NLP que analisam trechos de áudio suspeitos com base em um conjunto de indicadores predefinidos. Os modelos de NLP do VerificAudio são treinados para analisar particularidades da voz, como timbre, entonação e padrões de fala, e depois compará-los com áudios pré-existentes para detectar sinais de clonagem.

8. Grandes Modelos de Linguagem (LLMs)

Os Grandes Modelos de Linguagem (LLMs) são modelos de IA que foram treinados usando quantidades enormes de texto. Esses modelos utilizam NLP e aprendizado de máquina para entender e gerar uma linguagem natural que emula como os humanos falam ou escrevem.

Um LLM é capaz de realizar tarefas como redação de textos, tradução, sumarização de documentos, conversas, entre outros.

Exemplo no jornalismo: O veículo de verificação de dados argentino Chequeado realizou um experimento em 2024 como parte de seu Laboratório de Inteligência Artificial, no qual testou três grandes modelos de linguagem para determinar qual era o mais eficiente para gerar fios (threads) na rede social X. O veículo forneceu aos LLMs um texto de seu site como base. A partir daí, os modelos tiveram que criar um fio respeitando os principais pontos e o estilo do artigo.

9. Chatbot

Chatbots são programas de IA projetados para manter conversas com usuários humanos. Esses sistemas utilizam técnicas de NLP para entender e responder às perguntas e solicitações do usuário, emulando a comunicação humana.

Screenshot of the VerificAudio website.

O VerificAudio, do grupo de mídia PRISA, usa modelos de PLN para analisar peças de áudio e ajudar a detectar deepfakes. (Foto: Captura de tela do site do VerificAudio)

Existem chatbots básicos que simplesmente seguem regras predefinidas para responder a perguntas específicas, mas também há chatbots mais complexos que usam aprendizado de máquina para melhorar suas respostas com a experiência. Alguns dos chatbots mais avançados utilizam LLM para gerar respostas muito mais elaboradas, com referências contextuais.

Exemplo no jornalismo: Em 2018, a organização brasileira de checagem de fatos Aos Fatos lançou o chatbot Fátima, ferramenta para ajudar os leitores a verificar informações por meio de uma conversa no WhatsApp, Telegram, Twitter e Facebook Messenger. Em 2023, o Aos Fatos lançou a versão FátimaGPT, que incorpora a tecnologia LLM para interpretar as perguntas dos usuários e oferecer respostas mais relevantes em linguagem natural.

Ao contrário da sua primeira versão, que funcionava exclusivamente comparando as perguntas dos usuários com os arquivos do Aos Fatos, o FátimaGPT está conectada a um modelo de IA generativa, tornando o chatbot capaz de responder a temas complexos com mais nuance e contexto.

10. Modelos GPT

Os modelos GPT (transformador pré-treinado generativo) são um tipo de LLM desenvolvido pela organização OpenAI. Eles são baseados na arquitetura de transformadores, que são modelos de aprendizado profundo capazes de "entender" o contexto da informação de forma mais profunda, transformando palavras em representações numéricas chamadas vetores, o que permite identificar as relações semânticas e sintáticas da linguagem.

Transformar informações em vetores permite que os modelos GPT realizem tarefas complexas quanto a geração de linguagem semelhante à humana. Esses modelos são o motor do ChatGPT, o chatbot de IA generativa da OpenAI.

Exemplo no jornalismo: A Agência Tatu, um veículo especializado em jornalismo de dados no Brasil, lançou o SururuBot em 2023. É uma ferramenta de IA generativa que produz textos semanais sobre vagas de emprego na cidade de Maceió. O SururuBot trabalha com o modelo GPT-3.5, que permite a geração de texto com base em dados sobre as ofertas de emprego disponíveis.

  1. Prompt

No contexto da IA generativa, um prompt é uma instrução ou pergunta inicial dada a um sistema para gerar uma resposta ou executar uma tarefa específica. Especialistas dizem que quanto mais claros e específicos forem os prompts, mais precisas serão as respostas das plataformas de IA.

Exemplo no jornalismo: Os especialistas em IA e jornalismo da Northwestern University Mowafak Allaham, Michael Crystal, Mona Gomaa e Nicholas Diakopoulos, desenvolveram um guia de técnicas para escrever prompts, com melhores práticas para jornalistas. Eles descrevem diferentes técnicas para usar uma ferramenta de IA generativa de modo obter os resultados mais precisos possíveis para tarefas jornalísticas. O guia inclui exemplos ilustrativos na produção de notícias, bem como uma lista de recursos com outros guias e manuais para especialização na criação de prompts em redações.

  1. API

Uma API (Interface de Programação de Aplicações) é uma interface que permite que um aplicativo ou sistema computacional se comunique com outro para aproveitar suas capacidades. Em essência, uma API é uma ponte que permite que um software acesse as funções ou os dados de outro software.

No contexto da IA, uma API permite que os desenvolvedores integrem capacidades de IA em seus próprios aplicativos sem precisar desenvolver essas capacidades do zero.

Exemplo no jornalismo: A Botalite é uma fornecedora de soluções empresariais (BSP) da organização espanhola de checagem de fatos Maldita.es, autorizado pela empresa de tecnologia Meta para acessar a API do WhatsApp. Com isso, a Botalite pode desenvolver produtos e serviços vinculados às funções e recursos da plataforma de mensagens.

Graças a isso, organizações jornalísticas que trabalham com a Botalite, como Chequeado (Argentina), La Silla Vacía (Colômbia) e Documented (Estados Unidos), puderam desenvolver ferramentas, principalmente chatbots, sem precisar criá-las do zero.

  1. Ajuste Fino (fine tuning)

O ajuste fino é uma técnica dentro da IA que consiste em modificar um modelo previamente treinado para adaptá-lo a uma nova tarefa ou a um conjunto específico de dados. Em vez de iniciar o treinamento do modelo do zero, o que pode demandar muitos recursos e ser demorado, se utiliza um modelo já treinado e se faz o ajuste fino com um conjunto de dados menor e mais específico para a tarefa em questão.

Exemplo no jornalismo: Em 2023, o veículo colombiano de jornalismo investigativo Cuestión Pública desenvolveu a ferramenta de IA Odin para gerar conteúdo jornalístico aproveitando o arquivo de investigações do veículo. Era importante para o veículo que o conteúdo gerado pelo Odin tivesse o tom e o estilo característicos do Cuestión Pública. Para isso, eles personalizaram o modelo GPT 3.5 da OpenAI através de um processo de ajuste fino, baseado em um conjunto de fios do Cuestión Pública no X. Dessa forma, o modelo foi treinado para aprender a escrever com o tom e o estilo dessas publicações.

  1. Análise de Sentimento

Também conhecida como mineração de opinião, a análise de sentimento é uma técnica de IA para identificar emoções em textos. Sistemas de análise de sentimento utilizam algoritmos de NLP para analisar palavras, frases e contextos dentro do texto para determinar, por exemplo, se o sentimento em questão é positivo, negativo ou neutro.

Exemplo no jornalismo: O “Attack Detector” ("Detector de Ataques") é uma ferramenta de IA para detectar discursos de ódio contra jornalistas no X. Ela foi desenvolvida pela Associação Brasileira de Jornalismo Investigativo (Abraji) e pela organização mexicana de jornalismo de dados Data Crítica. Um dos modelos de NLP com os quais o "Attact Detector" trabalha é o RoBERTa, um modelo de análise de sentimento desenvolvido pela Meta capaz de identificar o tom emocional em um texto – neste caso, os casos de ódio.

  1. Visão Computacional

A visão computacional é uma tecnologia que permite que as máquinas extraiam, processem e analisem informações contidas em dados visuais, como imagens e vídeos. Isso inclui detectar objetos, reconhecer rostos e analisar movimentos, entre outras tarefas.

Nem todos os sistemas de visão computacional utilizam IA. No entanto, aqueles que aplicam técnicas de IA, como aprendizado de máquina ou aprendizado profundo, são capazes de realizar funções mais sofisticadas, como reconhecer padrões complexos em imagens, e a IA melhora sua precisão e eficácia.

Cover of the Armando.info report Corredor Furtivo

Para a série "Corredor Furtivo", o site venezuelano Armando.info usou um algoritmo de visão computacional para detectar pistas e minas ilegais em imagens de satélite. (Foto: Captura de tela do Armando.info)

Exemplo no jornalismo: O veículo de jornalismo investigativo venezuelano Armando.info utilizou técnicas de visão computacional com IA para sua série de reportagens "Corredor Furtivo" em 2022. O veículo utilizou um algoritmo desenvolvido pela organização norueguesa Earthrise Media, que foi programado para detectar possíveis minas ilegais e pistas clandestinas na Amazônia venezuelana. A ferramenta foi treinada para detectar padrões semelhantes aos presentes em imagens de satélite nas quais o Armando.info havia mapeado manualmente minas e pistas.

Traduzido por André Duchiade
Regras para republicação