texas-moody

10 conceitos avançados de IA que todo jornalista deveria conhecer (e como eles podem ser aplicados na redação)

Modelos de previsão que antecipam tendências informativas, redes neurais profundas que otimizam processos automatizados ou técnicas complexas que possibilitam chatbots mais inteligentes são elementos da inteligência artificial (IA) cada vez mais presentes nas redações.

No entanto, ainda existem muitos meios de comunicação e jornalistas que não estão totalmente familiarizados com esses conceitos, alguns dos quais estão redefinindo a forma como o jornalismo é produzido e consumido.

Em uma publicação anterior, a LatAM Journalism Review (LJR) explorou a definição de conceitos básicos da IA e sua aplicação na redação. Desta vez, nos aprofundamos em 10 termos avançados de IA, como mineração de dados, análise preditiva e pesquisa semântica. Também apresentamos exemplos de como esses elementos estão ajudando os meios de comunicação a melhorar aspectos do seu trabalho, como a precisão das investigações, o relacionamento com o público e a eficiência na geração de notícias.

1. Entidade

Uma entidade refere-se a uma unidade de informação que pode ser reconhecida, processada e utilizada por sistemas de IA. As entidades podem representar diversos elementos, como objetos, conceitos, nomes, eventos, quantidades ou relações.

As entidades são essenciais para a interpretação e compreensão dos dados em algoritmos de IA, servindo como blocos de construção para que os sistemas processem e analisem informações de forma eficaz. Ao reconhecer e classificar entidades, os sistemas de IA podem transformar dados não estruturados em informações estruturadas, facilitando tarefas como análise de dados e recuperação de informações.

Exemplo no jornalismo: O TimeLark é uma ferramenta de investigação jornalística desenvolvida em 2023 por jornalistas e técnicos da BBC, do Projeto de Informação sobre Crime Organizado e Corrupção (OCCRP, na sigla em inglês) e da agência Reuters. A ferramenta é usada para analisar grandes volumes de informações e descobrir conexões ocultas entre os elementos de um acontecimento noticioso.

O TimeLark usa machine learning para extrair entidades de matérias jornalísticas não estruturadas, as conexões entre elas e seu relacionamento ao longo do tempo. As informações extraídas são então representadas em gráficos para facilitar sua análise. A ferramenta foi testada com mais de 30 mil artigos da BBC e Reuters sobre a guerra na Ucrânia, onde as entidades extraídas eram líderes políticos, países e organismos internacionais envolvidos, bem como personagens relacionados a eles.

2. Alucinações

No contexto da IA, as alucinações são um fenômeno em que um modelo de IA – especialmente aqueles baseados em modelos de linguagem de grande porte (LLMs, na sigla em inglês) – gera respostas ou resultados incorretos ou incoerentes.

As alucinações podem ser causadas por vários fatores, incluindo o modelo de IA "percebendo" padrões que não existem, ou o modelo não ter informações relevantes suficientes para gerar uma resposta apropriada e tentar preencher a lacuna com informações irrelevantes.

Exemplo no jornalismo: Em 2023, jornalistas do New York Times testaram a precisão do ChatGPT com perguntas como quando o jornal publicou a primeira matéria sobre IA.

A plataforma respondeu que se tratava da matéria "As máquinas serão capazes de aprender e resolver problemas, preveem os cientistas", supostamente publicado em 10 de julho de 1956, como parte da cobertura de uma conferência seminal no Dartmouth College, em New Hampshire.

O New York Times informou que a conferência foi real, mas a matéria nunca existiu.

Especialistas alertaram que alucinações como esta mostram que o uso de IA generativa em tarefas jornalísticas automatizadas pode resultar na publicação de informações falsas ou errôneas que parecem verdadeiras.

3. Text-to-speech

Text-to-speech é uma tecnologia da área de IA que permite gerar áudio sintético de voz humana a partir de texto escrito. Essa conversão é realizada usando algoritmos de processamento de linguagem natural (PLN) para interpretar o texto, juntamente com modelos avançados de síntese de fala.

Entre as técnicas mais utilizadas estão as redes neurais profundas, como Tacotron e WaveNet, que são capazes de gerar áudio fluído e com aparência natural. Outras técnicas mais tradicionais, mas cada vez menos utilizadas, são a concatenação de fragmentos de fala pré-gravados ou modelos matemáticos que simulam as propriedades acústicas da fala.

AI-generated avatar Illariy, created by a Peruvian university, tells the news on TikTok.Exemplo no jornalismo: Illariy é o nome de um avatar criado com IA para apresentar as notícias na língua quíchua em um noticiário universitário no Peru.

Para fazer Illariy falar quíchua fluentemente, seus criadores usaram o D-ID, uma plataforma capaz de fazer imagens "falarem" usando tecnologias de conversão de texto em fala. Como o quíchua não está entre os idiomas suportados pelo D-ID, os criadores do Illariy forneceram à plataforma um texto com vocábulos fonéticos em espanhol que, uma vez lidos pelo sistema, emulavam palavras em quíchua.

4. Reconhecimento óptico de caracteres

O reconhecimento óptico de caracteres (OCR, na sigla em inglês) é uma tecnologia que usa algoritmos especializados para converter documentos com texto em texto editável. Esta tecnologia permite a digitalização de documentos impressos e permite que sistemas informáticos leiam e processem o texto contido em imagens ou arquivos digitalizados.

Os sistemas por trás do OCR podem ser de visão computacional, reconhecimento de padrões ou algoritmos de aprendizagem profunda (Deep Learning OCR). Estes últimos são comumente baseados em redes neurais e são especialmente úteis no reconhecimento de textos manuscritos.

Exemplo no jornalismo: O Consórcio Internacional de Jornalistas Investigativos (ICIJ) criou o Datashare, uma ferramenta de código aberto que permite fazer upload de grandes quantidades de dados e pesquisar informações. A ferramenta inclui tecnologia OCR que permite digitalizar texto de documentos digitalizados e manuscritos.

Um dos usos mais notáveis do Datashare foi na mega investigação transfronteiriça e colaborativa "Pandora Papers", em que a ferramenta ajudou a organizar e analisar 11,9 milhões de documentos vazados. A função OCR permitiu aos jornalistas detectar automaticamente nomes e organizações em documentos, bem como extrair entidades para bases de dados.

5. Mineração de dados

O data mining ou mineração de dados é um processo analítico que utiliza técnicas de machine learning, estatística e sistemas de banco de dados para explorar grandes conjuntos de dados e descobrir padrões, tendências e relacionamentos significativos que não são imediatamente visíveis.

Exemplo no jornalismo: Para investigações jornalísticas baseadas em vazamentos de milhões de documentos, é necessária a análise de grandes quantidades de dados. Jornalistas convocados pelo ICIJ para mega investigações como o Panama Papers, o Paradise Papers ou os Pandora Papers recorreram ao RapidMiner, uma ferramenta que usa algoritmos de mineração de dados.

O RapidMiner ajuda a processar texto e metadados de documentos vazados e criar agrupamentos baseados em palavras e frases comuns, para que a consulta dos arquivos seja mais ágil.

6. Análise preditivaCover of the mega investigation Pandora Papers.

A análise preditiva em IA é uma abordagem baseada em modelos estatísticos, algoritmos de machine learning e dados históricos para prever eventos futuros. Seu objetivo é identificar padrões e tendências em grandes volumes de dados para otimizar a tomada de decisões.

Os algoritmos de análise preditiva processam dados históricos por meio de um fluxo de trabalho que inclui coleta, limpeza e estruturação das informações. O sistema então seleciona as variáveis mais relevantes e aplica modelos matemáticos como regressão, árvores de decisão ou redes neurais para gerar previsões baseadas em probabilidades e padrões detectados nos dados.

Exemplo no jornalismo: O jornal New York Times usou algoritmos de análise preditiva para algumas de suas estratégias comerciais e editoriais. O jornal utilizou essa técnica para analisar como os leitores se tornam assinantes e como eles poderiam ser influenciados para aumentar essas conversões.

A análise preditiva também ajudou o veículo a entender os tópicos que geram maior envolvimento do leitor, para que as equipes de marketing pudessem saber que tipos de artigos promover nas redes sociais.

7. Pesquisa semântica

A pesquisa semântica é uma técnica avançada de pesquisa de dados que se concentra na compreensão do significado e da intenção por trás de uma consulta, em vez de simplesmente pesquisar correspondências literais de palavras-chave.

Essa tecnologia utiliza PLN e machine learning para analisar a linguagem natural e capturar nuances como contexto e intenção do usuário, resultando em uma pesquisa mais precisa e relevante.

Exemplo no jornalismo: AskFT é uma ferramenta generativa de IA desenvolvida pelo jornal britânico Financial Times em 2024, inicialmente disponível apenas para seus clientes corporativos. A ferramenta utiliza um LLM que, por meio de busca semântica, encontra matérias relevantes para a pergunta do usuário.

Para isso, as matérias são previamente desconstruídas em segmentos e vetorizadas. A ferramenta resume as matérias resultantes da busca em uma resposta gerada pelo LLM, que inclui citações das matérias.

8. Reconhecimento de Entidades Nomeadas

O Reconhecimento de Entidades Nomeadas (Named Entity Recognition, NER) é uma subárea do PLN que se concentra na identificação e classificação de entidades nomeadas em textos não estruturados. Essas entidades podem incluir nomes de pessoas, organizações, locais, quantidades, valores monetários, porcentagens, etc.

O NER utiliza algoritmos, modelos estatísticos e aprendizagem profunda para detectar entidades e classificá-las, facilitando a análise e processamento de textos não estruturados.

Exemplo no jornalismo: Jornalistas do La Nación (Argentina), Ojo Público (Peru), CLIP (Costa Rica) e MuckRock (Estados Unidos) desenvolveram em 2021 o DockIns, ferramenta que, por meio de técnicas de machine learning e PLN, analisa e classifica documentos de conteúdo não estruturado, extrai informações desses documentos e identifica temas e entidades.

Para aperfeiçoar a ferramenta, a equipe testou diversos modelos NER, incluindo SpaCy e DocumentCloud, com mais de 10 mil documentos com dados não estruturados de licitações, contratos e compras do Ministério de Segurança da Argentina.

9. Geração Aumentada por Recuperação

A Geração Aumentada por Recuperação (Retrieval-Augmented Generation, RAG) é uma técnica de IA que combina a geração de linguagem natural com a recuperação de informações de outras fontes além dos dados usados para o treinamento do modelo. Isso ajuda a melhorar a precisão das respostas geradas e a evitar "alucinações".

Interface of the Fátima chatbot, developed by Aos Fatos. The screen shows an initial conversation where Fátima, the fact-checking bot, introduces herself and offers to help verify whether a piece of information is true or not. The interface is simple and minimalist, with options to start a new conversation, view welcome messages, and report errors.Um sistema RAG, composto por um LLM e um sistema de recuperação de informação, pode até conectar-se a fontes de informação em tempo real ou frequentemente atualizadas, como redes sociais ou sites de notícias, para gerar respostas com dados atualizados.

Exemplo no jornalismo: Para evitar ao máximo "alucinações", o FátimaGPT, o chatbot de verificação do veículo brasileiro especializado em fact-checking Aos Fatos, usa um modelo RAG. Este modelo RAG vincula o modelo de aprendizagem de linguagem do chatbot a um banco de dados específico e confiável de onde extrai as informações necessárias para gerar respostas.

Esta base de dados é composta por todo o material jornalístico e de verificação que o Aos Fatos tem produzido.

10. Prompt design

O prompt design ou design de instruções é o processo de criação e otimização das instruções dadas aos modelos de IA para que gerem respostas precisas, coerentes e adequadas às necessidades do usuário.

Um bom design de prompts não apenas melhora a precisão das respostas de LLMs, como ChatGPT ou Gemini, mas também permite que você aproveite ao máximo os recursos dessas ferramentas.

O design de prompts inclui o uso de diferentes técnicas, dependendo da situação e do contexto do usuário. Algumas delas são o uso de exemplos, técnicas de tentativa e erro, atribuição de papéis e delimitação de escopo, entre outros.

Exemplo no jornalismo: Joe Amditis, jornalista e professor da Montclair State University em Nova Jersey, publicou em 2023 o "Manual de prompts para iniciantes: ChatGPT para editores de notícias locais", no qual ele ensina como os jornalistas podem criar prompts eficazes e como calibrá-los para casos de uso específicos em suas redações.

O documento apresenta as partes que compõem um bom prompt, discute a importância da clareza, especificidade e contextualização em seu design e oferece diversas técnicas que os jornalistas podem utilizar. Também aborda a importância da iteração e da experimentação no design de prompts para melhorar a precisão e a relevância das respostas.

Traduzido por Marta Szpacenkopf
Republique gratuitamente esta matéria em seu site. Consulte nossas regras para republicação.