Durante seu primeiro ano no governo, o presidente da Argentina Javier Milei concedeu 58 entrevistas longas a veículos de comunicação e proferiu 84 discursos oficiais, em um total de 89 horas de áudio e vídeo, segundo levantamento do La Nación.
Depois de mapear todas as falas de Milei neste período, o jornal argentino usou inteligência artificial para transcrever e analisar as 739 mil palavras para identificar padrões de linguagem do político: de insultos a opositores, ao Estado e à imprensa, a frases que ele repete rotineiramente. O resultado foi a reportagem especial "Así nos habló Milei: 9 trucos del relato libertario para construir un nuevo sentido común" (Assim nos falou Milei: 9 truques do relato libertário para construir um novo senso comum).
"Milei se tornou presidente sem um partido político, com muito pouco poder institucional e sem histórico político” explicou Martín Rodríguez Yebra, editor executivo e colunista do La Nación que assina a matéria, à LatAm Journalism Review (LJR). “Seu poder repousava particularmente em suas palavras. Ele é um líder muito focado na comunicação, e pensamos que seria muito importante desvendar as características de seu discurso: o que o torna tão único, quais são seus 'truques' mais comuns, como ele busca construir uma épica que lhe permite superar suas fraquezas políticas. Foi por isso que começamos a coletar todos os seus discursos e entrevistas. Queríamos realizar uma análise baseada em dados objetivos e quantificáveis."
A matéria apurou nove características principais do discurso de Milei, incluindo o uso frequente de insultos — foram mais de 4 mil expressões desqualificantes presentes em 130 discursos e entrevistas — , a construção da imagem de salvador em uma catástrofe herdada e o uso recorrente de hipérboles.
"O mais surpreendente é o número de insultos e ataques aos seus rivais, à imprensa e a figuras públicas que, embora não sejam seus inimigos, expressaram posições diferentes da sua”, disse Rodríguez Yebra. “Sabíamos que isso era comum, mas não sabíamos que seríamos capazes de identificar mais de 4.000 ataques desse tipo em apenas um ano."
O trabalho também analisou os ataques sistemáticos de Milei à imprensa. De acordo com a análise do jornal argentino, foram 410 menções depreciativas sobre o jornalismo registradas em 69 discursos e entrevistas.
“Mentiroso” foi a palavra com mais menções no ranking de desqualificações utilizadas contra o jornalismo, segundo a reportagem.
A matéria diz ainda que, ao longo de um ano, o presidente desqualificou mais de 60 jornalistas com termos ofensivos em um exercício diário em que bombardeava as pessoas com expressões como "corruptos", "miseráveis", "ressentidos", "tiranos", "mentirosos", "capangas" e "falsos".
"Estava claro desde o início que o ataque sistemático à imprensa era uma das características essenciais do discurso de Milei”, explicou o jornalista. “Nunca antes um presidente na Argentina havia sido tão verbalmente agressivo em relação à mídia. Nosso objetivo era determinar padrões para entender esse comportamento: que tipo de palavras ele usa, quando é mais agressivo e em quais questões reage mais agressivamente. Acredito que a análise nos permite entender melhor que essa é uma estratégia, ativada em certos momentos de necessidade política, e não uma simples reação espontânea."
Equipe do La Nación, da esquerda para a direita: Florencia Rodríguez Altube, Martín Rodríguez Yebra, Martín Pascua, Gabriela Bouret, Pablo Loscri e Florencia Fernández Blanco. (Crédito: Divulgação/La Nación)
Para decifrar o estilo comunicativo do presidente, um time multidisciplinar de 14 profissionais trabalhou por cerca de dois meses desde a concepção da ideia até a publicação da matéria. A equipe incluía um analista político, um especialista em IA, programadores, a equipe de design digital, editores de vídeo e um editor geral.
“Eu acho que sem IA, teria sido impossível quantificar o número de insultos que Milei proferiu ao longo de seu primeiro ano. Ou determinar com precisão o quanto de hipérbole permeou seus discursos”, disse Rodríguez Yebra. "Acho humanamente impossível trabalhar com dezenas de horas de discurso e conseguir extrair informações quantitativas e precisas como este trabalho fez.”
O processo de desenvolvimento foi dividido em várias etapas bem definidas, explicou Martín Pascua, desenvolvedor do laboratório de IA do La Nación.
A primeira fase consistiu na coleta dos mais de 100 vídeos de discursos e entrevistas que Milei deu em seu primeiro ano, e foi liderada pela equipe editorial, sob a direção de Rodríguez Yebra. Em seguida, a equipe de operações e devops carregou todo o material para o Google Cloud Platform (GCP).
"A partir daí, começamos a avaliar a melhor estratégia técnica para processar os vídeos” disse Pascua à LJR. Tínhamos experiência prévia de projetos anteriores, como nossa análise ao vivo do debate presidencial [em outubro de 2023], mas desta vez estávamos trabalhando em uma escala muito maior, com arquivos mais longos e um volume significativamente maior. Além disso, quase 12 meses haviam se passado entre aquele projeto e este, um longo tempo em termos de evolução da IA generativa.”
Pascua contou que antes de escolher os modelos de IA mais adequados, a equipe realizou testes controlados com diversas opções, como Google Speech, API Whisper da OpenAI, Whisper rodando localmente e Gemini via Vertex AI. Eles acabaram escolhendo o Whisper Large V3 executado localmente para as transcrições e o Gemini Pro para processamento e análise de conteúdo.
"Nossos critérios equilibraram qualidade de transcrição, velocidade de processamento e custos operacionais — especialmente considerando que estávamos trabalhando com mais de 100 discursos, muitos deles bem longos”, disse Pascua. “O Whisper Large v3 apresentou os melhores resultados para as nossas necessidades. Isso nos permitiu evitar custos com o uso de APIs, ao mesmo tempo em que proporcionou excelente precisão de transcrição, especialmente na diferenciação de falantes, crucial para a análise do discurso. Executá-lo em nosso próprio hardware também nos deu controle total sobre o processo e a flexibilidade para adaptar o ambiente às nossas necessidades.”
O Gemini Pro, segundo Pascua, forneceu um excelente equilíbrio de qualidade, velocidade e custo. Eles usaram a ferramenta para corrigir erros residuais de transcrição; normalizar o texto e prepará-lo para análise estruturada; explorar diferentes estratégias para classificar e agrupar trechos relevantes; e colaborar com a equipe editorial para iterar sobre diferentes ângulos temáticos.
Após obter as transcrições dos discursos de Milei, Pascua disse que a equipe criou um script em Python para limpar erros comuns do reconhecimento automático de fala, como problemas de pontuação, rotulagem de falantes e palavras de preenchimento. Eles também desenvolveram uma aplicação interna usando Streamlit, que permitia carregar e explorar todos os textos rapidamente, para facilitar o controle de qualidade.
Depois que todas as transcrições foram concluídas, a equipe editorial começou a identificar os principais focos temáticos. Ao mesmo tempo, a equipe de infográficos e de design digital se juntou ao time para começar a transformar as descobertas em narrativas visuais claras e impactantes.
“A equipe de design trabalhou com a equipe de vídeo em maneiras envolventes de apresentar as informações”, disse Rodríguez Yebra. “Testamos vários modelos até chegarmos ao que mais gostamos, o que nos permite ver as evoluções temporais de cada variável da fala e pequenos videoclipes que resumem a ideia.”
Com todos os pontos-chave do discurso de Milei definidos e validados, Pascua contou que foi realizada uma segunda rodada de processamento para quantificar as descobertas e entregá-las em um formato estruturado para a equipe de design, que construiu as visualizações finais.
“Como desenvolvedor, essa foi uma das partes mais enriquecedoras do projeto: ver como os jornalistas trabalham com grandes volumes de texto, como eles navegam, comparam e extraem significado foi uma verdadeira experiência de aprendizado”, disse Pascua. “A dinâmica da equipe também foi um dos aspectos mais gratificantes de todo o projeto. Foi um verdadeiro esforço colaborativo, com perfis muito diferentes, mas altamente complementares, trabalhando juntos com um objetivo comum. Pessoalmente, acho que esse tipo de interação — entre desenvolvedores, jornalistas e designers — é uma das partes mais enriquecedoras do trabalho em uma redação hoje em dia.
Apesar do uso avançado de tecnologia, ambos os profissionais reforçaram que o trabalho jornalístico humano foi essencial para garantir a precisão e a contextualização das informações obtidas pela IA.
“Talvez a parte mais complexa do trabalho tenha sido verificar a precisão dos dados extraídos da fala de Milei pela IA”, disse Rodríguez Yebra. “Revisamos repetidamente as respostas e garantimos que ela [a IA] pudesse interpretar a linguagem específica de Milei. Queríamos ser muito precisos com os dados. Depois, também tivemos muitas discussões sobre como apresentar as informações e o que deixaríamos de fora, por uma questão de clareza.”
Pascua ressaltou que a revisão humana foi uma parte essencial do processo em todas as etapas. A equipe implementou diversos mecanismos para garantir a qualidade, incluindo scripts de limpeza para corrigir problemas comuns de transcrição e uma ferramenta interna de revisão para facilitar a navegação pelo conteúdo. Segundo o desenvolvedor, também foram criados fluxos de trabalho de validação entre equipes, nos quais a equipe técnica revisava os resultados estruturalmente — como formatação, completude, integridade do processamento —, enquanto a equipe editorial revisava o significado, o tom, a fidelidade à fonte e a relevância jornalística.
"Desde as primeiras transcrições até os resultados finais, trabalhamos em estreita coordenação com a equipe editorial para garantir que os dados permanecessem consistentes e fiéis ao conteúdo original", explicou Pascua. “Esse processo de validação híbrido, combinando automação e supervisão humana, foi fundamental para a entrega de um resultado robusto e confiável. Ele nos permitiu não apenas corrigir erros técnicos, mas também refinar o foco editorial à medida que avançávamos no material.”
O trabalho do La Nación foi vencedor do prêmio de "Melhor Uso de Inteligência Artificial na Redação", concedido pela Associação Mundial de Editores de Notícias (WAN-IFRA), no começo de maio.
De acordo com o júri do prêmio, o uso da IA no trabalho do La Nación permitiu um nível de profundidade e precisão que só a combinação de tecnologia avançada e rigor jornalístico pode proporcionar.
“Sua implementação contribuiu claramente para uma forma de jornalismo mais impactante e perspicaz”, diz o comentário dos jurados sobre a matéria.
Rodríguez Yebra disse que espera que o reconhecimento do trabalho possa servir como incentivo para que as equipes editoriais do La Nación e de outros veículos utilizem mais amplamente ferramentas de IA não só para analisar discursos de autoridades, mas também para investigações jornalísticas em geral.
"Estamos trabalhando para desenvolver ferramentas que nos permitam realizar análises como esta de forma mais simples e rápida”, disse o jornalista. “Essas ferramentas podem ser aplicadas, por exemplo, a um discurso específico e em tempo real. Acho que as possibilidades são infinitas.”
Para Pascua, de uma perspectiva técnica, o papel dos desenvolvedores nas redações está evoluindo rapidamente. O desenvolvedor acredita que não se trata mais apenas de “apoiar” a equipe editorial com ferramentas, e sim de estar ativamente envolvido na própria investigação, propondo novas maneiras de coletar, processar e contar histórias com dados. Em um mundo em que a maioria das informações é digital, massiva e em constante mudança, ele disse que a colaboração entre desenvolvedores e jornalistas é essencial para conduzir investigações profundas e impactantes.
“A capacidade de aplicar modelos de linguagem, técnicas de scraping, automação, visualizações interativas ou verificação em tempo real abre possibilidades de narrativa impensáveis há apenas alguns anos", disse Pascua. “É por isso que acredito que essa função não só continuará a crescer, como também se tornará cada vez mais especializada — com desenvolvedores que entendem as necessidades editoriais, jornalistas tecnicamente qualificados e equipes híbridas que falam a mesma língua. Na minha opinião, é aí que residem alguns dos futuros mais promissores do jornalismo investigativo.”