texas-moody

Con IA y un equipo interdisciplinario, La Nación de Argentina encuentra patrones sorprendentes en el discurso de Milei

Durante su primer año de mandato, el presidente de Argentina Javier Milei concedió 58 entrevistas largas a medios de comunicación y pronunció 84 discursos oficiales, totalizando 89 horas de audio y video, según una encuesta de La Nación.

Tras mapear todos los discursos de Milei durante este periodo, el periódico argentino utilizó inteligencia artificial para transcribir y analizar las 739.000 palabras e identificar patrones en el lenguaje del político: desde insultos a la oposición, al Estado y a la prensa, hasta frases que repite habitualmente. El resultado fue el reportaje especial “Así nos habló Milei: 9 trucos del relato libertario para construir un nuevo sentido común”.

“Milei llegó a la presidencia sin partido político, con muy poco poder institucional y sin historia política”, explicó Martín Rodríguez Yebra, editor ejecutivo y columnista de La Nación quien firmó el artículo, a LatAm Journalism Review (LJR). “Su poder residía particularmente en sus palabras. Es un líder muy centrado en la comunicación, y consideramos fundamental desentrañar las características de su discurso: qué lo hace tan único, cuáles son sus trucos más comunes, cómo busca construir una épica que le permita superar sus debilidades políticas. Por eso, comenzamos a recopilar todos sus discursos y entrevistas. Queríamos realizar un análisis basado en datos objetivos y cuantificables”.

Hallazgos del discurso presidencial

El artículo identificó nueve características principales del discurso de Milei, entre ellas el uso frecuente de insultos —se encontraron más de 4.000 expresiones despectivas en 130 discursos y entrevistas—, la construcción de la imagen de un salvador en una catástrofe heredada y el uso recurrente de la hipérbole.

“Lo más sorprendente es la cantidad de insultos y ataques contra sus rivales, la prensa y figuras públicas que, si bien no son sus enemigos, han expresado posturas diferentes a las suyas”, dijo Rodríguez Yebra. “Sabíamos que esto era común, pero no sabíamos que podríamos identificar más de 4.000 ataques de este tipo en tan solo un año”.

El trabajo también analizó los ataques sistemáticos de Milei a la prensa. Según el análisis del periódico argentino, se registraron 410 menciones despectivas al periodismo en 69 discursos y entrevistas.

“Mentiroso” fue la palabra más mencionada en el ranking de descalificaciones utilizadas contra el periodismo, según el reportaje.

El artículo también afirma que, a lo largo de un año, el presidente descalificó a más de 60 periodistas con términos ofensivos en un ejercicio diario en el que bombardeaba a la gente con expresiones como “corruptos”, “miserables”, “resentidos”, “sátrapas”, “mentirosos”, “esbirros” y “farsantes”.

“Desde el principio quedó claro que el ataque sistemático a la prensa era una de las características esenciales del discurso de Milei”, dijo Rodríguez Yebra. “Nunca antes un presidente en Argentina había sido tan agresivo verbalmente con los medios. Nuestro objetivo era determinar patrones para comprender este comportamiento: qué tipo de palabras usa, cuándo es más agresivo y ante qué temas reacciona con mayor agresividad. Creo que el análisis nos permite comprender mejor que se trata de una estrategia, activada en ciertos momentos de necesidad política, y no de una simple reacción espontánea”.

Group of six smiling members of La Nación’s newsroom standing together, one holding a trophy, in front of the outlet’s logo inside their modern office space.

El equipo de La Nación, de izquierda a derecha: Florencia Rodríguez Altube, Martín Rodríguez Yebra, Martín Pascua, Gabriela Bouret, Pablo Loscri y Florencia Fernández Blanco. (Foto: Cortesía La Nación).

Para descifrar el estilo comunicativo del presidente, un equipo multidisciplinario de 14 profesionales trabajó durante aproximadamente dos meses, desde la concepción de la idea hasta la publicación del artículo. El equipo incluía un analista político, un experto en IA, programadores, el equipo de diseño digital, editores de video y un editor general.

“Creo que sin IA, habría sido imposible cuantificar la cantidad de insultos que profirió Milei durante su primer año. Ni determinar con precisión cuánta hipérbole abundaba en sus discursos”, dijo Rodríguez Yebra. “Creo que es humanamente imposible trabajar con decenas de horas de discursos y extraer información cuantitativa y precisa como la que ha logrado este trabajo”.

Arquitectura tecnológica del proyecto

El proceso de desarrollo se dividió en varias etapas bien definidas, explicó Martín Pascua, desarrollador del laboratorio de IA de La Nación.

La primera fase consistió en recopilar los más de 100 videos de discursos y entrevistas que Milei ofreció durante su primer año, y fue liderada por el equipo editorial, bajo la dirección de Rodríguez Yebra. Posteriormente, el equipo de operaciones y desarrollo subió todo el material a Google Cloud Platform (GCP).

“A partir de ahí, comenzamos a evaluar la mejor estrategia técnica para procesar los videos”, dijo Pascua a LJR. “Teníamos experiencia previa en proyectos anteriores, como nuestro análisis del debate presidencial en vivo [octubre de 2023], pero esta vez trabajábamos a una escala mucho mayor, con archivos más largos y un volumen significativamente mayor. Además, habían transcurrido casi 12 meses entre ese proyecto y este, un tiempo considerable en términos de evolución de la IA generativa”.

Pascua explicó que, antes de elegir los modelos de IA más adecuados, el equipo realizó pruebas controladas con varias opciones, como Google Speech, la API Whisper de OpenAI, Whisper ejecutándose localmente y Gemini a través de Vertex AI. Finalmente, eligieron Whisper Large V3, que se ejecuta localmente, para las transcripciones y Gemini Pro para el procesamiento y análisis de contenido.

“Nuestros criterios equilibraron la calidad de la transcripción, la velocidad de procesamiento y los costos operativos, especialmente considerando que trabajábamos con más de 100 discursos, muchos de ellos bastante extensos”, explicó Pascua. “Whisper Large v3 nos brindó los mejores resultados para nuestras necesidades. Nos permitió evitar los costos de uso de la API y, al mismo tiempo, proporcionar una excelente precisión de transcripción, especialmente en la diferenciación de hablantes, crucial para el análisis del discurso. Su ejecución en nuestro propio hardware también nos brindó control total sobre el proceso y la flexibilidad para adaptar el entorno a nuestras necesidades”.

Gemini Pro, según Pascua, ofreció un excelente equilibrio entre calidad, velocidad y costo. Utilizaron la herramienta para corregir errores de transcripción residuales, normalizar el texto y prepararlo para el análisis estructurado; explorar diferentes estrategias para clasificar y agrupar pasajes relevantes; y colaborar con el equipo editorial para iterar sobre diferentes enfoques temáticos.

Tras obtener las transcripciones de los discursos de Milei, Pascua comentó que el equipo creó un script en Python para corregir errores comunes del reconocimiento automático de voz, como errores de puntuación, etiquetas de oradores y muletillas. También desarrollaron una aplicación interna con Streamlit que les permitió cargar y explorar rápidamente todos los textos para facilitar el control de calidad.

Una vez completadas todas las transcripciones, el equipo editorial comenzó a identificar los enfoques temáticos clave. Simultáneamente, el equipo de infografía y diseño digital se unió al equipo para transformar los hallazgos en narrativas visuales claras e impactantes.

“El equipo de diseño trabajó con el equipo de video para encontrar maneras atractivas de presentar la información”, dijo Rodríguez Yebra. “Probamos varios modelos hasta encontrar el que más nos gustó, que nos permite ver la evolución temporal de cada variable del discurso y breves videoclips que resumen la idea”.

Con todos los puntos clave del discurso de Milei definidos y validados, Pascua comentó que se realizó una segunda ronda de procesamiento para cuantificar los hallazgos y entregarlos en un formato estructurado al equipo de diseño, quienes crearon las visualizaciones finales.

“Como desarrollador, esta fue una de las partes más enriquecedoras del proyecto: ver cómo los periodistas trabajan con grandes volúmenes de texto, cómo navegan, comparan y extraen significado fue una verdadera experiencia de aprendizaje”, concluyó. “La dinámica de equipo fue uno de los aspectos más gratificantes de todo el proyecto. Fue un verdadero esfuerzo colaborativo, con perfiles muy diferentes, pero muy complementarios, trabajando juntos con un objetivo común. Personalmente, creo que este tipo de interacción —entre desarrolladores, periodistas y diseñadores— es uno de los aspectos más enriquecedores de trabajar en una redacción hoy en día”.

Validación humana de los datos

A pesar del uso avanzado de la tecnología, ambos profesionales enfatizaron que el trabajo periodístico humano fue esencial para garantizar la precisión y la contextualización de la información obtenida por la IA.

“Quizás la parte más compleja del trabajo fue verificar la precisión de los datos que la IA extrajo de los discursos de Milei”, dijo Rodríguez Yebra. “Revisamos repetidamente las respuestas y nos aseguramos de que [la IA] pudiera interpretar el lenguaje tan específico de Milei. Queríamos ser muy precisos con los datos. Posteriormente, también tuvimos muchas conversaciones sobre cómo presentar la información y qué aspectos omitiríamos para mayor claridad”.

Pascua enfatizó que la revisión humana fue una parte esencial del proceso en cada etapa. El equipo implementó varios mecanismos para garantizar la calidad, incluyendo scripts de limpieza para corregir problemas comunes de transcripción y una herramienta de revisión interna para facilitar la navegación por el contenido. Según el desarrollador, también se crearon flujos de trabajo de validación entre equipos, en los que el equipo técnico revisó los resultados estructuralmente (como el formato, la integridad y la integridad del procesamiento), mientras que el equipo editorial revisó el significado, el tono, la fidelidad a la fuente y la relevancia periodística.

“Desde las primeras transcripciones hasta el resultado final, trabajamos en estrecha coordinación con el equipo editorial para garantizar que los datos se mantuvieran consistentes y fieles al contenido original”, dijo Pascua. “Este proceso de validación híbrido, que combina automatización y supervisión humana, fue clave para obtener un resultado sólido y fiable. Nos permitió no solo corregir errores técnicos, sino también afinar el enfoque editorial a medida que avanzábamos con el material”.

El futuro de la IA en el periodismo de investigación

El trabajo de La Nación ganó el premio al “Mejor Uso de la Inteligencia Artificial en Redacciones”, otorgado por la Asociación Mundial de Editores de Noticias (WAN-IFRA) a principios de mayo.

Según el jurado del premio, el uso de la IA en el trabajo de La Nación ha permitido un nivel de profundidad y precisión que solo la combinación de tecnología avanzada y rigor periodístico puede ofrecer.

“Su implementación ha contribuido claramente a un periodismo más impactante y profundo”, se lee en el comentario del jurado sobre el artículo.

Rodríguez Yebra espera que el reconocimiento a la labor sirva de incentivo para que los equipos editoriales de La Nación y otros medios hagan un mayor uso de las herramientas de IA, no solo para analizar los discursos de las autoridades, sino también para las investigaciones periodísticas en general.

“Estamos trabajando para desarrollar herramientas que nos permitan realizar análisis como este de forma más sencilla y rápida”, dijo el periodista. “Estas herramientas se pueden aplicar, por ejemplo, a un discurso específico y en tiempo real. Creo que las posibilidades son infinitas”.

Para Pascua, desde una perspectiva técnica, el rol de los desarrolladores en las redacciones está evolucionando rápidamente. El desarrollador cree que ya no se trata solo de “apoyar” al equipo editorial con herramientas, sino de participar activamente en la propia investigación, proponiendo nuevas formas de recopilar, procesar y contar historias con datos. En un mundo donde la mayor parte de la información es digital, masiva y en constante cambio, afirmó que la colaboración entre desarrolladores y periodistas es esencial para realizar investigaciones profundas e impactantes.

“La capacidad de aplicar modelos de lenguaje, técnicas de scraping, automatización, visualizaciones interactivas o verificación en tiempo real abre posibilidades narrativas impensables hace tan solo unos años”, dijo Pascua. “Por eso creo que este rol no solo seguirá creciendo, sino que también se especializará cada vez más: con desarrolladores que comprendan las necesidades editoriales, periodistas con habilidades técnicas y equipos híbridos que hablen un mismo idioma. En mi opinión, ahí residen algunos de los futuros más prometedores del periodismo de investigación”.

 

Traducido por Silvia Higuera Flórez
Republica esta historia en tu medio de forma gratuita, con crédito a LJR. Lee nuestros lineamientos