texas-moody

15 conceptos para entender la IA en el periodismo y sus aplicaciones en la sala de redacción

La inteligencia artificial (IA) continúa con su cada vez más rápido camino a convertirse en un elemento presente en muchas industrias, incluido el periodismo. En las salas de redacción, esta tecnología está transformando tareas que en el pasado eran ejecutadas por seres humanos, como la redacción de noticias, la generación de imágenes y el análisis de datos.

El informe “Periodismo, medios y tecnología: tendencias y predicciones para 2024”, publicado en enero por el Instituto Reuters para el Estudio del Periodismo, reportó que éste sería el año de la incorporación plena de la IA en los flujos de trabajo en las redacciones. De los medios de todo el mundo que fueron encuestados para el informe, un 16 por ciento reportó haber designado ya un responsable de actividades relacionadas con la IA en su redacción, mientras que 24 por ciento dijo que planea hacerlo pronto.

No obstante, el periodista e investigador Nic Newman, autor del reporte, dijo que los editores de América Latina han tardado más en adaptarse a la llegada de la IA al periodismo, por lo que estarían menos preparados para hacer frente a esta disrupción tecnológica.

Por eso, hoy presentamos una lista con 15 conceptos clave que todo periodista debe conocer para navegar con confianza en esa transición del periodismo hacia la era de la IA. Cada término viene acompañado de un caso concreto y real de su uso en periodismo, como una forma de ejemplificar los efectos que esta tecnología está teniendo en la industria.

  1. Inteligencia Artificial

Abreviada como IA, la inteligencia artificial es una rama de la informática que se enfoca en la creación de sistemas capaces de realizar tareas que normalmente requerirían de la inteligencia humana. Los sistemas de IA tienen la posibilidad de realizar funciones y resolver problemas complejos en mucho menor tiempo del que le tomaría hacerlo a seres humanos.

En el contexto periodístico, la IA puede aplicarse en tareas como la automatización de procesos, el análisis de datos, la identificación de patrones y tendencias y la generación automatizada de contenido, entre otros.

  • Ejemplo en periodismo: Heliograf, el “robot periodista”, ha sido una de las grandes apuestas de The Washington Post en la aplicación de IA para posicionarse como un diario a la vanguardia. Desarrollado para automatizar la redacción de artículos que involucran grandes cantidades de datos, Heliograf debutó en la cobertura del diario de los Juegos Olímpicos de Río de Janeiro, en 2016, y ese mismo año fue usado para generar artículos, newsletters y post de redes sociales alrededor de las elecciones presidenciales en Estados Unidos.
  1. Algoritmo

Un algoritmo es una secuencia ordenada de instrucciones preestablecidas que sigue una máquina o un sistema para resolver un problema o ejecutar una tarea específica. Los algoritmos funcionan a partir de datos proporcionados por seres humanos, los cuales procesan para luego entregar un resultado.

  • Ejemplo en periodismo: En 2018, el medio de periodismo de investigación peruano Ojo Público estrenó “Funes”, al que llamaron “el algoritmo contra la corrupción”. Se trata de un algoritmo que utiliza indicadores de riesgo para detectar posible corrupción en contrataciones públicas. La herramienta analizó cerca de 245 mil contratos públicos de diversas instituciones públicas de Perú y, a partir de los resultados, Ojo Público pudo revelar casos potenciales de corrupción, lavado de dinero y relaciones ocultas entre empresas y gobiernos en varias investigaciones periodísticas.
  1. Aprendizaje automático

También conocido por su equivalente en inglés, machine learning, es una subárea de la IA en la que las máquinas “aprenden” progresivamente a partir de la experiencia y con base en datos proporcionados por seres humanos.

El aprendizaje automático permite ejecutar tareas como análisis predictivo, reconocimiento de patrones, personalización y optimización de procesos con alta precisión, gracias a algoritmos que “aprenden” a analizar grandes volúmenes de datos.

  1. Redes neuronales

Las redes neuronales son modelos de aprendizaje automático inspirados en la estructura y funcionamiento del cerebro biológico. Están compuestas por unidades interconectadas llamadas "neuronas artificiales" que procesan información y aprenden de los datos. Las redes neuronales crean un sistema adaptable que las máquinas utilizan para aprender de sus errores y mejorar continuamente.

Illustration explaining how the AI-based Quispe Chequea tool works.

Quispe Chequea, del medio peruano Ojo Público, utiliza recursos de IA generativa para producir contenido en texto y audio en lenguas originarias. (Foto: Captura de pantalla del sitio de Ojo Público)

Las redes neuronales son la unidad fundamental de los LLM debido a su capacidad única de aprender patrones complejos en grandes cantidades de datos. Esto hace que los LLM sean capaces de ejecutar tareas como la generación de texto coherente, comprensión del lenguaje natural o el análisis de sentimiento.

  • Ejemplo en periodismo: La empresa de medios argentina Grupo Octubre desarrolló en 2022 Visión Latina, una herramienta de IA para catalogar e identificar a personajes latinoamericanos en su material audiovisual. La herramienta funciona a partir de modelos de reconocimiento visual que son capaces de aprender a identificar patrones gracias a una red neuronal que extrae características de las imágenes, como bordes, texturas, formas, colores, etcétera. Visión Latina fue entrenada con una base de datos creada por Grupo Octubre con imágenes de las principales figuras de la política y cultura latinoamericanas, de modo que el modelo de reconocimiento de imágenes aprendiera a identificarlas para posteriores búsquedas.
  1. Aprendizaje profundo

El deep learning, como también se le conoce, es un tipo de aprendizaje automático en el que las máquinas son capaces de “aprender” con la experiencia sin intervención humana. En el aprendizaje profundo intervienen redes neuronales artificiales y varias capas de procesamiento de información, lo que hace posible la comprensión de patrones complejos en grandes volúmenes de datos.

El aprendizaje profundo es particularmente útil en el procesamiento de datos no estructurados, como imágenes, audio o video. Algunas de las tareas en las que se puede aplicar este tipo de aprendizaje automático incluyen el análisis de texto, la generación automática de contenidos, el reconocimiento de voz, el análisis de imágenes y la detección de patrones.

  • Ejemplo en periodismo: Investigadores del MIT desarrollaron un modelo de aprendizaje profundo para detectar noticias falsas. El modelo es capaz de identificar patrones lingüísticos de noticias falsas y de información real. De acuerdo con el MIT, el modelo fue entrenado con un conjunto de alrededor de 12 mil artículos de noticias falsas de 244 sitios web diferentes, y con un conjunto de más de 10 mil artículos de noticias reales de medios como The New York Times y The Guardian. Al analizar un artículo, el modelo escanea el texto y busca patrones similares a los aprendidos y los envía a una serie de capas de procesamiento hasta determinar si el texto tiene mayor o menor probabilidad de ser falso.
  1. Inteligencia artificial generativa

La IA generativa es el tipo de inteligencia artificial capaz de crear nuevos contenidos a partir del aprendizaje de datos masivos existentes. Los modelos que integran la IA generativa aprenden patrones de grandes volúmenes de datos y luego generan contenido que sigue esos patrones, ya sea en formato de texto, imagen, sonido o video.

Los modelos actuales de IA generativa han sido entrenados con cantidades masivas de información en línea provenientes de fuentes como artículos de noticias, libros, páginas web, bases de datos abiertas, entre otros. Esa diversidad de fuentes permite a los modelos aprender patrones lingüísticos, estructuras gramaticales y relaciones semánticas para aplicarlas en la generación de nuevo contenido.

  • Ejemplo en periodismo: Ojo Público desarrolló en 2023 Quispe Chequea, una herramienta que utiliza recursos de IA generativa para producir contenido de verificación periodística en texto y audio en lenguas originarias. Primero, la herramienta genera un texto con el formato de un chequeo a partir de piezas de información previamente verificada por periodistas. Posteriormente, a partir de ese texto, Quispe Chequea genera un audio en español o en las lenguas indígenas quechua, aymara y awajún.
  1. Procesamiento de lenguaje natural (PLN)

Es una rama de la IA enfocada en la interacción entre sistemas informáticos y el lenguaje humano. El PLN tiene por objetivo hacer que las máquinas sean capaces de comprender, interpretar y generar lenguaje de manera similar a como lo hacen los humanos.

Algunas de las tareas que utilizan PLN son la traducción automática, la generación de contenido en texto o audio y la respuesta a preguntas.

  • Ejemplo en periodismo: VerificAudio es una herramienta de detección de deep-fakes de audio desarrollada por el grupo español de medios PRISA. Esta herramienta consiste de dos modelos de PLN los cuales analizan piezas de audio sospechosas con base en un conjunto de indicadores predeterminados. Los modelos de PLN de VerificAudio están entrenados para analizar particularidades de la voz, como timbre, entonación y patrones del habla, para luego compararlos con los de audios preexistentes y así detectar indicios de clonación.
  1. Modelos de lenguaje de gran tamaño (LLM)

Los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) son modelos de IA que han sido entrenados utilizando enormes cantidades de texto. Estos modelos utilizan el PLN y el aprendizaje automático para comprender y generar un lenguaje natural que emula al que usa el ser humano para hablar o escribir.

Un LLM es capaz de realizar tareas como redacción de textos, traducción, resumen de documentos, conversaciones, entre otras.

  • Ejemplo en periodismo: El medio especializado en verificación de datos Chequeado, de Argentina, realizó un experimento en 2024 como parte de su Laboratorio de Inteligencia Artificial mediante el cual puso a prueba tres modelos de lenguaje de gran tamaño para determinar cuál era el más eficiente para generar hilos en la red social X. El medio dio como base a los LLM un artículo de su sitio web, a partir del cual los modelos debían crear un hilo respetando los puntos principales y el estilo del artículo.
  1.  Chatbot

Los chatbots son programas de IA diseñados para sostener conversaciones con usuarios humanos. Estos sistemas utilizan técnicas de PLN para entender y responder a las entradas de los usuarios emulando la comunicación humana.

Screenshot of the VerificAudio website.

VerificAudio, del grupo de medios PRISA, usa modelos de PLN para analizar piezas de audio y ayudar a detectar deepfakes. (Foto: Captura de pantalla del sitio de VerificAudio)

Existen chatbots básicos que simplemente siguen reglas predefinidas para responder a preguntas específicas, pero también los hay más complejos que utilizan aprendizaje automático para mejorar sus respuestas con la experiencia. Algunos de los chatbots más avanzados emplean LLM para generar respuestas mucho más elaboradas y con referencias contextuales.

  1. Modelo GPT

Los modelos GPT (transformador generativo preentrenado, por sus siglas en inglés) son un tipo de LLM desarrollados por la organización OpenAI. Están basados en la arquitectura de transformadores, que son modelos de aprendizaje profundo capaces de “entender” el contexto de la información de manera más profunda mediante la transformación de las palabras en representaciones numéricas llamadas vectores, que le permiten identificar las relaciones semánticas y sintácticas del lenguaje.

La transformación de la información en vectores permite a los modelos GPT realizar tareas tan complejas como la generación de lenguaje similar al humano. Estos modelos son el motor de ChatGPT, el chatbot de IA generativa de OpenAI.

  • Ejemplo en periodismo: Agência Tatu, un medio especializado en periodismo de datos de Brasil, lanzó en 2023 SururuBot, una herramienta de IA generativa que produce semanalmente textos sobre vacantes de empleo en la ciudad de Maceió. SururuBot funciona con el modelo GPT-3.5, el cual permite generar texto a partir de datos sobre ofertas de trabajo disponibles.
  1.  Prompt

En el contexto de la IA generativa, un prompt es una instrucción o pregunta inicial que se le da a un sistema para que genere una respuesta o realice una tarea específica. Los expertos consideran que entre más claros y específicos sean los prompts, más precisas serán las respuestas de las plataformas de IA.

  • Ejemplo en periodismo: Los expertos en IA y periodismo de la Northwestern University Mowafak Allaham, Michael Crystal, Mona Gomaa y Nicholas Diakopoulos desarrollaron una guía sobre técnicas y buenas prácticas de prompting para periodistas. Los autores describen distintas técnicas para obtener los resultados más precisos posibles de una herramienta de IA generativa para tareas periodísticas.  La guía incluye ejemplos ilustrativos en la producción de noticias, así como una lista de recursos con otras guías y manuales para especializarse en la creación de prompts en las salas de redacción.
  1. API

Una API (Interfaz de programación de aplicaciones, por sus siglas en inglés) es una interfaz que permite a una aplicación o un sistema informático comunicarse con otro para aprovechar sus capacidades. En esencia, una API es un puente que permite que un software acceda a las funciones o datos de otro software.

En el contexto de la IA, una API permite a los desarrolladores integrar funciones de IA dentro de sus propias aplicaciones sin necesidad de desarrollar esas capacidades desde cero.

  • Ejemplo en periodismo: Botalite es un proveedor de soluciones empresariales (BSP, por sus siglas en inglés) de la organización de verificación de datos española Maldita.es que está avalado por la empresa tecnológica Meta para acceder a la API de WhatsApp. Con esto, Botalite puede desarrollar productos y servicios vinculados a las funciones y características de la plataforma de mensajería. Gracias a ello, organizaciones de periodismo que trabajan con Botalite, como Chequeado (Argentina), La Silla Vacía (Colombia) y Documented (Estados Unidos), han podido desarrollar herramientas, principalmente chatbots, sin necesidad de crearlos desde cero.
  1. Fine-tuning

El fine-tuning (ajuste fino) es una técnica dentro de la IA que consiste en modificar un modelo previamente entrenado para adaptarlo a una tarea nueva o a un conjunto de datos específico. En lugar de empezar el entrenamiento del modelo desde el principio, lo cual puede requerir muchos recursos y tiempo, se utiliza un modelo ya entrenado y se realiza un ajuste con un conjunto de datos más pequeño y específico para la tarea en cuestión.

  • Ejemplo en periodismo: El medio de periodismo de investigación Cuestión Pública, de Colombia, desarrolló en 2023 Odin, una herramienta de IA para generar contenido periodístico aprovechando el archivo de investigaciones del medio. Para el medio era importante que el contenido generado por Odin tuviera su tono y estilo característico. Para ello, personalizaron el modelo GPT 3.5 de OpenAI mediante un proceso de fine-tuning, a partir de un conjunto de hilos de X de Cuestión Pública. De esta forma, el modelo fue reentrenado para aprender a escribir con el tono y estilo de esos hilos.
Cover of the Armando.info report Corredor Furtivo

Para la serie "Corredor Furtivo", Armando.info usó un algoritmo de visión computarizada para detectar pistas y minas ilegales en imágenes satelitales. (Foto: Captura de pantalla de Armando.info)

  1. Análisis de sentimientos

También  conocida como extracción de opiniones, el análisis de sentimiento es una técnica de IA para identificar emociones en un texto. Los sistemas de análisis de sentimientos utilizan algoritmos de PLN con los que analizan palabras, frases y contextos dentro del texto para determinar, por ejemplo, si el sentimiento expresado es positivo, negativo o neutral.

  • Ejemplo en periodismo: “Attack Detector” es una herramienta de IA para detectar discurso de odio a periodistas en Twitter, desarrollada por la Asociación Brasileña de Periodismo de Investigación (Abraji) y la organización mexicana de periodismo de datos Data Crítica. Uno de los modelos de PLN con el que funciona “Attack Detector” es RoBERTa, un modelo de análisis de sentimiento desarrollado por Meta capaz de identificar el tono emocional en un texto, en este caso, el odio.
  1. Visión computarizada

La visión computarizada es una tecnología que permite a las máquinas extraer, procesar y analizar información contenida en datos visuales, como imágenes y videos. Esto incluye detectar objetos, reconocer rostros y analizar movimientos, entre otras tareas.

No todos los sistemas de visión computarizada utilizan IA. Sin embargo, los que aplican técnicas de IA, como aprendizaje automático o aprendizaje profundo, son capaces de realizar funciones más sofisticadas, como el reconocimiento de patrones complejos en imágenes, además de que la IA mejora su precisión y eficacia.

Lineamientos para reproducir artículos de LJR