El Instituto para el Desarrollo del Periodismo en Brasil, o Projor por sus siglas en portugués, lanzó la segunda fase del Fondo de Innovación para Combatir la Desinformación (Codesinfo), centrado en la difusión de cinco herramientas digitales de código abierto creadas para fortalecer la lucha contra la desinformación online. Desarrolladas por medios brasileños a finales de 2024, las soluciones están disponibles de forma gratuita para cualquier organización periodística dentro y fuera de Brasil.
Para llegar a medios internacionales, Francisco Belda, director de operaciones de Projor y coordinador de Codesinfo, dijo que el sitio web de Codesinfo está siendo traducido al inglés y al español, y que los medios socios que crearon las herramientas están recibiendo apoyo para actividades de articulación que permitan divulgar las soluciones.
“Creemos que las cinco herramientas fortalecen el periodismo cívico en general”, dijo Belda a LatAm Journalism Review (LJR). “Esto se debe a su papel en la valorización del concepto de autoría (herramienta Quem Disse?), fact-checking (Check-up), evidencia científica en la cobertura ambiental y del cambio climático (chatbot Capí), producción de videos cortos a partir de reportajes textuales (Mosaico) y en la provisión de información contextual actualizada (Xarta)”.
Capí lucha contra la desinformación medioambiental y climática a través de un chatbot con inteligencia artificial (Disclosure/Codesinfo)
Capí es un chatbot de inteligencia artificial desarrollado por Ambiental Media que fue lanzado en versión beta en noviembre de 2024. El propósito de la herramienta es proporcionar respuestas claras, actualizadas y confiables a las preguntas de los usuarios sobre temas climáticos.
“Tuve la idea de crear un chatbot climático precisamente porque me doy cuenta de que es un tema que, por más que lo intentemos, sigue generando muchas dudas. Creo que la comunidad científica tiene dificultades para comunicar datos con claridad”, dijo Thiago Medaglia, director ejecutivo de Ambiental Media, a LJR. “Y no se trata solo de claridad, ¿verdad? La premisa de Ambiental Media es que la ciencia se transforme en contenido periodístico accesible, claro y atractivo”.
Desarrollado por un equipo multidisciplinario de ingenieros, periodistas, educadores y diseñadores, Capí utiliza una base de datos restringida que incluye reportajes de Ambiental Media y documentos de organizaciones científicas reconocidas. Sus principales fuentes incluyen informes del Panel Intergubernamental sobre Cambio Climático (IPCC), un organismo de la ONU que evalúa datos científicos sobre el calentamiento global, sus impactos y estrategias de mitigación.
“Creemos que Capí puede ser un apoyo en la producción de una historia, o en la etapa de revisión de un reportaje, o en la búsqueda de fuentes o temas. Por ejemplo: estás trabajando en una propuesta y quieres ampliarla, hacer una lluvia de ideas. Capí puede ayudar en todo esto. También en la verificación de información”, dijo Medaglia.
Captura de pantalla de la interfaz del chatbot Capí (Divulgación)
La tecnología detrás de Capí es Gemini, el modelo de lenguaje de gran escala (LLM) desarrollado por Google. Para producir respuestas confiables de manera eficiente, la herramienta utiliza la técnica de generación aumentada por recuperación (RAG), propuesta en 2020 para, entre otras cosas, reducir las alucinaciones y contextualizar los LLM según usos específicos.
Capí no recoge datos personales de los usuarios, pero utiliza el contenido de las interacciones para aprendizaje continuo mediante una técnica conocida como ajuste de instrucciones (prompt tuning). La infraestructura del chatbot opera en servidores especiales de Google Cloud, optimizados para un bajo consumo de energía y bajas emisiones de dióxido de carbono, en línea con los objetivos ambientales de la herramienta.
“Capí es una IA beta, por lo tanto, ciertamente puede alucinar y cometer errores. Lo describimos en el sitio web. Los errores se reportan y los corregimos, pero ella utiliza fuentes confiables que seleccionamos con mucho cuidado y gran discreción”.
La página de GitHub de la herramienta puede visitarse aquí, así como el historial del proyecto y la arquitectura del sistema.
El proyecto Check-up, desarrollado por Aos Fatos, es una iniciativa destinada a analizar la presencia de desinformación en anuncios relacionados con la salud en los principales sitios web de noticias de Brasil. (Divulgación/Codesinfo)
Otra herramienta desarrollada dentro de Codesinfo es Check-up, una solución creada por el sitio de fact-checking Aos Fatos para analizar anuncios sobre salud en los principales sitios de noticias brasileños que puedan contener información engañosa.
“El proyecto surgió de una preocupación por la falta de moderación en las plataformas de publicidad nativa utilizadas por los principales sitios de noticias. Estas herramientas se aprovechan de la credibilidad del periodismo para lucrar con la desinformación —y lo hacen con el consentimiento de las empresas de medios”, dijo Bruno Fávero, director de innovación de Aos Fatos, a LJR. “Vimos que los anuncios con desinformación eran comunes, pero no había datos para analizar el problema de manera sistemática y rigurosa. Creamos Check-up para que nuestra redacción, así como otros investigadores y periodistas, pudieran estudiar el tema”.
El proceso de recolección y análisis de anuncios utiliza una combinación de automatización y análisis manual. El equipo de Aos Fatos creó scrapers que visitan diariamente los principales portales y recogen anuncios nativos. Luego utilizan un modelo de lenguaje para clasificar cada anuncio por tema. Finalmente, los reporteros analizan los anuncios utilizando la metodología de verificación de Aos Fatos, que es pública. Las afirmaciones verificables se comparan con fuentes primarias, datos públicos, estudios confiables o consultas con expertos y se les asigna una calificación.
Captura de pantalla de una lista de anuncios recopilados por la herramienta. (Divulgación/Codesinfo)
El código de la herramienta es abierto y está publicado en el GitHub de Aos Fatos, y puede ser utilizado por investigadores y periodistas interesados en el tema. La documentación de la herramienta explica cómo adaptar el código para recoger anuncios de otros sitios web.
“Las organizaciones de noticias que utilizan servicios de anuncios nativos también pueden utilizar Check-up para analizar la calidad de los anuncios que publican y presionar a las plataformas para mejorar la moderación”, dijo Fávero. “El desafío de financiar el periodismo en Brasil es extremadamente difícil, pero la respuesta no puede ser una práctica que vaya directamente en contra de la razón de existir de la profesión”.
Mosaico es una biblioteca de Python creada por el periódico Folha de S.Paulo para convertir textos en videos cortos usando inteligencia artificial. Basada en MoviePy, una de las bibliotecas de edición de video más populares en Python, Mosaico ofrece una interfaz para trabajar con medios, posicionar elementos, aplicar efectos y generar guiones de video.
“El periódico eligió esta solución para enfrentar el creciente desafío de la desinformación, en un escenario en el que el consumo de videos cortos está aumentando significativamente”, dijo Daniela Braga, editora de Inteligencia Artificial de Folha, a LJR. “Al transformar contenido textual en videos cortos, usando inteligencia artificial, Folha puede ofrecer un tipo de narrativa diferente que, basada en contenido original, puede impactar audiencias que prefieren videos a textos, ampliando así el alcance de sus noticias”.
Mosaico es una librería Python creada por Folha de S.Paulo y diseñada para crear y gestionar programáticamente composiciones de vídeo. (Divulgación/Codesinfo)
Según Braga, la diferencia entre Mosaico y otras soluciones automatizadas de video es que se trata de una herramienta propia, mantenida internamente, entrenada con contenido de la propia Folha y desarrollada para cumplir con los parámetros y estándares de calidad periodística del diario.
“La creación de videos es supervisada por periodistas de Folha, quienes revisan y aprueban el resultado final. El texto y las imágenes son reales. Se han publicado más reportajes en video, sin embargo, su uso comenzó recientemente a expandirse”, dijo Braga.
Para otros medios que deseen adoptar la herramienta, Braga dijo que con el repositorio disponible en GitHub es posible personalizar la herramienta para satisfacer necesidades específicas. Según ella, al tratarse de software de código abierto, los desarrolladores y periodistas pueden contribuir con mejoras, correcciones y nuevas funcionalidades.
“De este modo, la propia comunidad puede impulsar la evolución de la herramienta”, dijo Braga. “Esta automatización también agiliza la producción de videos para satisfacer la demanda de contenido corto y dinámico en redes sociales y reducir la necesidad de equipos dedicados”.
«Quem Disse?» que significa «¿Quién lo dijo?» , es un plugin para el CMS WordPress creado por Folha do Mate, un periódico de Venâncio Aires, en el estado brasileño de Rio Grande do Sul. (Divulgación/Codesinfo)
El plugin "Quem Disse?" (¿Quién dijo?), desarrollado por Folha do Mate, un medio enfocado en el periodismo comunitario que opera en Rio Grande do Sul, en el sur de Brasil, es una extensión de WordPress inspirada en LinkedIn que facilita la construcción y estandarización de perfiles de periodistas. La idea es informar a los lectores sobre características profesionales de los autores, como las áreas de cobertura y la experiencia del reportero. El plugin también incluye una base de datos de fuentes recurrentes, como autoridades y expertos, que presenta mini currículos para cada una.
El plugin es una continuación de las iniciativas anteriores del medio dirigidas a combatir la desinformación, dijo Paula Carvalho, directora comercial de Folha do Mate. Otras iniciativas incluyen talleres de periodismo en escuelas, cuestionarios educativos sobre los riesgos de la desinformación y verificación de noticias enviadas por los lectores.
“El plugin ‘Quem Disse?’ fue creado con el objetivo de destacar a los autores de los artículos, valorando la credibilidad de la fuente y acercando aún más a periodistas y reporteros a los lectores, promoviendo más responsabilidad y claridad en la producción de contenido”, dijo Carvalho.
Con más de 50 años de existencia, Folha do Mate cuenta actualmente, según Carvalho, con unos 4.000 suscriptores activos.
“Esto demuestra una relación sólida y de confianza”, dijo. “Creemos que al ser transparentes sobre nuestros procesos, autoría y fuentes, reforzamos nuestro compromiso con el periodismo serio y con el desarrollo de la región donde operamos”.
El plugin fue desarrollado solo para la plataforma WordPress y las instrucciones de instalación están en el sitio web de Folha do Mate y en GitHub.
Xarta es un minisistema de gestión de contenidos (CMS) de código abierto diseñado específicamente para automatizar la actualización de contenidos contextuales en diversos informativos. (Divulgación/Codesinfo)
Xarta es un sistema creado por Núcleo Jornalismo que automatiza el proceso de contextualización de artículos mediante tarjetas “embebibles” insertadas en diferentes reportajes. Xarta también ayuda a evitar que se utilice contenido descontextualizado para desinformar a la población.
Un ejemplo del uso de la herramienta por parte de Núcleo ocurrió durante el bloqueo de la red social X en Brasil en agosto de 2024. En lugar de crear y actualizar el contexto para cada reportaje sobre el tema, el equipo utilizó Xarta para asegurar que los nuevos textos tuvieran el trasfondo más preciso y actualizado sobre el asunto, y que incluso los artículos antiguos estuvieran siempre al día.
“Tener contextos ya listos sobre hechos noticiosos que estamos siguiendo ayuda a nuestro trabajo, facilita la agilidad en la publicación de nuevos artículos y garantiza que el contexto añadido será el más completo y actualizado. Al mismo tiempo, comenzamos a notar en nuestros datos de audiencia que el último reportaje sobre un determinado hecho no siempre es el que más tráfico recibe. Estos artículos, con contexto antiguo, podrían entonces usarse maliciosamente”, dijo Jade Drummond, directora de operaciones de Núcleo, a LJR. “La combinación de estos dos hallazgos fue lo que dio origen al proyecto. Creamos una herramienta que mantiene los textos actualizados por más tiempo, proporciona un mejor contexto para el hecho noticioso y optimiza el trabajo de la redacción”.
Ejemplo de tarjeta Xarta sobre el bloqueo de Twitter en Brasil. (Divulgación/Codesinfo)
Xarta elimina la necesidad de reescribir el contexto del mismo tema varias veces y también evita que el reportero tenga que volver manualmente a artículos antiguos para incluir información contextual importante.
“Los reporteros y editores no necesitan conocimientos técnicos específicos para usar Xarta en el día a día. Sin embargo, quienes van a crear la aplicación Xarta para la redacción sí necesitan conocimientos técnicos para usar nuestra documentación y código abierto, o pueden contratar a Núcleo para crear esa aplicación”, dijo Drummond. “Una vez creada la página Xarta para la redacción, con las personalizaciones que deseen y el modelo visual estándar, es muy fácil e intuitivo de usar”.
Drummond explicó que cada redacción puede crear su propio Xarta, pero también pueden utilizar tarjetas de contexto de otros medios que hayan sido liberadas para reproducción, como algunas disponibles por parte de Núcleo.
“Tenemos algunas tarjetas que son públicas y permitimos la reproducción a través de la Licencia Creative Commons 4.0, la persona sólo tiene que acceder a la tarjeta e ir a la página que contiene el código de incrustación, que puede copiar e insertar en su artículo”, dijo Drummond. “Todas las redacciones que creen su propia Xarta pueden decidir si quieren permitir o no la reproducción de las tarjetas de contexto producidas”.