texas-moody

Científicos de datos trabajan en el primer robot-periodista de Brasil para reportar sobre proyectos de ley de la Cámara

La tramitación de proyectos de ley en la Cámara de Diputados va a ser acompañada de cerca por un nuevo periodista: un robot productor de noticias, el primero del tipo en Brasil.

El bot va a producir automáticamente pequeños textos objetivos con informaciones del Medidor de Poder, una base de datos que reúne informaciones sobre leyes, políticos y candidatos. Desde 2016, Operação Serenata de Amor, grupo detrás del proyecto, utiliza inteligencia artificial para monitorear gastos de diputados federales. El lanzamiento del robot productor de noticias está previsto para el segundo semestre de este año, en tiempo para las elecciones de octubre.

Según la directora de Operação Serenata de Amor, Yaso Cordova, becaria de la Digital Kennedy School, la idea es que el bot produzca textos informativos y objetivos de forma ágil y automática.

“Queremos hacerlo con mucho cuidado para dar relevancia a lo que queremos escribir y no atribuir ningún tipo de valoración a los proyectos de ley en las historias”, dijo Cordova al Centro Knight. “No queremos asignar valores que no son transparentes para el elector. La opinión es sólo para los humanos. La idea es dejar que la gente tome sus propias conclusiones, que es lo que ya hacemos con Rosie”, concluyó, refiriéndose a la bot de la Operação Serenata de Amor que notifica gastos sospechosos en la Cámara de Diputados a través de Twitter.

Como fue mencionado, el robot-periodista será capaz de escribir pequeños artículos sobre la tramitación de proyectos de ley en la Cámara de Diputados. El equipo de Serenata de Amor quiere reunir informaciones como el patrimonio de los políticos, las donaciones recibidas por las campañas, los proyectos de ley ya propuestos, y también los gastos con cuotas y enmiendas parlamentarias.

Además de proveer informaciones sobre diputados ya elegidos, la base que está siendo construida con datos públicos puestos a disposición por el Tribunal Superior Electoral (TSE) debe también agregar informaciones sobre candidatos a otros cargos. En las elecciones de octubre, se disputarán vacantes para diputados estatales, federales, senadores, gobernadores y presidente.

Para recolectar y estandarizar todos los datos necesarios, Serenata de Amor contará con organizaciones asociadas, como el proyecto Congresso em Números. “Estructurar todos esos datos de una misma forma es a menudo lo que emperra el trabajo del periodista”, comentó Cordova. “Tenemos muchos datos disponibles, sólo necesitamos juntarlo todo”.

La idea es que esta base de datos sea una herramienta útil para que otros periodistas encuentren temas de artículos y establezcan relaciones entre candidatos o representantes ya elegidos. “Será el trabajo de los periodistas navegar por la base de datos y descubrir relaciones. Es muy parecido a la idea de Panama Papers”, explicó al Centro Knight el científico de datos Irio Musskopf, creador de la Operación Serenata de Amor.

Desafíos en portugués

Tal vez el mayor desafío para el desarrollo del robot-periodista es la falta de tecnología disponible en portugués. Gran parte del conocimiento en este campo es en inglés – los bots que escriben artículos ya son bien utilizados por medios como The Washington Post, que utiliza una herramienta llamada Heliograf.

Transponer esa dificultad es el trabajo de la científica de datos Ana Schwendler, especialista en procesamiento de lenguaje natural. Ella también trabaja en otro proyecto pionero en Brasil, la robot conversacional de verificación de datos, Fátima, desarrollada por el sitio Aos Fatos en sociedad con Facebook.

“El procesamiento de lenguaje natural es una forma de hacer que las máquinas entiendan lo que los humanos escriben”, explicó Schwendler al Centro Knight. “Tenemos que recoger más información de la evaluación como es la estructura [Texto] en portugués y cómo hacer una calidad de producción textual dentro de la normativa portuguesa, algo que aún no existe."

La expectativa es que el robot vaya aprendiendo a hacer textos cada vez mejores con el tiempo, a través de la aplicación de estrategias de aprendizaje de máquina (machine learning) y, más específicamente, aprendizaje profundo (deep learning). Schwendler explica que, en deep learning, redes neuronales artificiales inspiradas por la estructura del cerebro humano usan algoritmos para adquirir conocimiento a través de la experiencia. El robot es entrenado a partir de textos ya consolidados hechos por humanos.

“Tenemos ejemplos de textos que queremos y de él va a aprender”, dijo Schwendler. “Con el paso del tiempo, mejor se va, va aprendiendo lo que es bueno y puede aprender de la respuesta de los usuarios. ... Queremos siempre el feedback de personas de fuera”.

Institucionalización y otros proyectos

La Operación Serenata de Amor comenzó en 2016, apoyada por una campaña de financiamiento colectivo. El nombre, sacado de una marca de dulces, es inspirado por el caso Toblerone, en el que una política sueca tuvo que renunciar a disputar el cargo de primer ministro por haber comprado un chocolate con la tarjeta corporativa. El grupo afirma que quiere “encontrar corrupción en pequeños gastos, pero en volumen grande”. Además, el nombre del sitio es una broma con los nombres de las operaciones realizadas por la Policía Federal brasileña contra la corrupción.

En el proyecto, Rosie, una inteligencia artificial con un nombre inspirado por la robot del dibujo animado Los Supersónicos (The Jetsons) [Robotina en español], monitorea los reembolsos pagados a diputados federales por medio de la Cuota para Ejercicio de Actividad Parlamentaria, fondo que costea alimentación, alojamiento y otros gastos. Se han identificado más de 9 mil reembolsos sospechosos.

Hasta entonces, el grupo estuvo vinculado a la empresa de datos Data Science Brigade, pero este año la Operación Serenata de Amor se convertirá en una ONG bajo el paraguas de Open Knowledge Brasil. “Para nosotros, va a ser muy importante tener una institución que nos apoye a tener nuevas alianzas”, comentó Yaso Cordova.

En este año de elecciones, el equipo de Serenata trabaja en tres proyectos nuevos, contando con el Medidor de Poder y el robot. Uno de ellos es el desarrollo de una nueva interfaz para facilitar la verificación de los reembolsos sospechosos hechos por Rosie. “De esa forma, cumpliríamos nuestra promesa de facilitar la participación ciudadana en los gastos públicos”, afirmó Irio Musskopf.

El otro proyecto en desarrollo busca afrontar un problema muy discutido en el año electoral brasileño: la proliferación de noticias falsas en internet. El grupo quiere desarrollar una extensión para el navegador para identificar contenido mentiroso en línea. El público objetivo está compuesto por adolescentes y ancianos, que generalmente tienen menos experiencia en los medios de comunicación, según Musskopf.

Nota del editor: Esta historia fue publicada originalmente en el blog Periodismo en las Américas del Centro Knight, el predecesor de LatAm Journalism Review.

Artículos Recientes