Por primera vez en sus 21 años de historia, el Simposio Internacional de Periodismo Online (ISOJ) se celebró exclusivamente en línea en 2020. Para ver este panel en inglés, haga clic aquí. Para ver otros paneles en su idioma original (inglés), haga clic aquí.
Los computadores harán tanto como se les pide, y se necesita un equipo de periodistas para hacerlo, dijeron los panelistas de la sesión “Investigaciones en línea: cómo los periodistas están utilizando IA (inteligencia artificial) y OSINT (inteligencia de fuentes abiertas)” parte del Simposio Internacional de Periodismo Online 2020.
Aunque los periodistas pueden dudar en comenzar a usar el aprendizaje automático (machine learning) porque no entienden lo que es, John Keefe, profesor adjunto de la Escuela de Posgrado de Periodismo Craig Newmark de CUNY, dijo que era como un grupo de pasantes de periodismo que no saben nada más aparte de buscar un cierto patrón y agrupar elementos.
“Son muy buenos, muy dedicados y comprometidos a ayudar, pero no saben mucho sobre el mundo”, dijo Keefe. “Eso es más o menos lo que es el aprendizaje automático en el periodismo cuando buscas usarlo en las redacciones para la investigación”.
Como ejemplo de esto, utilizó el trabajo que Quartz hizo con KPCC, una estación de radio pública en el sur de California que se había comprometido a responder todas las preguntas de COVID-19 que sus oyentes tenían, y pronto recibió más de 1.000 preguntas. Keefe dijo que crearon un modelo que le decía al computador que analizara el lenguaje utilizado y agrupara las preguntas en una docena de grupos diferentes.
“La estación pudo usar esto, darle un grupo a una persona… [y] el trabajo de dividir que se hizo por computadora”, dijo. Este sistema permitió que la estación también atendiera su programación en función de las preguntas que estaba recibiendo, que ahora asciende a más de 3.900.
Emilia Díaz-Struck, editora de investigación y coordinadora para América Latina del Consorcio Internacional de Periodistas de Investigación (ICIJ, por sus siglas en inglés), dijo que la experiencia de los periodistas es significativa al momento de decirles a las máquinas qué hacer. “No es magia y no es una respuesta a todos nuestros problemas periodísticos”, dijo. “Tenemos que decidir cuándo nos embarcamos en una aventura de aprendizaje automático”.
Hay un componente humano y de computadora clave, dijo. En su trabajo para la serie de investigación Implant Files, el equipo de ICIJ enseñó al computar a revisar los datos que se le dieron e identificar las muertes de pacientes en las que los eventos informados a las autoridades se clasificaron erróneamente. Sin embargo, comenzaron a encontrar falsos positivos y los periodistas necesitaron refinar el proceso. Un equipo completo estuvo involucrado desde el principio e hicieron verificación de datos a los hallazgos de la máquina después.
Cuando la moderadora María Teresa Ronderos, fundadora del Centro Latinoamericano de Investigación Periodística (CLIP), les preguntó durante la sección de preguntas y respuestas qué le dirían a aquellos en la industria del periodismo que temían que la inteligencia artificial los dejara sin trabajo, Díaz-Struck dijo que el uso de estas herramientas requiere el aporte y el conocimiento de todos los que están en la sala de redacción. La inteligencia artificial potencia el periodismo, agregó, al dar a los periodistas la oportunidad de ver lo que pasaron por alto.
“Cuando hablas de periodismo de investigación, necesitas verificar tus hallazgos, debes verificar lo que la computadora te muestra, cuáles son los resultados”, dijo Díaz-Struck. “Si el computado está equivocado, debes darle la instrucción al computador, así que todavía necesitas humanos allí… necesitas humanos, necesitas máquinas y necesitas tiempo”.
En cuanto al uso de OSINT en las redacciones, Charlotte Godart, investigadora y entrenadora de fuente abierta de Bellingcat, y su equipo comenzaron a mapear el aumento de casos de violencia policial contra periodistas poco después de que el reportero de CNN, Omar Jiménez, fuera arrestado mientras cubría una protesta de Black Lives Matter en Minneapolis a raíz del asesinato de George Floyd por la policía. Bellingcat ha publicado dos visualizaciones, primero como datos trazados en un mapa interactivo y luego como una colaboración con Arquitectura Forense que permite la navegación de los eventos en el tiempo y por categoría de evento dentro del mapa.
Pudieron obtener el material de código abierto, alrededor de 120 videos, debido a un hilo de Twitter iniciado por su colega Nick Waters pidiéndoles a los usuarios que publicaran cualquier incidente contra equipos de noticias por parte de la policía. Ella explicó el proceso de verificación del equipo de investigación en tres pasos; encontrar la fuente original y verificar cuando se publica; encontrar la geolocalización del incidente e identificar las características de la imagen para que pueda trazarse en un mapa; y finalmente analizar la secuencia de eventos del video corroborando con otros videos para obtener una comprensión completa de lo que sucedió.
Su próximo proyecto es mapear incidentes de violencia policial contra todos los civiles, no solamente periodistas. Dado que no quieren que la policía use los reportajes de Bellingcat para identificar a los manifestantes y posteriormente arrestarlos, Godart dijo que una solución es difuminar toda la imagen y “potencialmente solo dejar algo de sonido para poder dar algún contexto y gravedad de la situación”.
Al igual que Bellingcat, Haley Willis, reportera de investigaciones visuales en The New York Times, y su equipo también realizan trabajos de investigación visual en los que combinan técnicas tradicionales de periodismo (entrevistas con expertos y testigos) y material de fuente abierta, como análisis forense digital como contenido de redes sociales verificadas, audio de escáner policial y datos gubernamentales disponibles públicamente.
Tal fue el caso con su video que deconstruye el asesinato de George Floyd usando imágenes desde diferentes ángulos, información de fuente abierta y todo el audio del escáner policial y las comunicaciones entre EMS (servicios de emergencia), bomberos y la policía de Minneapolis ese día. Esta información visual, dijo, contradice la información inicial en la queja y mostró que el exoficial Derek Chauvin tuvo su rodilla en el cuello de Floyd durante ocho minutos y 15 segundos, y no siete minutos con 49 segundos.
El uso de material de fuente abierta conduce a una mayor transparencia con el público y mayores niveles de rendición de cuentas del gobierno.
“Hacemos investigaciones con la esperanza de que la respuesta oficial cambie o algo salga de eso. Cuando tienes evidencia digital tan específica y eso puede ser replicado por el gobierno o la gente, les resulta más difícil decir que eso no es cierto”, dijo.