"Nove a cada 10 sites de jornalismo no Brasil carecem de protocolos contra a coleta de dados por empresas de inteligência artificial, permitindo que seus conteúdos sejam utilizados para treinar grandes modelos de linguagem.
Segundo a pesquisa The Protocol Gap, lançada nesta quinta-feira (12.mar.2026), 93% dos 4.025 sites de veículos de jornalismo no país analisados não possuem diretivas específicas de bloqueio de agentes de IA por meio de um recurso conhecido como robots.txt, embora 75% dos veículos tenham esse tipo de arquivo em seus sites.
O levantamento foi realizado de forma colaborativa pelas iniciativas Journalism Relay Project*, Momentum e International Fund for Public Interest Media (IFPIM). Os dados de veículos são do Atlas da Notícia.".