A Cloudflare, uma das maiores tecnológicas de infraestrutura da web, anunciou uma ferramenta gratuita e opcional para os administradores de páginas de internet que atrai os rastreadores web que procuram conteúdos para alimentar modelos de Inteligência Artificial. O AI Labyrinth entra em ação quando são detetados “comportamentos inapropriados” por parte dos bots e atrai-os para páginas de engodo, geradas por Inteligência Artificial, com o propósito de “atrasar, confundir e fazer os gastar recursos” dos atores maliciosos.
As páginas web têm um ficheiro chamado robots.txt, na qual são dadas ou negadas as aprovações para os rastreadores web usarem ou não os dados para treinar modelos de Inteligência Artificial. O respeito por este sistema sempre se baseou num código de honra, mas assistimos agora cada vez mais ao ignorar destas práticas, com gigantes como a Anthropic ou a Perplexity AI a serem acusadas de não cumprir o que está escrito nestes ficheiros e a açambarcar os dados mesmo com os donos do site pedem explicitamente que não o façam.
O AI Labyrinth opera a um nível não visível para os utilizadores humanos e serve de ‘pote de mel’ avançado, atraindo os rastreadores (web crawlers) para páginas falsas cada vez mais ‘enterradas’. Esta abordagem permite à Cloudflare detetar bots maliciosos e adicioná-los às listas e perceber melhor os comportamentos nocivos e assinaturas que não seriam detetáveis de outra forma, noticia o The Verge.
Os administradores das páginas podem ativar o AI Labyrinth na secção de Bot Management da sua consola Cloudflare. A empresa explica que tem planos para criar cada vez mais bots generativos para defesa e desenvolver uma rede completa de endereços URL falsos em que os bots tenham dificuldades em perceber que são falsos.