Numa nova investigação, emails, documentos internos e chats do Slack mostram que a Nvidia está a usar grandes quantidades de vídeos obtidos online sem permissão para treinar os seus sistemas de Inteligência Artificial. Estes documentos, a que o website 404 Media teve acesso, mostram funcionários a questionar se estas práticas seriam legais e os seus responsáveis diretos a confirmarem que têm a autorização dos mais altos cargos da Nvidia.
O projeto, com o nome interno Cosmos, envolve obter vídeos da Netflix, do YouTube e de outras fontes para treinar o gerador de mundos 3D Omniverse e outros produtos digitais. Com o Cosmos, a empresa pretende criar um modelo fundacional de vídeo que “simule transporte de luz, física e inteligência num único sítio para impulsionar várias aplicações críticas para a Nvidia”.
Num canal do Slack, lê-se que os funcionários da Nvidia usam um programa de código aberto especializado para descarregar vídeos do YouTube, em conjunto com máquinas virtuais que mudam os endereços de IP periodicamente para evitar serem bloqueados pela plataforma de vídeos. Os gestores de projeto discutem a utilização de 20 a 30 máquinas virtuais nos Amazon Web Services para descarregar 80 anos de vídeos por dia.
“Respeitamos os direitos de todos os criadores de conteúdos e estamos confiantes de que os nossos modelos e esforços de investigação cumprem a letra e o espírito da lei”, afimou um porta-voz da Nvidia ao 404 Media.
“As leis de copyright protegem as expressões particulares, mas não os factos, ideias, dados ou informação. Qualquer um é livre para aprender factos, ideias ou informação a partir de outra fonte e usá-los para criar as suas próprias expressões. O uso justo também protege a possibilidade de usar um trabalho para um fim transformativo, como o treino de modelos”, justifica a empresa.
Quando confrontado com este uso da Nvidia, um porta-voz da Google, dona do YouTube, remeteu para “comentários anteriores”, referindo-se a um artigo assinado pelo CEO Neal Mohan em abril de 2024 onde defendia que o uso de vídeos do YouTube pela OpenAI para treinar o Sora, o gerador de vídeos com IA, é uma “clara violação” dos termos de uso da plataforma.