Como forma de maximizar o volume de dados para treinar modelos de Inteligência Artificial, a Google, a OpenAI e a Meta parecem estar a utilizar transcrições de vídeos do YouTube. A revelação, não confirmada oficialmente por nenhum dos envolvidos, é feita pelo The New York Times que explica ter ouvido várias pessoas com conhecimentos destas práticas. Recorde-se que o CEO da YouTube, Neal Mohan, confirmou há dias que o alegado uso dos vídeos do YouTube pela OpenAI para treinar o gerador de texto-para-vídeo Sora ia contra as políticas da plataforma.
O porta-voz da Google, dona da YouTube, Matt Bryant confirmou ao NYT que as regras proibem “análise e descarga não autorizada de vídeos” e afirmou que a Google não estava ciente deste tipo de uso. No entanto, a notícia explica que há pessoas dentro da Google que sabem desta prática e que se remetem ao silêncio porque a própria Google está a usar os vídeos do YouTube para treinar os seus modelos. A Google confirmou oficialmente que o faz apenas com os criadores de vídeos com quem tem acordos para isto.
A política de privacidade da Google terá sido ajustada em julho de 2023 para cobrir mais amplamente o uso de conteúdo disponível publicamente para treino de modelos e de produtos de IA, algo que a Google explicou ter sido feito na altura para tornar a linguagem mais clara.