2024/08/07

Nvidia tem usado vídeos do YouTube para treinar AI

A Nvidia tem usado milhões de horas de vídeos no YouTube para treinar modelos AI sem pedir autorização.

A Nvidia tem estado no centro da revolução AI que atravessamos, nem que seja pelo facto dos seus chips serem os mais utilizados e procurados para o complexo processo de treino dos modelos AI, que podem demorar meses mesmo usando milhares de GPUs. E agora vê-se atirada também para outra questão que tem estado em voga, quanto ao uso potencialmente indevido de dados.

Para o treino dos modelos AI é necessária a maior quantidade possível de dados, sejam eles texto, voz, música, vídeos, ou qualquer outra coisa a que o modelo AI se destine. Obviamente, nem todos apreciam que os seus conteúdos sejam criados para este fim, e isso tem dado origem a todo um movimento de retaliação, de pessoas e plataformas que rejeitam que os seus conteúdos sejam usados para esse fim. Mas, essa luta está longe de estar terminada.

Muitas destas empresas têm optado por considerar que, se algum conteúdo está visível e acessível na internet, então é de uso legítimo para ser usado no treino de modelos AI - até mesmo se isso significar ignorar os pedidos de que isso não seja feito. E parece que a Nvidia se junta a este grupo, com acusação de ter dado ordens aos funcionários para usarem todos os vídeos que desejassem do YouTube, mesmo quando alguns deles expressaram algumas dúvidas quanto à legitimidade dessa operação.

O tópico certamente vai dar que falar durante as próximas décadas, podendo levar à própria génese da dita "criatividade" humana. Praticamente todas as ideias originais existentes assentam numa base dos conteúdos, livros, filmes, músicas, a que essas pessoas estiveram expostas, podendo essa influência ser mais ou menos notória, com uma linha ténua a separar a imitação de algo suficientemente diferente para ser considerado original. Será que se deve aplicar esse mesmo princípio aos modelos AI e de que este uso de "tudo o que se pode ver" seja fair use, ou seguiremos num caminho em que todos os conteúdos tenham que ser licenciados e pagos?

Com sorte, pode ser que tudo isto resulte numa muito necessária reforma completa do sistema de copyright / direitos de autor, que há muito tem estado completamente desiquilibrado a favor dos autores em prejuízo de todos os outros.

Sem comentários:

Enviar um comentário (problemas a comentar?)