2024/10/10

Pyramid Flow gera vídeo AI de forma eficiente - e open source

O Pyramid Flow é um novo modelo de geração de vídeo AI que pode criar vídeos de alta qualidade com até 10 segundos de duração, e é completamente open-source.

Com a OpenAI a ficar cada vez mais para trás por não disponibilizar o Sora publicamente, criou-se espaço para que serviços rivais surgissem no mercado. O mais recente é o igualmente impressionante Pyramid Flow, que tem a particularidade de ser open source, o que significa que qualquer pessoa pode descarregar, modificar e usar o código gratuitamente.

Criado por investigadores da Universidade de Pequim e pela Kuaishou Technology, utiliza uma nova técnica em que o modelo AI gera o vídeo em etapas de forma bastante eficiente, apenas produzindo uma versão em alta resolução no passo final. Um vídeo de 5 segundos a 384p pode ser gerado em menos de um minuto, mas pode também gerar vídeos com maior qualidade, com 768p, resolução superior ao "HD" convencional com 720p, e duração até 10 segundos. O modelo também tenta evitar polémicas, revelando que usou apenas datasets open source como o LAION-5B e WebVid-10M para o seu processo de treino - embora continuem a existir as questões sobre se esses conjuntos não conterão conteúdos indevidos pelos direitos de autor, ou inapropriados (como vídeos de violência, conteúdos sexuais, etc.)
O que é certo é que este Pyramid Flow vem demonstrar aquilo que já se fazia prever há muito: que estas tecnologias são "imparáveis" e que continuarão a ter de acesso cada vez mais fácil e abrangente, quer se goste / queira ou não.

Sem comentários:

Enviar um comentário (problemas a comentar?)