Este final de 2024 está a ser agressivo no mundo das tecnologias AI, com a Google a contrpor diversas ferramentas aos anúncios e novidades da OpenAI - algumas das quais estavam prometidas há muito e tardaram a chegar às mãos dos utilizadores.
Foi precisamente isso que aconteceu com o Sora, que passou quase um ano inacessível e só agora foi disponibilizado, um atraso que deu à Google a oportunidade para trabalhar e revelar o seu Veo 2. Este modelo consegue criar vídeos AI com resoluções até 4K e duração superior a dois minutos, superando o Sora da Google, e os vídeos de demonstração que foram apresentados são impressionantes, particularmente a nível de evitar problemas comuns como a geração de mãos realistas que não tenham dedos a mais ou a menos. O Veo 2 também permite o controlo dos movimentos de câmara, facilitando a obtenção dos vídeos da forma que se deseja.
Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts. 🎥
— Google DeepMind (@GoogleDeepMind) December 16, 2024
We’re also releasing an improved version of our text-to-image model, Imagen 3 - available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4
Não demorou para que fosse feita uma comparação directa a um vídeo a cortar um tomate, que teve resultados desastrosos no Sora:
E que o Veo 2 foi capaz de criar sem problemas:@OpenAI, 😔 pic.twitter.com/4d5XAGzctd
— Ant A (@AntDX316) December 16, 2024
"A pair of hands skillfully slicing a ripe tomato on a wooden cutting board"#veo pic.twitter.com/VDuxnkvIa0
— Agrim Gupta (@agrimgupta92) December 16, 2024
A par do Veo 2, a Google também disse ter feito melhorias no seu modelo Imagen 3 de geração de imagens, que passa a gerar imagens mais detalhas, com texturas mais nítidas, e com capacidade para replicar maior variedade de estilos artísticos.We’ve also enhanced Imagen 3’s ability to:
— Google DeepMind (@GoogleDeepMind) December 16, 2024
▪️ Produce diverse art styles: realism, fantasy, portraiture and more
▪️ More faithfully turn prompts into accurate images
▪️ Generate brighter, more compositionally balanced visuals
→ https://t.co/MmdiHyrugR pic.twitter.com/L1l2Qzs5up
A este ritmo, parece não estar muito distante a possibilidade de, em vez de ver filmes pré-feitos, se possa começar a assistir a vídeos personalizados gerados em função das preferências de cada um, e com a possibilidade de serem interactivos, seguindo o rumo ou enredo que cada um optar no momento.
Sem comentários:
Enviar um comentário