2023/10/24

AI facilita pesquisa de vídeo

Em sentido contrário ao da geração de imagens, há quem trabalhe com sistemas AI para catalogar tudo o que acontece em vídeos e facilitar pesquisas e outras operações.

Apesar de nos últimos tempos se dar maior destaque às ferramentas de geração de imagem a partir de texto, como o Dall-E e Imagen - que, sem qualquer dúvida, são impressionantes - o mesmo tipo de avanços também tem sido aplicado em sentido contrário, na interpretação daquilo que se pode ver em fotos e em vídeos.

Estes novos modelos AI têm capacidade de reconhecer todos os objectos que aparecem em cada frame de um vídeo, e também das acções que estão a ser feitas. E com isso, torna-se possível criar motores de pesquisa de vídeo que são capazes de identificar qualquer coisa que o utilizador peça, como "mostra a cena em que uma pessoa está sentada a comer com uma janela a mostrar o pôr do sol", como também criar descrições e resumos automáticos de filmes. Para além das aplicações de pesquisa e sumarização, esta capacidade de interpretar o vídeo também permite criar sistemas que dividam automaticamente um vídeo em capítulos, ou que determinam os melhores momentos para apresentação de publicidade.

Para os utilizadores finais, poderá ser um precioso auxiliar para descobrir "aquele filme" do qual não nos lembramos do nome mas em que somos capazes de descrever uma cena.

Sem comentários:

Enviar um comentário (problemas a comentar?)