2014/11/18

Google já consegue descrever uma imagem por palavras


Têm sido feitos enormes avanços na área do processamento e reconhecimento visual. Mas parece que estamos prestes a conseguir fazer algo que não deixará de ser surpreendente - para uma máquina - embora seja algo que qualquer criança consegue fazer: descrever uma imagem em palavras.

Depois de desenvolver sistemas que permitem reconhecer imagens em diferentes categorias (como imagens de praia, flores, por-do-sol, etc.) o Google parece estar agora bastante perto de conseguir ainda mais além e conseguir descrever uma imagem com maior exactidão em palavras.

Este sistema recorrer a um sistema duplo, que primeiro identifica objectos numa imagem, e depois aplica um outro sistema que transforma esses dados em linguagem natural, permitindo rotular automaticamente imagens como "pessoa numa moto a conduzir numa estrada de terra", "cães a brincar na relva", "manada de elefantes num campo de relva seca", etc. Mesmo estando ainda sujeito a muitas incorrecções (por vezes absurdamente cómicas, e que nos trazem de volta à realidade quanto à dificuldade de uma máquina fazer aquilo que um cérebro humano faz com facilidade), não deixa de ser um avanço significativo.

Um sistema deste tipo será de óbvia utilidade para o Google - imaginem poderem pesquisar precisamente pelo tipo de imagem que querem, e obterem os resultados pretendidos - mas também para muitos outros casos. Não só uma ferramenta deste tipo seria de valor incalculável para todos aqueles que têm problemas de visão, permitindo descrever tudo aquilo que pudesse ser visto pela câmara dos seus smartphones (ou óculos digitais); como poderia ser usado também para catalogar automaticamente todas as cenas de todos os filmes, por exemplo.

Parece que o dia em que poderemos pesquisar por um filme com base numa "cena em que uma pessoa se senta num sofá vermelho à frente de uma lareira", está finalmente a aproximar-se. :)

1 comentário:

  1. Isto poderá ser o principio da imortalidade da "vida" no nosso planeta, vida esta que não deverá continuar no seu estado biológico como sempre o conhecemos... que mostra como poderá ser difícil encontrar "vida" noutros planetas procurando apenas por sinais que nos são familiares... resta saber se alguma vez será viável virtualizar um snapshoot de mente humana juntamente com a sua própria consciência ;)

    ResponderEliminar