2016/08/27

Facebook disponibiliza tecnologia de reconhecimento de imagens como open-source


Os computadores têm grande dificuldade em perceber e reconhecer imagens, mas o Facebook quer dar uma ajuda disponibilizando um conjunto de ferramentas que desenvolveu, como open-source.

Pergunte-se a uma criança com 3 ou 4 anos o que está numa fotografia e ela será capaz de o fazer sem grandes dificuldades. Mas para um computador, uma imagem é apenas um conjunto de pixeis, números, que podem ser diferentes mas que, para todos os efeitos, são "todos iguais".

É aí que entram as ferramentas DeepMask, SharpMask, e MultiPathNet do Facebook AI Research (FAIR).

O DeepMask é o sistema que é capaz de olhar para uma imagem e separar os elementos que acha serem distintos. No entanto, esta separação (que é posteriormente refinada com o SharpMask) limita-se apenas a detectar esse elementos, não tendo ainda qualquer ideia do que se trata. Por exemplo, numa foto de uma estrada poderá individualizar vários carros e peões, mas nesta fase não sabe qual deles é um carro e qual é um peão. Isso é feito com a ferramenta seguinte, a MultiPathNet - sendo esta a responsável por tentar olhar para os elementos em questão e tentar identificá-los da melhor maneira possível.

É graças a estas ferramentas que o Facebook pode fazer coisas como a legendagem automática de fotos (e também permitir a pesquisa das fotos com base naquilo que elas contêm - tal como a Google também faz no seu Google Photos.)

Agora que passam para o campo do open-source, será apenas uma questão de tempo até vermos muitas mais apps e serviços começarem a disponibilizar este tipo de funcionalidades.

Sem comentários:

Enviar um comentário (problemas a comentar?)