2015/09/25

Google melhora o seu reconhecimento de voz


O Google é uma das empresas que tem um dos mais fiáveis sistemas de reconhecimento de voz - e agora diz ter feito algumas alterações que fazem com que esse reconhecimento seja ainda melhor a perceber aquilo que dizemos, mesmo em ambientes ruidosos.

Os sistemas de reconhecimento de voz já funcionam bastante bem, mas bastará relembrar a nossa capacidade para conseguir ouvir o nosso nome mesmo numa sala com dezenas de pessoas a falar ao mesmo tempo, ou de conseguir falar com alguém no meio de uma discoteca com volume ensurdecedor para demonstrar que os computadores ainda têm que melhorar bastante. É isso que o Google está a fazer, com um novo sistema de reconhecimento de voz.

Este novo sistema funciona de forma mais rápida, com análise de fonemas em tempo real, e que permite ir acompanhando o reconhecimento praticamente à medida que vai sendo dito - e dando uso a redes neuronais mais avançadas.

Este sistema já está a ser utilizado pelas apps do Google tanto para Android como para iOS, pelo que todos podem pô-lo à prova e ver que tal se safa a reconhecer a sua voz. Aliás, importa referir que o Google também já deu um grande passo em frente, fazendo com que seja possível reconhecer coisas tanto em inglês como em português, independentemente da língua que se tiver definida. Mesmo que tenham o reconhecimento de voz definido para português poderão perguntar coisas como "what's the weather for tomorrow"; ou "qual o tempo para amanhã" caso o tenham em inglês.

... Só têm que melhorar a capacidade bilingue numa mesma frase, para permitir perguntar coisas como "What's the age of <nome em português>" (embora o contrário já funcione bastante bem: "Qual a idade de <nome em inglês>"). Se alguém souber chinês, que faça um teste idêntico para saber se esta capacidade multilíngua também funciona! :)

1 comentário:

  1. Sempre pensei que fosse mais difícil a conversão de voz para texto do que a conversão de texto para voz, mas infelizmente a co versão de texto para voz ainda só funciona em brasileiro..

    ResponderEliminar