2011/11/30

Entrevista a Juan Picazo da Nuance Ibérica

A propósito da chegada do SDK da Nuance ao mercado português, permitindo a integração fácil do reconhecimento de voz em toda e qualquer App mobile, tivemos a oportunidade de colocar algumas questões a Juan Picazo, responsável da Nuance pelo mercado Ibérico.

Questões onde ficamos a saber se os muitos e variados sotaques portugueses colocaram problemas acrescidos à equipa da Nuance, e se este SDK permite fazer igualmente o reconhecimento "em tempo real" como foi demonstrado na apresentação do Android 4.0 "Ice Cream Sandwich", entre outras coisas.

Já a seguir:



1) A Nuance é uma das empresas que mais tem feito na área do reconhecimento de voz. Que mudanças têm notado na evolução do mercado e o tipo de utilização que tem sido dado aos vossos produtos na última década?

JP (Juan Picazo) - A Nuance já provou ser uma empresa inovadora com tecnologias transformativas e disruptivas em todos os sectores e seus serviços. Ao longo da última década, as contribuições da Nuance e dos seus colaboradores têm se tornado soluções inspiradoras que definem não só a empresa como todos os sectores de actividade.
A tecnologia de reconhecimento de voz atingiu um ponto de viragem e está disponível para os consumidores no dia-a-dia. Para além do consumidor final, a tecnologia de reconhecimento de voz, tem vindo a ser integrada em aplicações empresariais ajudando os profissionais a melhorar a sua oferta de serviços não só em valor acrescentado mas também em impacto causado. Os ditados e as interfaces de reconhecimento de voz vão se tornar, cada vez mais, numa obrigação em todas as aplicações móveis uma vez que esta tecnologia tem vindo a melhorar muito ao longo dos últimos anos.


2) Com a "explosão" do número de equipamentos mobile, e a recente visibilidade acrescida dada por produtos como a Siri, quais os planos que a Nuance tem para o sector mobile?

JP - Os consumidores gostam e querem maior reconhecimento de voz. O sucesso das nossas aplicações,
Dictation® e Search®, reflectem isso mesmo. Ao longo dos próximos 3 a 4 anos esperamos que o discurso seja cada vez mais natural em todas as plataformas móveis.


3) Para além das soluções integradas no sistema operativo, como a Siri, haverá lugar para que cada App individualmente utilize também o reconhecimento voz?

JP - O NDEV Mobile permite que as aplicações mais populares do mercado incluam a tecnologia de
reconhecimento de voz. Alguns exemplos internacionais de sucesso são: o Price Check da Amazon, Ask for iPhone, Merriam-Webster, Dictionary.com, RemoteLink from OnStar, SpeechTrans, Yellow Pages and AirYell from Avantar, iTranslate, Taskmind, SayHi Translate, Vocre, Bon’App, e outras.

A tecnologia de reconhecimento de voz reflecte-se com o objectivo de melhorar a pesquisa:

Páginas Amarelas: Uma aplicação que, com a integração de voz, permite aos utilizadores ditar os seus negócios locais, tornando a pesquisa ainda mais rápida e fácil de aceder à informação que precisa. A app das Páginas Amarelas (Yellow Pages) traz também informação de negócio de qualquer sítio do país – por exemplo diga apenas “Pizza em Chicago, Illinois” – para obter uma nova lista de locais em Chicago. As páginas amarelas estão em primeiro lugar na directoria de navegação da App Store em 2010.


4) Há ainda muitas pessoas que duvidam da capacidade de uma "máquina" poder reconhecer a sua voz de forma fiável; têm algum plano para sensibilizar a população portuguesa a "dar uma hipótese" a esta tecnologia?

JP - Essa é a principais razão pela qual lançámos as aplicações Dragon Dication e Search de forma grátis em Portugal mais cedo este ano. As pessoas querem testar a tecnologia facilmente. Estas aplicações foram muito bem sucedidas em Portugal. Temos um feedback muito positivo por parte de várias pessoas em Portugal.


5) Ainda a nível de reconhecimento de voz, o que nos pode dizer sobre os aspectos técnicos do
reconhecimento de voz como o português? Há dificuldades acrescidas face a línguas como o inglês? De que forma são tratados os diferentes sotaques das várias regiões do país?

JP - Temos acesso a um conjunto de dados em Portugal, incluindo diferentes sotaques e pessoas. Os resultados são bastante bons, podes ver os comentários na App Store sobre o Dragon Dictation. Nós experimentámos esta tecnologia, e a língua portuguesa não era muito mais díficil que outras línguas, hoje em dia lançámos o Dragon Dictation em 25 linguas em todos os continentes e somos número 1 nas App Stores. E melhora à medida que vamos utilizando estas apps.

Aprendizagem:
1. A app aprende a voz à medida da utilização;
2. Adapta-se às condições ambiente como a distância ao microfone e a amplitude da voz.

Língua:
1 Desenvolvemos o que chamamos “aprendizagem não supervisionada”: os nossos servidores decidem
quais as declarações que seguem para o nosso sistema. Quanto maior a utilização melhores os
resultados.
2. O reconhecimento de voz é um processo estatístico: quanto mais data melhor nós conseguimos
prever a transcrição correcta para que o processo de reconhecimento de voz seja correcto.


6) Vimos recentemente que o Google actualizou o seu reconhecimento de voz, permitindo que o texto seja reconhecido em tempo real à medida que é falado, em vez de surgir apenas "no fim da dicção". Poderemos esperar funcionalidade semelhante nos produtos da Nuance para breve?

JP - Esta é a questão de implementação da aplicação, as duas formas são possíveis com a Nuance. Quer o texto pode aparecer directamente no ecrã ou quando é finalizado. Escolhemos por colocar no fim para não gerar confusão e más experiências para os utilizadores.


7) Qual a mensagem final que quer deixar ficar aos developers de Apps nacionais (e internacionais) quanto às potencialidades acrescidas possibilitadas pelo vosso SDK?

JP - O NDEV Mobile torna simples para os programadores tirar partido da tecnologia implementada pela Nuance de modo a tornar as apps capazes de reconhecer voz em todos os SO’s – iOS, Android e Windows Phone 7 – com o poder do Dragon. O NDEV silver é grátis e já se encontra disponível em Português.


O nosso obrigado a Juan Picazo pela sua disponibilidade e... esperemos que rapidamente se possam ver resultados práticos deste SDK nas Apps nacionais. Como foi referido, o nível "silver" é gratuito. :)

Sem comentários:

Enviar um comentário (problemas a comentar?)