2023/05/22

Meta revela modelo AI com mais de 4 mil idiomas

A Meta anunciou um novo modelo AI da Meta - MMS (Massively Multilingual Speech) - que é capaz de identificar mais de 4 mil idiomas e converter voz para texto em mais de mil.

A maioria dos sistemas de reconhecimento de voz actuais suportam apenas cerca de 100 idiomas. Embora isso seja suficiente para cobrir a maior parte da população no planeta, deixa de fora milhares de linguagens e dialectos que beneficiariam os seus utilizadores e que seria de interesse histórico preservar. Embora ainda se esteja longe de atingir os mais de 7 mil idiomas falados conhecidos, este MMS da Meta dá um passo de gigante ao permitir a conversão de voz para texto em mais de 1100 idiomas, e de identificar mais de 4 mil.

Para atingir este feito, a Meta voltou-se para os textos religiosos, que são os mais traduzidos para a maioria dos idiomas, obtendo cerca de 32 horas de gravações em mais de 1100 idiomas. E apesar das leituras terem sido predominantemente com vozes masculinas, a Meta diz que isso não teve impacto no reconhecimento de voz também para vozes femininas. Assegura também que, apesar da fonte terem sido textos religiosos, isso em nada influenciou o reconhecimento da voz de modo a torná-la mais "religiosa".

Ao estilo do que tem feito com outros modelos, também este MMS é disponibilizado em open-source para a comunidade, e deverá contribuir para a criação de ferramentas de tradução e conversão de texto para voz muito mais abrangentes que as actuais.

Sem comentários:

Enviar um comentário (problemas a comentar?)