2024/07/04

Moshi chat mostra assistente AI de voz em tempo real

A Kyutai lançou o seu assistente AI Moshi, capaz de interagir com voz em tempo real.

Enquanto alguns acusam que na Europa não se faz nada em termos de avanços em AI, eis que a startup francesa Kyutai supreende o mundo ao lançar um modelo AI de voz, de acesso público.

Apesar da OpenAI ter demonstrado capacidades de voz impressionantes no GPT-4o, a verdade é que ainda não as disponibilizou publicamente. Já a Kyutai, disponibiliza o seu Moshi desde já.

O grande destaque vai para a sua capacidade de resposta instantânea, fazendo parecer que se está a falar com uma "pessoa" real e não com um assistente AI que necessita de alguns segundos para processar o que dissemos. Ainda mais impressionante é que a Kyutai diz que isto poderá ser feito localmente, com o hardware de um portátil convencional ou com um GPU comum. E ainda por cima, será disponibilizado como open-source, para que todos os interessados o possam usar ou modificar como bem entenderem.
Podem experimentar o Moshi directamente a partir do browser, ou assistir à apresentação que revela mais detalhes e mostra demonstrações curiosas, incluindo a de por o assistente a falar em inglês com sotaque francês.


Sem comentários:

Enviar um comentário (problemas a comentar?)