A Kyutai lançou o seu assistente AI Moshi, capaz de interagir com voz em tempo real.
Enquanto alguns acusam que na Europa não se faz nada em termos de avanços em AI, eis que a startup francesa Kyutai supreende o mundo ao lançar um modelo AI de voz, de acesso público.
Apesar da OpenAI ter demonstrado capacidades de voz impressionantes no GPT-4o, a verdade é que ainda não as disponibilizou publicamente. Já a Kyutai, disponibiliza o seu Moshi desde já.
O grande destaque vai para a sua capacidade de resposta instantânea, fazendo parecer que se está a falar com uma "pessoa" real e não com um assistente AI que necessita de alguns segundos para processar o que dissemos. Ainda mais impressionante é que a Kyutai diz que isto poderá ser feito localmente, com o hardware de um portátil convencional ou com um GPU comum. E ainda por cima, será disponibilizado como open-source, para que todos os interessados o possam usar ou modificar como bem entenderem.
Podem experimentar o Moshi directamente a partir do browser, ou assistir à apresentação que revela mais detalhes e mostra demonstrações curiosas, incluindo a de por o assistente a falar em inglês com sotaque francês.
Sem comentários:
Enviar um comentário (problemas a comentar?)