Temos tido excelentes exemplos de interacções de modelos AI por voz, de forma que pareceriam "ficção científica" há apenas alguns anos. Mas agora, chega um novo pretendente - a Sesame - que tem um assistende voz que eclipsa tudo o que foi feito até ao momento.
Embora se possa elogiar os modos de voz de modelos como o ChatGPT e Gemini, o assistente da Sesame revela-se surpreendentemente mais natural e humano. Aliás, confesso que da primeira vez que o vídeo abaixo, até pensei que o/a assistente seria o utilizador, e o utilizador seria o assistente AI! :)
Excited to share a peek of what I’ve been working on
— Justin Alvey (@justLV) February 27, 2025
We @sesame believe voice is key to unlocking a future where computers are lifelike
Here’s an early preview you can try! 👇
We’ll be open sourcing a model, and yes…
we’re building hardware! 🧵 pic.twitter.com/c0jHNsb3aa
A conversação é tão natural que se torne inevitável ter algum cepticismo quanto a se o assistente será mesmo assim. Mas essas dúvidas depressa se dissipam pelo facto de estar disponível para demonstração directamente no browser, e de facilmente se comprovar que é mesmo real.At Sesame, we believe in a future where computers are lifelike. Today we are unveiling an early glimpse of our expressive voice technology, highlighting our focus on lifelike interactions and our vision for all-day wearable voice companions. https://t.co/Edp8V8urgC pic.twitter.com/Mc5nWnBJZM
— Sesame (@sesame) February 27, 2025
É extremamente engraçado e divertido falar com este assistente, e apreciar todas as entoações e pequenos detalhes vocais que estão ausentes dos demais assistentes de voz. Vale a pena ficar de olho na Sesame, e as outras empresas AI que se cuidem, a fasquia da interacção com modelos de voz passa agora a estar mais elevada.
Está de facto muito natural. Uau.
ResponderEliminar