O Advanced Voice Mode está a chegar aos subscritores do ChatGPT Plus e comprova que as demonstrações que a OpenAI tinha feito em Maio eram mesmo reais.
Este modo de interacção por voz concretiza aquilo que a maioria das pessoas imagina quando pensa num assistente AI, tal como nos filmes de ficção científica, em que não temos que aguardar pelas respostas, e com uma forma de falar surpreendentemente humana. Temos detalhes fantásticos, como a necessidade do assistente "parar para respirar", ou de replicar diferentes emoções na forma de falar, ou até de imitar sons, efeitos, ou sotaques, usando a sua voz digital.
ChatGPT Advanced Voice Mode counting as fast as it can to 10, then to 50 (this blew my mind - it stopped to catch its breath like a human would) pic.twitter.com/oZMCPO5RPh
— Cristiano Giardina (@CrisGiardina) July 31, 2024
Some early impressions of the ChatGPT Advanced Voice Mode:
— Cristiano Giardina (@CrisGiardina) July 31, 2024
It’s very fast, there’s virtually no latency from when you stop speaking to when it responds.
When you ask it to make noises it always has the voice “perform” the noises (with funny results).
It can do accents, but when… pic.twitter.com/vOA8qmqX06
“Stress testing” ChatGPT Advanced Voice Mode. Here you can see how it handles interruptions, different versions of languages and even languages with foreign accents.
— Cristiano Giardina (@CrisGiardina) July 31, 2024
Tells a story in Spanish → Mexican Spanish → Portuguese→ Brazilian Portuguese → Korean w/ an Italian accent 😉 pic.twitter.com/4vC3AQZeDn
ChatGPT Advanced Voice Mode doing a few impressions:
— Cristiano Giardina (@CrisGiardina) July 31, 2024
- Bugs Bunny
- Yoda
- Homer Simpson
- Yoda + Homer 😂 pic.twitter.com/zmSH8Rl8SN
Curiosamente, mas sem grandes surpresas, pedir para falar em português de Portugal resulta num portunhol com forte sotaque norte-americano, o que acaba por ser bastante realista comparado ao resultado que se teria de pedir a um norte-americano para o fazer. O pedido para falar em português do Brasil é ligeiramente melhor, mas não muito. Mas isto serão coisas que irão sendo melhoradas nas futuras gerações dos modelos.
Por agora, já teremos muito que nos entreter, e podemos dar por cumprida a entrada na era do "Her", e só demorou 11 anos para que a ficção se tornasse realidade - e só é pena que a voz "Sky" tenha gerado polémica por ser considerada uma cópia da Scarlett Johansson.
Muito semelhante às novidades anteriormente apresentadas pela Kyutai, o sistema de IA mais avançado Europeu.
ResponderEliminarImpressionante
ResponderEliminarEste tbm é interessante:
ResponderEliminarTrying to Convince ChatGPT It's Conscious https://www.youtube.com/watch?v=ithXe2krO9A