A OpenAI lançou as tão esperadas funcionalidades de vídeo em tempo real para o ChatGPT, expandindo o Advanced Voice Mode para incluir visão.
Apesar de ter demonstrado estas capacidades há mais de meio ano, a OpenAI esperou até ao Natal - e deu oportunidade à Google para se antecipar com capacidades idênticas no Gemini - para dar a capacidade de visão ao ChatGPT. Esta nova funcionalidade permite que subscritores dos planos ChatGPT Plus, Team e Pro apontem os seus smartphones para objectos e recebam respostas quase imediatas. Também suporta partilha de ecrã, ajudando os utilizadores a navegar menus ou resolver problemas matemáticos no ecrã dos seus dispositivos.
Para utilizar a funcionalidade, basta tocar no ícone de voz na aplicação do ChatGPT e activar o modo vídeo através do botão da câmara no canto inferior esquerdo. A partilha de ecrã pode ser acedida no menu de três pontos.
Contudo, e mais uma vez, nem todos terão acesso imediato a estas funcionalidades. A OpenAI anunciou que os utilizadores dos planos Enterprise e Edu terão de esperar até Janeiro, e ainda não há previsão para os utilizadores na UE terem acesso a estas capacidades visuais do ChatGPT.
Aproveitando a época festiva, o ChatGPT também passa a disponibilizar um modo de voz "Pai Natal", que no entanto só estará disponível neste período e será retirado no final do mês (provavelmente regressando no próximo ano, e fazendo imaginar que ao longo do ano se possam ter várias vozes temporárias para eventos específicos).
Subscrever:
Enviar feedback (Atom)
ChapGPT imparável.
ResponderEliminarEuropa bem representada (até pioneira) com o Mochi em tempo real nascido pela mesma altura no laboratório aberto dedicado à IA (Kyutai).
Uma feliz iniciativa do visionário Xavier Niel (Iliad Free), Rodolphe Saadé e Eric Schmidt que tenta reter os talentos Europeus.
https://kyutai.org/2024/07/03/meet-moshi.html