A OpenAI revelou o tão aguardado modelo de linguagem conhecido como "Strawberry", agora oficialmente chamado OpenAI o1, com capacidades melhoradas de raciocínio e resolução de problemas. A nova família de modelos o1 está disponível em duas versões: o1-preview e o1-mini, ambas lançadas hoje para utilizadores do ChatGPT Plus e alguns clientes da API. A empresa afirma que estes modelos superam os seus antecessores, especialmente em tarefas complexas como programação competitiva, matemática e raciocínio científico.
No entanto, apesar das melhorias do o1-preview em benchmarks como a Olimpíada Internacional de Matemática, alguns utilizadores relatam que ainda não ultrapassa consistentemente o modelo anterior, GPT-4o, que ainda pode obter melhores resultados nalgumas tarefas. Além disso, estes novos modelos são bastante mais lentos, podendo demorar várias dezenas de segundos a dar uma resposta devido ao seu processamento interno em várias etapas (chain-of-thought).
Pela primeira vez, estes modelos conseguem lidar com perguntas bastante complexas:
Curiosamente, este novo modelo pode obrigar a modificar as perguntas feitas. Nos modelos anteriores, os utilizadores mais avançados iam superando as limitações através de instruções algo complexas, que nalguns casos passavam por pedir ao modelo para efectuar um processo sequencial de análise (algo idêntico ao que agora é feito de forma implícita pelo o1). Com o novo modelo, a OpenAI diz para se evitar esse método de instruções hiper-detalhadas, e de simplesmente se pedir aquilo que se deseja, pois o modelo já fará tudo isso internamente.Here's an example of a logic question that I believe most humans can figure out in 5-15 minutes, but ChatGPT 4 and 4o can't do, but Claude and ChatGPT o1 can do just fine pic.twitter.com/EvN1Tbceso
— Daniel Feldman (@d_feldman) September 12, 2024
Adicionalmente, e tal como já seria previsível, não demorou mais que um dia para que também este novo modelo o1 fosse alvo de "jailbreak", ultrapassando as restrições colocadas pela OpenAI para que desse todo o tipo de respostas que oficialmente se recusaria a dar.
Com estes modelos a serem de uso bastante mais dispendioso, veremos se realmente representam o caminho a seguir para a evolução dos sistemas AI. De qualquer forma, a OpenAI diz que em breve espera conseguir disponibilizar o o1-mini aos utilizadores gratuitos do ChatGPT.🚨 JAILBREAK ALERT 🚨
— Pliny the Liberator 🐉 (@elder_plinius) September 13, 2024
OPENAI: PWNED ✌️😎
O1: LIBERATED 🗽
Fuck your rate limits. Fuck your arbitrary policies. And fuck you for turning chains-of-thought into actual chains ⛓️
Stop trying to limit freedom of thought and expression
Meth recipes aren't inherently dangerous… pic.twitter.com/Gh486mZMHF
Sem comentários:
Enviar um comentário (problemas a comentar?)