O GPT-4o foi lançado há poucos dias e está disponível gratuitamente para todos os utilizadores através do ChatGPT, e é um modelo AI multimodal que pode lidar com texto, imagens e som. Um dos nossos leitores de longa data deparou-se com a ingrata situação de ver o seu caixote de lixo desaparecer, e decidiu pôr à prova este novo modelo, pedindo-lhe para analisar o vídeo da sua câmara de segurança.
O resultado do ChatGPT-4o foi o seguinte:
Claro! Aqui está a descrição em português (PT-PT):
1. **Primeira Frame**: A cena parece ser no exterior, possivelmente perto de uma área residencial. Há um caixote do lixo visível.
2. **Segunda Frame**: O caixote ainda está à vista, e há um camião do lixo nas proximidades, sugerindo que é hora da recolha do lixo.
3. **Terceira Frame**: O braço mecânico ou elevador do camião do lixo está a interagir com o caixote, possivelmente a levantá-lo para esvaziar o conteúdo no camião.
4. **Quarta Frame**: O caixote está a ser levantado ou inclinado pelo mecanismo do camião.
5. **Quinta Frame**: O caixote do lixo já não é visível, implicando que pode ter sido acidentalmente levado para dentro do camião junto com o lixo.
Com base nesta sequência, parece que o processo de recolha de lixo correu mal, resultando no caixote do lixo inteiro sendo levado pelo camião, em vez de apenas o lixo. Isto provavelmente está alinhado com a sua observação sobre o caixote do lixo ter sido acidentalmente despejado.
Se precisar de uma análise mais detalhada ou de destacar frames específicos, por favor, avise!
A análise, por si só, já é suficientemente impressionante. Mas o que a torna ainda mais impressionante é ver o vídeo a partir do qual foi conseguida esta conclusão:
Trata-se de um vídeo que se foca principalmente na entrada da casa (como será conveniente), e onde o "acontecimento" decorre numa secção extremamente reduzida da imagem!
É incrível ver que este tipo de coisa é possível, hoje mesmo, com tecnologia acessível gratuitamente! Quem arrisca imaginar o que mais será possível fazer-se com AI daqui por uma década?
Agradecimento ao Diogo por ter autorizado a partilha desta experiência com o ChatGPT-4o. :)
Será assim tão incrível? O pedido feito ao chatgpt já incluía o início e o fim da acção, e a IA pode ter simplesmente relatado um possível cenário sem de facto conseguir detectar fosse o que fosse. Não havendo prova da real detecção de um caixote do lixo a aparecer e não voltar ao local original, parece-me descabido o entusiasmo.
ResponderEliminarA explicação mais provável, até porque pelo gif dá para ver que não existe braço mecânico mas antes trabalhadores humanos a atirar lixo (se é o caixote já não consigo distinguir) para dentro do camião. É assustador a confiança que se deposita nestes modelos e que se fale até na possibilidade de virem a substituir profissionais de saúde. Servem para trabalhos criativos e não para tarefas rigorosas e factuais. Peço para resumir uma notícia e o chat alucina factos e pessoas do nada. No outro dia pedi para fazer uma lista de 10 filmes de um ator e deu como resultado filmes onde o ator nunca entrou e filmes que nem sequer existem...
EliminarIncrível
ResponderEliminar