Numa altura em que os modelos AI têm dominado as notícias, a Apple surpreende com o lançamento do SHARP em open-source (e já disponível no HuggingFace). Trata-se de um processo melhorado de conversão de uma única foto 2D para 3D (Gaussian Splats), com qualidade muito superior aos métodos existentes.
Aqui não estamos a falar das conversões totalmente 3D "imaginadas" por modelos AI (que nos deixam passear pela cena como se fosse um mundo virtual), mas algo que pode ser comparado a uma evolução das "fotos espaciais" com efeito ligeiramente 3D. Aqui esse efeito pode ser ainda mais pronunciado, sendo certamente melhor aproveitado em dispositivos VR como os óculos Vision Pro.
New paper from Apple - Sharp Monocular View Synthesis in Less than a Second
— Tim Davison ᯅ (@timd_ca) December 16, 2025
Mescheder et al. @ Apple just released a very impressive paper (congrats! 🎉🥳). You give it an image and it generates a really great looking 3d Gaussian representation. Uses depth pro. It's really good.… pic.twitter.com/XSZCZA8iio
It's fun pic.twitter.com/gJHrxsLMyY
— softyoda (@softyoda) December 16, 2025
Uma das suas grandes vantagens é que, apesar de ter a melhor qualidade dos sistemas até à data, é também extremamente rápido, com o processo de conversão a demorar menos de um segundo.Single image to Splat in just 2 seconds.
— Arun Kurian (@AKurian001) December 16, 2025
Testing out in AirVis app. Apple ML team did an amazing job. pic.twitter.com/3ATNDLA4En
Isto faz com que o sistema seja de uso prático imediato para todas as aplicações em que se queira tirar partido da conversão 2D para 3D. Aliás, não me surpreenderia se se visse isto a ser aplicado em breve a diversos serviços da Apple, como uma melhoria das Spatial Photos, ou até em coisas como o "Streetview" do Apple Maps.


















Sem comentários:
Enviar um comentário (problemas a comentar?)