A Nvidia continua a reforçar o seu domínio na AI revelando os novos Blackwell Ultra GB300 e Vera Rubin, os seus mais recentes chips AI; e também a aposta nos robots.
O Blackwell Ultra, que chega na segunda metade de 2025, é uma versão melhorada do Blackwell, mas mantém a mesma arquitectura. Por outro lado, a nova arquitectura Vera Rubin, prevista para 2026, deverá oferecer 3.3x mais desempenho, com um ainda mais potente Rubin Ultra prometido para 2027.
O Blackwell Ultra GB300 mantém os 20 petaflops de desempenho em IA, mas agora inclui 288 GB de memória HBM3e, face aos 192 GB do modelo Blackwell original. A Nvidia afirma que o cluster NVL72 conseguirá processar 1.000 tokens por segundo, superando o chip H100 de 2022. Além disso, a empresa revelou uma versão desktop, a DGX Station, que traz um único GB300 Blackwell Ultra, 784GB de memória unificada e 800 Gbps de conectividade, que visa tornar mais acessível o poder da AI de alto desempenho para developers e, presumivelmente, consumidores endinheirados.
Para o futuro, o chip Vera Rubin deverá mais do que duplicar o desempenho do Blackwell Ultra, atingindo 50 petaflops de FP4, enquanto o Rubin Ultra combinará dois GPUs num só para alcançar 100 petaflops com até 1 TB de memória. Segundo a Nvidia, um rack NVL576 Rubin Ultra terá 15 exaflops de inferência FP4, tornando-o 14 vezes mais poderoso que o Blackwell Ultra deste ano. Jensen Huang referiu a crescente necessidade de computação AI, dizendo que o sector precisa de "100 vezes mais do que pensávamos no ano passado" - sendo provável que venha a repetir esta mesma coisa no próximo ano, e anos seguintes, como convém a uma empresa que vende hardware para tal.
A Nvidia também revelou os DGX Spark e DGX Station, dois supercomputadores pessoais AI baseados na plataforma Grace Blackwell. O DGX Spark, anteriormente conhecido como "Digits", é um dispositivo compacto do tamanho de um Mac Mini, equipado com o GB10 Blackwell Superchip, capaz de processar 1.000 TOPS de computação AI. Já o DGX Station usa o mais potente GB300 Blackwell Ultra, oferecendo 20 petaflops de desempenho em AI. A Asus, Dell, HP e outros fabricantes irão lançar versões dos sistemas DGX ainda este ano, enquanto o DGX Spark já pode ser reservado, com entregas previstas para este verão.
No entanto, um dos pontos altos da sessão, foi a parte em que surgiu um pequeno e simpático robot da Disney, que demonstra a aplicação prática de todos estes números num produto real, possibilitando movimentos e interacções como as que vemos nos filmes - mas desta vez acontecendo no mundo real. Ainda deverá demorar alguns anos até que este tipo de robots se torne minimamente acessível para o público, mas, está visto que tal irá acontecer mais cedo ou mais tarde.
Subscrever:
Enviar feedback (Atom)
Sem comentários:
Enviar um comentário (problemas a comentar?)