O cofundador e CEO da Nvidia, Jensen Huang, revelou o Vera Rubin AI Superchip na GPU Technology Conference em Washington, marcando a mudança da empresa para hardware de IA em meio ao boom da IA, aumentando seu valor de mercado para quase US$ 5 trilhões. A plataforma Vera Rubin visa cargas de trabalho generativas de IA de alta intensidade. Ele integra uma única CPU Vera equipada com 88 núcleos ARM personalizados que suportam 176 threads. Esta CPU é emparelhada com duas GPUs Rubin para atingir até 100 petaFLOPS de desempenho de computação FP4. Como computador em escala de rack NVLink 72 de terceira geração da Nvidia, Vera Rubin sucede aos modelos GB200 e GB300. O sistema emprega refrigeração líquida e incorpora seis trilhões de transistores. Ele também inclui 2 TB de memória SOCAMM2 de baixa latência para lidar com tarefas exigentes de processamento de IA com eficiência. Em sua configuração básica, o Vera Rubin oferece aproximadamente 100 vezes o desempenho de computação bruto em comparação com o DGX-1 baseado em Volta. Essa plataforma anterior, o sistema inicial de aprendizado profundo da Nvidia, fornecia 170 teraflops de desempenho máximo do FP16. Este aumento substancial sublinha a evolução da capacidade computacional para aplicações de IA ao longo dos anos. A Nvidia planeja lançar Vera Rubin em várias configurações para atender a diversas necessidades. A configuração do NVL144 inclui duas GPUs do tamanho de um retículo, que permitem até 3,6 exaflops de inferência FP4 e 1,2 exaflops de desempenho de treinamento FP8. Para recursos aprimorados, a configuração NVL144 CPX atinge 8 exaflops, representando 7,5 vezes a potência dos sistemas GB300 NVL72 da geração atual. Para atender aos requisitos em data centers de hiperescala para processamento de cargas de trabalho maiores no contexto do modelo, a Nvidia apresenta o sistema Rubin Ultra NVL576. Esta variante usa quatro GPUs do tamanho de um retículo junto com até 365 TB de memória de alta velocidade. Ele oferece até 15 exaflops de inferência FP4 e 5 exaflops de desempenho de treinamento FP8, o que representa um aumento de 8 vezes em relação ao GB300. Cada GPU Rubin consiste em dois chips de computação e oito pilhas de memória HBM4, otimizando a transferência de dados e a computação. A placa GPU possui cinco conectores backplane NVLink. Dois conectores na parte superior conectam as GPUs ao switch NVLink para interconectividade de alta velocidade. Os três conectores inferiores gerenciam o fornecimento de energia, a interface PCIe e a conectividade CXL para oferecer suporte à integração em sistemas mais amplos. Huang antecipa que as GPUs Rubin entrarão em produção em massa durante o segundo semestre de 2026. Os sistemas NVL144 estão programados para lançamento no final de 2026 ou início de 2027. Enquanto isso, os sistemas NVL576 deverão estar disponíveis no segundo semestre de 2027, alinhando-se com o roteiro da Nvidia para o avanço da infraestrutura de IA. https://www.youtube.com/watch?v=lQHK61IDFH4





