Contents

Liberando desempenho de IA incomparável com a GPU Colossal Blackwell da NVIDIA!

A NVIDIA anunciou durante o GTC o seu novo chip gráfico topo de gama orientado para Inteligência Artificial, falamos da Blackwell. Este não é apenas o maior chip gráfico do mundo, mas também consegue aumentar o desempenho do que até agora era a GPU mais poderosa do mundo, Hopper (NVIDIA H100).

A GPU NVIDIA Blackwell também é coberta do primeiro chip gráfico multichip (MCM) criado pela NVIDIA. E basicamente cada chip Blackwell consiste em duas GPUs Blackwell interligadas. Agora, a plataforma usada para dar vida a ele combina dois chips Blackwell completos, juntos em uma CPU Arm Grace. Vamos dar uma olhada mais de perto no que a NVIDIA oferece à Blackwell para a indústria.

NVIDIA Blackwell aumenta o desempenho do melhor chip de IA atualmente disponível em 5

/images/NVIDIA-Blackwell-chip.jpg

A GPU NVIDIA Blackwell é composta por 208.000 milhões de transistores. São 128 bilhões a mais em relação ao chip NVIDIA Hopper. Este chip também incorpora quatro vezes mais memória integrada ao próprio chip, o que se traduz em oferecer até 192 GB de memória HBM3e que, junto com uma interface de 8.192 bits, produz uma largura de banda de 8 TB/s.

Este chip é fabricado pela TSMC usando sua litografia de 4nm 4NP , enquanto cada GPU que compõe o chip Blackwell é interconectada através de uma interface com largura de banda de 10 TB/s. NVIDIA Blackwell se contenta com um total de 20.480 núcleos CUDA , usa chips de memória HBM3e de 8 camadas e é capaz de atingir um TDP de até 700W. Este TDP é o mesmo que encontramos nas GPUs NVIDIA H100 e H200.

/images/superchip-NVIDIA-Blackwell.jpg

NVIDIA Blackwell é capaz de oferecer um desempenho de 20 petaFLOPS AI , o que se traduz em ser 5 vezes mais rápido em comparação com o chip NVIDIA H100. O chip Hopper topo de linha orientado para cargas de trabalho relacionadas à IA. Então e como dissemos, dois desses chips completos são acompanhados por uma CPU Grace para criar o superchip NVIDIA HB200.

Este superchip possui uma CPU com braço de 72 núcleos Neoverse V2 junto com as duas GPUs Blackwell, acesso a 384 GB de memória HBM3e e com interconexão NVLink-C2C com largura de banda de 900 GB/s.

Desempenho do chip NVIDIA Blackwell comparado ao NVIDIAHopper:

-20 PFLOPS FP8 (2,5x mais rápido vs. Hopper) -20 PFLOPS FP6 (2,5x mais rápido vs. Hopper) -40 PFLOPS FP4 (5,0x mais rápido vs. Hopper) -Parâmetros 740B (6,0x mais rápido vs. Hopper) -Parâmetros 34T/seg (5,0x mais rápido vs. Hopper) -NVLINK de 7,2 TB/s (4,0x mais rápido vs. Hopper)

Estamos falando do chip gráfico mais poderoso do mundo

/images/Superchip-NVIDIA-Blackwell-vs-NVIDIA-Hopper-rendimiento.jpg

Graças a essas melhorias, a NVIDIA aproveita o fato de que a Blackwell é um do chip de IA mais poderoso do mundo. Esta arquitetura usa o Transformer Engine de 2ª geração. Eles têm novos microtensores com suporte de escalonamento e algoritmos avançados de gerenciamento de alcance NVIDIA Dynamics integrados às estruturas NVIDIA TensorRT™-LLM e NeMo Megatron.

Isso significa que a Blackwell admitirá o dobro de tamanhos e modelos de computação com novos recursos de inferência de IA de ponto flutuante de 4 bits. Ao lado da 5ª geração da interconexão NVIDIA NVLink, um desempenho bidirecional de 1,8 TB/s por GPU. Isso garante uma comunicação de alta velocidade sem interrupções entre até 576 GPUs para LLMs mais complexos.

As GPUs NVIDIA Blackwell apresentam manutenção preventiva por IA. Isso garante confiabilidade, disponibilidade e facilidade de manutenção. Essa IA executa diagnósticos e ajuda a antecipar problemas de confiabilidade. Isso maximiza o tempo de atividade do sistema e melhora a recuperação da capacidade para que implantações de IA em grande escala funcionem sem interrupções por semanas ou até meses. Isto se traduz na redução de custos operacionais.

O NVIDIA GB200 NVL72 representa uma abordagem inovadora para computação de alto desempenho, apresentando o uso integrado de refrigeração líquida em uma configuração em escala de rack. Este sistema utiliza um total de 36 superchips Grace Blackwell, cada um compreendendo 72 GPUs Blackwell e 36 CPUs Grace que estão conectadas por meio da tecnologia NVLink de quinta geração.

Além disso, o GB200 NVL72 inclui unidades de processamento de dados. Dados NVIDIA BlueField-3 para permitir aceleração de rede na nuvem, armazenamento combinável, segurança zero confiável e elasticidade da computação na GPU em nuvens de IA para hiperescala. O GB200 NVL72 oferece até 30 vezes mais desempenho em comparação com o mesmo número de GPUs NVIDIA H100 Tensor Core para cargas de trabalho de inferência LLM e reduz em até 25 vezes o custo e o consumo de energia.

*️⃣ Link da fonte:

NVIDIA anunciou ,