Contents

Novas CPUs otimizadas para IA da Amazon-Graviton4 e Trainium2 aumentam o desempenho em 50% e a largura de banda em 75%

A Amazon não é apenas conhecida por ser a loja online mais popular do mundo, mas também se dedica a outros setores. Amazon Web Services ou AWS é a plataforma de computação em nuvem que compete com Google, Microsoft e outras grandes empresas. Agora a amazon apresentou sua nova geração de chips Graviton4 e Trainium2, onde no primeiro caso o desempenho e a eficiência são melhorados, enquanto no segundo temos uma velocidade de treinamento mais rápida para IA.

No mundo dos processadores sempre mencionamos as empresas Intel e AMD, já que nos PCs elas são as principais. No entanto, existem muitos outros que se dedicam ao desenvolvimento e fabricação de CPUs, embora sejam para outros fins que não o PC. Então, temos a Amazon que há anos cria CPUs baseadas na arquitetura Arm. Em 2021, vimos como a Amazon lançou o Graviton3 , que alcançou 300% mais desempenho consumo 60% menos do que a geração anterior do Graviton2.

Amazon apresenta sua CPU Arm Graviton4 com 30% mais desempenho e 50% mais núcleos

/images/Amazon-Graviton4.jpg

No ano seguinte, após o lançamento do Graviton3, a Amazon lançou o Graviton3E, a próxima geração de processadores baseados na arquitetura Arm. Aqui foi mostrado como ele atingiu frequência de até 3,9 GHz, utilizou RAM DDR5 e no geral, obteve 35% mais desempenho. Mais um ano se passa e voltamos ao presente, já que a Amazon apresentou dois novos chips, o Graviton4 e o Trainium2. Começando com Graviton4, este é o sucessor do Graviton3E e promete até 30% mais desempenho, 50% mais núcleos e 75% mais largura de banda.

Atualmente, a AWS tem mais de 150 tipos de instâncias do Amazon EC2 usando Graviton globalmente e afirma ter fabricado mais de 2 milhões de CPUs. Além disso, ele menciona como a Graviton tem mais de 50.000 clientes, como discovery , Formula 1 (F1), Pinterest ou Zendesk. Também temos Epic Games , o que garante que Graviton4 fornecerá desempenho excepcional para suas necessidades de carga de trabalho em Fortnite. Essas CPUs são responsáveis ​​por bancos de dados, veiculação de anúncios, análises e servidores web. Graviton4 estará disponível em instâncias Amazon EC2 R8g com até 3 vezes mais memória e vCPU em comparação com o R7g atual.

O chip Trainium2 permite treinar modelos de IA até 4 vezes mais rápido

/images/Amazon-Trainium2.jpg

Por outro lado, temos o outro chip da Amazon, chamado Trainium2 , que permitirá treinar modelos básicos ( FM ) e modelos de linguagem grande ( LLM ) **até 4 vezes mais rápido ** do que o Trainium da primeira geração. Devido ao aumento do interesse na IA generativa, esse chip permitirá que os clientes treinem seus modelos de aprendizado de máquina a um custo menor e com maior eficiência. A AWS oferece instâncias do Amazon EC2 com chips de ML que também incluem GPU NVIDIA para maior desempenho. Com o Trainium2 você pode treinar modelos FM e LLM com bilhões de parâmetros, pois além do melhor desempenho, temos 3x mais capacidade de memória e 2x mais desempenho/eficiência em watts.

As instâncias Trn2 destinam-se a escalar até 100.000 chips Trainium2 para a próxima geração de EC2 UltraClusters, sendo capazes de fornecer até 65 ExaFLOPs de desempenho. Nesse caso, a Amazon estima que o LLM possa ser treinado com 300 bilhões de parâmetros em questão de semanas, em vez de esperar meses.

*️⃣ Link da fonte:

Chips Graviton4 e Trainium2,