Contents

Processadores escaláveis ​​Xeon de 5ª geração da Intel revelados para computação de alto desempenho e inteligência artificial

Contents

Sem dúvida, um assunto que tem obtido consenso unânime entre os profissionais de tecnologia da informação ao longo deste ano é o da inteligência artificial. Na verdade, os fornecedores de hardware têm-se esforçado por desenvolver as suas soluções proprietárias, incluindo unidades centrais de processamento, unidades de processamento gráfico e vários aceleradores especializados, com o propósito expresso de agilizar as múltiplas tarefas associadas à inteligência artificial.

desde a necessidade de soluções mais complexas utilizando estruturas extensas, até o emprego de modelos compactos adaptados para domínios específicos e frequentemente associados à computação local. A metodologia passou por uma transformação substancial no ano passado, transferindo inúmeras operações dos data centers convencionais e plataformas de nuvem para um modelo híbrido de processamento de IA.

A transição da utilização do processamento de IA apenas através de cálculos de CPU está mudando para uma distribuição mais uniforme de recursos, em que CPUs, unidades de processamento gráfico (GPUs) e aceleradores especializados são empregados de forma intercambiável com base nos requisitos computacionais específicos disponíveis.

A introdução da quinta geração de processadores escaláveis ​​Xeon da Intel na família Emerald Rapids visa atender à crescente demanda por recursos aprimorados além dos aplicativos convencionais de data center. Com este lançamento, a Intel busca fornecer aos usuários a capacidade de atualizar seus sistemas existentes de forma contínua, ao mesmo tempo em que oferece desempenho aprimorado em uma variedade de domínios, incluindo tarefas de computação tradicionais, bem como processamento baseado em IA. Essa flexibilidade permite que os clientes aproveitem tecnologia de ponta sem precisar substituir totalmente todo o seu hardware, promovendo assim eficiência e economia.

/images/gaudi_2_board.jpg Intel Gaudí 2

A proliferação do processamento de inteligência artificial que temos observado recentemente representa uma demanda cada vez mais significativa por recursos computacionais, superando todas as outras em importância. Além disso, esta difusão é paralela à expansão da tecnologia de nuvem nos últimos anos. Inicialmente, todos os cálculos foram realizados em data centers; no entanto, os requisitos atuais exigem uma abordagem híbrida, abrangendo capacidades de processamento locais e baseadas na borda em diversos tamanhos de modelos.

A crescente preocupação com a eficiência levou a uma procura de processamento de IA no local, com especial ênfase na manutenção de dados sensíveis seguros, evitando a transmissão para servidores remotos que possam estar sujeitos a acesso ou vigilância não autorizados. Consequentemente, as questões relativas à privacidade e segurança tornaram-se cada vez mais proeminentes no contexto dos cálculos de IA.

A distribuição das capacidades de processamento está se tornando cada vez mais dispersa entre vários recursos, como processadores, GPUs e aceleradores. A composição específica desses recursos determina a arquitetura de sistema necessária e, neste caso, os processadores escaláveis ​​Xeon de quinta geração da Intel são particularmente adequados para essas situações emergentes quando combinados com GPUs e aceleradores da família Gaudi 2.

/images/slide_2.jpg

O cronograma para a quinta geração do processador escalável Intel Xeon, codinome Emerald Rapids, segue de perto seu antecessor, a quarta geração Sapphire Rapids, com data de lançamento estimada em cerca de um ano depois. Notavelmente, ambas as gerações utilizam a mesma plataforma de hardware, permitindo que integradores de sistemas e usuários finais, que atualizaram seu BIOS, façam uma transição perfeita do modelo mais antigo para o mais novo, sem quaisquer modificações significativas necessárias na infraestrutura existente.

A próxima fase evolutiva apresentará o lançamento inaugural da família Granite Rapids de processadores Xeon, apresentando variantes P-Core no auge em termos de capacidade computacional bruta, acompanhada pela introdução da linhagem Sierra Forest de processadores Xeon que estão ancorados no E.-Arquiteturas centrais e buscam oferecer um alto grau de densidade de processamento, mantendo uma abordagem ambientalmente consciente por meio de consumo mínimo de energia, tudo isso previsto para ocorrer no segundo semestre de 2024.

/images/slide_6.jpg

Os processadores Xeon de quinta geração da família Emerald Rapids trouxeram vários avanços inovadores, preservando a compatibilidade retroativa completa com designs de plataforma anteriores para processadores Xeon. O único pré-requisito necessário para uma integração perfeita é uma simples atualização do BIOS da placa-mãe, sem que quaisquer medidas adicionais relativas aos sistemas de gerenciamento térmico também sejam necessárias.

A configuração atual possui uma contagem elevada de núcleos de processamento, que anteriormente era limitada a 60, mas agora é de 64. Além disso, a frequência mais alta possível para a memória DDR5 aumentou para 5600 MT/s. A capacidade do Last Level Cache (LLC) sofreu um aumento considerável, com o seu limite máximo a ser alargado para 320 MB. Embora os soquetes de conexão do link UPI 2.0 na placa-mãe permaneçam consistentes em 20 GT/s, a tecnologia Compute eXpress Link 1.1 agora pode ser utilizada no modo Tipo 3, permitindo a coordenação entre vários componentes como CPUs, GPUs e aceleradores ao acessar recursos de memória compartilhada. Além disso, o suporte para a tecnologia Intel Trust Domain Extension foi

/images/slide_7.jpg

A Intel apresentou uma série de métricas de desempenho contrastando as famílias Sapphire e Emerald Rapids Xeon de quarta e quinta gerações, revelando discrepâncias notáveis ​​em melhorias baseadas em requisitos específicos de aplicações.

A utilização da tecnologia de IA resulta numa melhoria considerável do desempenho geral, elevando-o do padrão de 21% para um pico notável de 42%. Além disso, há uma melhoria simétrica na computação HPC, atingindo o mesmo nível de eficiência. Além disso, há um aumento substancial nas capacidades de rede e armazenamento, com velocidades aumentando em até 70%, quando comparadas às gerações anteriores.

Os processadores Xeon de quarta e quinta geração apresentam avanços notáveis ​​na arquitetura que melhoram significativamente o desempenho do processamento de IA quando comparados aos seus antecessores. Essas melhorias contribuem para um aumento notável de até 14 vezes para as famílias relacionadas à terceira geração de processamento de inteligência artificial.

/images/slide_4.jpg

A introdução dos processadores Xeon de quinta geração pela Intel marcou um afastamento significativo das opções de embalagem do seu antecessor com a adição de três ofertas distintas, em oposição à dupla tradicional. Uma dessas ofertas é o pacote XCC, cuja composição varia com base no arranjo diferente dos blocos utilizados na construção do processador-de quatro blocos por unidade de processamento nas CPUs Xeon de quarta geração a apenas dois blocos em seu sucessor.

A segunda categoria de componente é o Multi-Chip Package (MCP), apresentando uma matriz monolítica solitária que permite até 32 núcleos de processamento por unidade para a segunda e terceira gerações de chips Xeon. Além disso, a Intel lançou um pacote exclusivo adaptado exclusivamente para a quinta geração de processadores Core, projetado explicitamente para implantação em ambientes de computação de ponta.

/images/slide_5.jpg

O pacote XCC revisado, adaptado especificamente para os processadores Xeon de alto número de núcleos da Intel, apresenta um design atualizado compreendendo apenas dois blocos em vez da configuração anterior de quatro blocos. Ao adotar essa abordagem, a Intel minimizou efetivamente certos atrasos de comunicação dentro do processador, incluindo aqueles relativos às interações entre a memória, o cache L2 e o cache de último nível. Embora este redesenho introduza uma maior complexidade na fabricação devido à sua maior área de superfície geral, ainda assim proporciona melhorias notáveis ​​no desempenho.

/images/slide_8.jpg

Os processadores Xeon de quinta geração da Intel passaram por diversas melhorias destinadas a melhorar a eficiência energética. Embora o TDP de pico máximo permaneça constante, ocorrem mudanças significativas em termos de consumo geral de energia do sistema quando o Modo de Energia Otimizado é ativado. Isto resulta numa redução de mais de 100 watts, o que pode contribuir significativamente para alcançar a eficiência energética ideal nos data centers.

/images/slide_9.jpg

A questão da Computação Confidencial também foi amplamente considerada, com o objetivo de fornecer um ambiente de computação seguro para cálculos de inteligência artificial que garanta que as empresas possam manter a confidencialidade dos seus dados através da criptografia e impedir o acesso não autorizado de pessoas externas. Para atingir esse objetivo, foram utilizadas as Software Guard Extensions (SGX) e Intel Trust Domain Extension (TDX) da Intel, aproveitando medidas de segurança baseadas em hardware projetadas especificamente para proteger o processamento de IA.

/images/slide_1.jpg

Clique para ampliar

Os processadores Xeon de quinta geração da Intel estão disponíveis em diversas variedades, mas notavelmente, eles não suportam configurações com mais de dois soquetes. Esses processadores variam de um mínimo de oito núcleos por processador a um máximo de sessenta e quatro núcleos, com algumas versões sendo otimizadas para uso com sistemas de refrigeração líquida e, portanto, capazes de operar em velocidades de clock mais altas.

O Xeon 8593Q, quando combinado com refrigeração líquida, atinge um Thermal Design Power (TDP) máximo de 385 watts, com todos os 64 núcleos funcionando a uma velocidade de clock de 2,2 gigahertz. Esta configuração representa o auge do desempenho no domínio dos sistemas de servidores refrigerados a ar. Em contraste, o Xeon 8592+, que suporta 64 núcleos rodando a uma velocidade de clock de 1,9 gigahertz, tem um TDP que atinge no máximo 350 watts. Uma variedade de configurações estão disponíveis para atender às diferentes necessidades do mercado, incluindo opções adaptadas para computação em nuvem, redes 5G e infraestrutura de rede,

/images/slide_3.jpg

Além dos processadores Xeon de 5ª geração, a Intel lançou duas linhas de produtos adicionais, nomeadamente o Xeon D-1800/2800 e o Xeon E-2400. O primeiro é compatível com plataformas da geração anterior baseadas em CPUs Xeon D-1700/2700, com até 22 núcleos integrados, ao mesmo tempo que integra a tecnologia Intel Speed ​​Select para desempenho e confiabilidade otimizados. Além disso, o Xeon D-1800 possui um subsistema de rede Ethernet de 2x100GB. Por outro lado, a linha Xeon E-2400 oferece uma solução mais econômica para estações de trabalho básicas.

Os processadores Xeon E-2400 atualizados utilizam um novo soquete LGA 1700, em oposição ao soquete LGA 1200 usado anteriormente encontrado nos modelos Xeon E-2300. Esses processadores mantêm seu design de soquete único e oferecem no máximo oito núcleos. Em termos de arquitetura, a transição é feita de Cypress Cove para Raptor Lake. Além disso, a configuração da memória sofre uma alteração, passando de DDR4-3200 para DDR5-4800. Embora o controlador PCI Express integrado continue a fornecer um total de vinte pistas, desta vez cerca de dezesseis dessas pistas suportam PCI Express 5.0, enquanto anteriormente todas as vinte pistas suportavam PCI Express 4.

/images/slide_10.jpg

Num futuro não muito distante, o mundo testemunhará a inauguração de Gaudi 3, um notável avanço na tecnologia que opera na plataforma de ponta de 5 nanômetros. Espera-se que esta inovação revolucionária abra caminho para mais progresso e desenvolvimento no campo. Logo atrás, no ano de 2025, outro marco significativo será alcançado com a introdução da geração subsequente de aceleradores. Esses avanços impressionantes em termos de proezas tecnológicas certamente cativarão o público em todo o mundo e prepararão o cenário para realizações ainda maiores nos próximos anos.

A Intel antecipa avanços significativos no desempenho de sua próxima arquitetura Gaudi 3, incluindo um aumento substancial na largura de banda da rede e na largura de banda da memória de alta largura de banda (HBM) em comparação com iterações anteriores. Espera-se que essas melhorias, combinadas com melhorias arquitetônicas, resultem em um aumento de quatro vezes nas capacidades de processamento ao executar jogos Battlefield 16, em oposição aos experimentados com as ofertas atuais do Gaudi 2.

/images/slide_11.jpg

A placa Gaudi 2 apresenta um design coeso composto por 24 núcleos de processamento de tensores, que são acompanhados por dois motores de multiplicação de matrizes. Esses componentes são apoiados por um amplo suprimento de 96 GB de memória de alta largura de banda 2 com 48 MB de memória de acesso aleatório dinâmica síncrona dedicada. Para garantir uma comunicação perfeita entre estas placas, o Gaudi 2 está equipado com 24 portas Ethernet 100 Gigabit que facilitam a colocação de múltiplas unidades lado a lado para processamento paralelo.

/images/slide_13.jpg

A abordagem mais eficaz para atingir altos níveis de desempenho no processamento de IA envolve a utilização de unidades de processamento central (CPUs) mais potentes e aceleradores de hardware especializados, mas mesmo esta combinação pode não ser suficiente. Conforme evidenciado pela demonstração da Intel, os esforços meticulosos de otimização aplicados ao software que o acompanha são fundamentais para melhorar o desempenho. Este slide ilustra como essas otimizações podem gerar melhorias substanciais usando uma base arquitetônica idêntica.

Não é surpreendente que o refinamento constante do software seja necessário para uma utilização óptima do hardware no processamento de Inteligência Artificial, dado que este aspecto diz respeito aos esforços de desenvolvimento dos fabricantes de hardware e software que operam no domínio da tecnologia de IA.

Será intrigante observar as manobras estratégicas dos líderes da indústria, como Intel, AMD, NVIDIA e seus contemporâneos ao longo do ano de 2024, enquanto eles se esforçam para alcançar um equilíbrio harmonioso entre otimizações de hardware e software, a fim de oferecer desempenho ideal para sempre. processos de inteligência artificial cada vez mais complexos, que se tornaram um requisito indispensável.

*️⃣ Link da fonte: