Contents

A arma secreta por trás da Radeon RX 7600 XT

Esta geração de GPUs, tanto da NVIDIA quanto da AMD, atraiu muitas críticas de que os barramentos eram pequenos demais para o que o usuário esperava. Como sempre defendemos, as arquitecturas estão bem equilibradas para o alvo que procuram em termos de resolução e filtros, algo que representa uma mudança de paradigma no sector do hardware gaming e classifica as opções do utilizador. A AMD, na CES 2024, referiu-se a esse respeito com seu RX 7600 XT 16 GB, Infinity Cache e seus 128 bits, muito criticada, entre outras coisas, pelo que foi dito e pelo aumento de preço. O que exatamente a AMD disse sobre isso?

Durante entrevista realizada por Keith para o canal PCWorld, Aaron Steinman, que já havia concedido entrevistas abertas a quem as solicitou, compartilhou seus insights sobre a decisão de incluir uma placa gráfica com 16 GB de VRAM e mantendo um barramento de 128 bits.

AMD RX 7600 XT 16 GB, 128 bits são suficientes?

A mais recente unidade de processamento gráfico (GPU) lançada no mercado possui uma versão atualizada de si mesma, que foi discutida anteriormente em nossa plataforma. Esta GPU aprimorada apresenta uma quantidade aumentada de memória de acesso aleatório de vídeo (VRAM), enquanto mantém a integridade de seu sistema de transferência de dados ou “barramento”. Consequentemente, apesar do aumento da capacidade VRAM, a largura de banda geral permanece inalterada devido à falta de aceleração nas velocidades da memória.

Em essência, a Radeon RX 7600 apresenta um design idêntico ao seu antecessor, ao mesmo tempo que duplica a sua capacidade de memória. Após a revelação deste modelo por Steinman, ele articulou sua perspectiva sobre a placa gráfica atualizada.

Embora tenha havido alguma discussão sobre o impacto potencial das limitações de largura de banda de memória, conforme determinado pela largura do barramento, estou confiante em nossa capacidade de resolver esse problema através da utilização de nossa tecnologia proprietária Infinity Cache. Esta solução inovadora alivia eficazmente quaisquer preocupações relacionadas com restrições de largura de banda e serve como um componente chave para garantir um desempenho ideal apesar de tais limitações.

Na verdade, é frequentemente observado que o buffer de quadros impõe maiores restrições ao desempenho em comparação com a largura de banda da memória. No entanto, o Infinity Cache melhora efetivamente a largura de banda percebida do barramento de memória, mitigando assim suas possíveis limitações em muitos cenários de jogos.

O Infinity Cache é realmente a solução para o RX 7600 XT?

/images/AMD-Infinity-Cache.jpg

A utilização de um buffer de quadros limitado por meio de uma unidade de processamento gráfico de tamanho substancial, como a Radeon RX 7600 XT, foi abordada anteriormente pela arquitetura RDNA 3 da AMD na forma do exemplar RX 7900 XTX. Agora, com o RX 7600 XT sendo oferecido em duas iterações separadas como um chip único e unificado em vez de um Módulo Multi Chip (MCM), a eficácia da solução anterior é amplificada.

Os princípios subjacentes permanecem consistentes e, como tal, a arquitetura Infinity Cache (IC) rege o design da Radeon RX 7600 XT, apesar de ser uma variante do RDNA 3 Lite devido ao seu número reduzido de registros. Notavelmente, esta GPU emprega a segunda geração de IC, o que a distingue de suas contrapartes mais avançadas com arquitetura MCM, todas com maior latência.

/images/AMD-RDNA-3-Memory-Cache-Die.jpg

Isso, junto com os 5,3 TB/s que o IC pode alcançar usando seus controladores de memória de 64 bits, reduz a largura de banda, que é resultado do barramento de 128 bits, é aliviado. E é, porque reduz o barramento em 33% em relação ao RDNA 2, sim, é verdade, mas o desempenho do IC é multiplicado por 2,7 ao passar de 1,9 TB/s (máximo teórico na 1ª Geração, o real é 1,6 TB/s ) nesses 5,3 TB/s.

Em essência, sua preferência é otimizar as operações internas do chip em vez de focar no desempenho externo do barramento de memória em relação ao buffer de quadros utilizando a tecnologia GDDR6.

Por que usar 16 GB em um modelo e não 8 GB?

/images/AMD-RX-7600-XT-16-GB-2024.jpg

Existem duas razões. O mais óbvio é não perder posição com a NVIDIA e a sua RTX 4060 Ti 16 GB, não tendo nada com que responder e com um preço inferior. A segunda, como aponta Steinman, é a necessidade de alguns jogadores e jogos VRAM mais altos, o que ele demonstrou ao jogar The Last of Us ao vivo:

“O importante sobre este título é que ele é um dos jogos mais novos e modernos que realmente enfatiza a demanda por frame buffer. Bem. E assim, com The Last of Us, se olharmos bem para as opções gráficas, isso nos mostra o uso de VRAM da cena atual. E você pode ver que estamos usando 9,4 GB de VRAM.

Com a configuração atual, não é possível utilizar adequadamente uma GPU de oito gigabytes para renderizar o conteúdo desejado. Embora o hardware possua capacidades de processamento suficientes em termos de unidades de sombreamento e outros componentes, como ROPs e TMUs, a memória de vídeo insuficiente limita o seu potencial de desempenho. Consequentemente, quando a capacidade VRAM é excedida, a qualidade gráfica do jogo sofre significativamente.

E é aí que você realmente terá que voltar pelo barramento PCI para a memória do sistema e pegar emprestado memória da memória do sistema (RAM). Você não quer fazer isso. Aumenta a latência e reduz frames por segundo e isso não é bom.

Em vez disso, é bom vê-lo em ação e, de certa forma, faz você querer aquele buffer de quadros extra, mesmo que alguém não esteja preocupado com aquela classe específica de placa. Quero dizer, você quer mais buffer de quadros, certo? Dura mais no futuro, como você disse, “dá mais longevidade à placa gráfica.”

São necessários 16 GB em uma placa de 128 bits?

/images/Infinity-Cache-mejora-ancho-de-banda-a-misma-cantidad-de-RAM-y-con-menor-bus-de-datos.jpg

Goste ou não, isso não é estritamente necessário e vamos sintetizar a resposta com parte do argumento de Steinman, pois um servidor discorda em um ponto específico. Quando Steinman fala sobre Frame Buffer ele o faz do ponto de vista dos engenheiros, já que para eles é o próprio VRAM, o próprio GDDR6.

A AMD internamente não distingue entre o frame buffer como framestore (anterior, de anos atrás) da própria memória. Principalmente porque do ponto de vista da arquitetura IC faz esse trabalho em grande parte. Ou seja, o IC atua como um buffer de memória, portanto O buffer de quadros para AMD recai sobre o próprio aspecto VRAM, e é importante entender isso.

Porque? Porque, como está acontecendo com a Intel e seu Arc atualmente, a AMD por meio de Smart Access Memory (SAM de agora em diante) lida de forma inteligente com o que os desenvolvedores de jogos chamam de RAMCache junto com a CPU.

Embora seja correto afirmar que o SAM visa aumentar a eficiência das operações da GPU através do uso da CPU, a consequente diminuição da latência e o aumento da taxa de transferência de dados resultantes de tamanhos de pacotes irrestritos devem ser levados em consideração. Em última análise, esse desenvolvimento leva a uma carga maior na CPU, pois ela se esforça para gerenciar os recursos de memória enquanto dedica capacidade de armazenamento adicional à VRAM.

O teste mais simples para verificar isso é medir a capacidade VRAM usada com SAM Off vs ON e ver se, de fato, esse é o caso por causa do que foi mencionado.

/images/AMD-SAM-Smart-Access-Memory-rendimiento.jpg

Isso é algo que os fabricantes de placas também utilizam, e em muitos casos possuem até software de gerenciamento próprio, inclusive para SSDs ( ASUS RAMCACHE e Samsung Rapid Mode ).

Em essência, independentemente do seu tipo, como DDR4 ou DDR5 e da idade do sistema, a RAM serve como repositório para armazenamento temporário de dados. Permite a atribuição de espaço de armazenamento virtual dentro dos seus limites, desde que exista capacidade disponível suficiente, com capacidade de transferência de informação entre vários componentes.

Por isso, Steinman diz que não quer ir à RAM para coletar informações diretas em tempo real, pois Isso tem um custo de energia e, acima de tudo, de desempenho e latência. , o que ou é feito extremamente bem , ou a famosa gagueira. Até agora, tudo bem, você realmente concorda, mas…

Shaders vs VRAM, o que é mais importante? Como isso influencia o RX 7600 XT e seu Infinity Cache?

/images/AMD-VRAM-usada-en-juegos-por-anos.jpg

Eu sempre defendo, e vocês já me leram muitas vezes, que O equilíbrio de uma placa é o que realmente importa do ponto de vista de arquitetura e desempenho (o preço é outra questão, importante sim, mas estamos nisso não, tem que saber separar, serão feitas proporções com isso quando necessário). Hoje, com os barramentos internos disponíveis e a velocidade da memória que existe no mercado, bem como a sua latência, sem esquecer o L2, o barramento de dados não é tão relevante.

Mas, ao mesmo tempo, força o equilíbrio desenhado pelo criador da GPU, seja AMD, NVIDIA ou Intel, foco em uma resolução específica. Ou seja, as GPUs focam em 1080p, 2K ou 4K, com mais ou menos filtros, ou seja, GPUs não são mais tão “todo-o-terreno”.

Mas, embora isso seja mais evidente agora do que há duas gerações, o que é realmente importante e continuará assim por muitos anos até que a renderização seja substituída por cálculos usando Tensores com IA, total ou parcialmente, é que quanto maior for o número de Shaders , o ROP e o TMU, maior será o desempenho e mais importante se torna o enfrentamento do barramento.

Assim, o IC assume mais relevância do que o barramento de dados, pois sem ele a AMD seria forçada (lá) a usar barramentos maiores, consumindo mais silício no processo Não vamos esquecer disso. Silício que, por outro lado, deve ser alocado em grande parte ao L2, também mais caro, mas que oferece mais desempenho.

/images/AMD-Infinity-Cache-RDNA-2-solucion-al-ancho-de-banda.jpg

A escalabilidade depende disso, e não tanto de ter 128 bits ou 192 ou 256. Isso equivale a outra seção que a placa possui, e onde quase não há críticas: PCIe 4.0 x8 , e não x16 como o resto de suas irmãs.

E não é que haja um problema, porque não há, já que a GPU não é capaz de colapsar a interface e sua largura de banda e, em vez disso, permite que a AMD ofereça este modelo alguns dólares mais barato, dispensando metade do custo. contatos no PCB e seu slot. Existe alguma crítica sobre isso que seja numerosa? Não, só algo específico na hora da saída e não se ouviu mais nada, não havia motivo, nem deveria haver com o ônibus, mas…

Equilíbrio é a coisa mais importante em uma GPU

Na verdade, embora VRAM insuficiente possa afetar o desempenho de um jogo, o principal fator que afeta a qualidade da renderização é normalmente o número de Stream Multiprocessors (SM) ou Compute Units (CU) disponíveis na unidade de processamento gráfico (GPU). Quando um jogo requer mais SM/CUs do que a GPU possui, podem ocorrer artefatos visuais, como resolução reduzida ou quedas na taxa de quadros. Conseqüentemente, otimizar uma configuração de jogo geralmente envolve priorizar a capacidade de memória da GPU em vez de seu poder computacional bruto para garantir que recursos adequados estejam disponíveis para renderizar cenas complexas.

Ou o que dá no mesmo, sem músculos de pouco adianta pesar menos em uma corrida de atletismo de 100 metros. Seguindo esse símile, é preciso mais músculo do que peso para acelerar e atingir a velocidade máxima de um atleta, alcançando também mais km/h ao mesmo tempo. Mas tudo tem um limite e daí o equilíbrio de que falávamos, porque não veremos um corredor de 120 kg de puro músculo e com quase nenhuma flexibilidade chegar em primeiro à linha de chegada nos 100 metros, assim como veremos Não vejo um corredor pesando 50 kg e muito flexível vencer esse tipo de corrida. carreira.

Mas o músculo tem precedência sobre o peso, e obviamente eles estão relacionados, mas O equilíbrio da massa muscular com elasticidade, altura, passada e técnica é o que definirá o velocista., assim como IC com 128 bits e 16 GB do modelo original versus suas UCs.

8 GB versus 16 GB? Onde está o problema?

/images/AMD-Radeon-RX-7600-XT-16-GB.jpg

Realmente em lugar nenhum, exceto porque Steinman ignora algo que todos sabemos: as configurações gráficas podem ser baixadas. Como primeiro você precisa de um bom equilíbrio de Shaders (CU em geral) antes de um barramento maior, adicionar mais GB é apenas um benefício extra, mas (agora é hora de falar sobre isso) também teremos que gastar mais dinheiro como regra geral no modelo com maior capacidade.

A opção mais simples, desde que o jogo permita, é diminuir algumas configurações e ficar no limite de VRAM em termos de capacidade e sabendo que há uma parte que está reservada ao driver e certas características, que já falamos em outras ocasiões.

Portanto, se pudermos pagar, Steinman está certo, mais VRAM é sempre uma vantagem , presente e futuro, já que não teremos que acessar a RAM do sistema , ou pelo menos, com menos frequência, subir alguns FPS ao longo do caminho. Claro que não muitos, a menos que a procura por VRAM seja incrível devido à resolução, filtros ou simplesmente porque o motor gráfico leva tudo o que lhe damos, seja 8 GB, 16 GB ou 24 GB. Algo que também acontece e Não significa que tudo está sendo aproveitado.

Para discernir nesses casos teríamos que comparar com um modelo como o RX 7600 XT de que estamos falando, mesmo chip, VRAM diferente , e tirar dúvidas sobre como isso realmente afeta o FPS naquele jogo específico, porque se o desempenho for preciso mesmo ao duplicar a memória, então sabemos que o motor de jogo simplesmente coleta toda a memória que lhe damos, embora não esteja usando nesse nível.

E assim conclui nosso discurso abrangente sobre a Radeon RX 7600 XT, abrangendo todos os aspectos pertinentes à sua configuração e arquitetura de memória.

*️⃣ Link da fonte:

Keith conseguiu entrevistar Aaron Steinman ,