Contents

Tiny Corp abandona AMD e adota Intel e NVIDIA na revolução da IA

Tiny Corp , empresa focada em oferecer clusters de computação de Inteligência Artificial (IA) de baixo custo, anunciou que abandona o uso de hardware amd. A razão por trás deles são os importantes obstáculos que foram encontrados no desenvolvimento de seus clusters de IA batizados como “TinyBox”.

Especificamente, as pessoas que compõem a Tiny Corp esperavam notícias importantes da AMD no início deste mês, mas elas nunca chegaram. Para ser exato, esses problemas estão ligados ao firmware GPU de consumo topo de linha da empresa, a Radeon RX 7900 XTX. A equipe por trás da Tiny Corp tinha “70% de confiança” na aprovação da AMD para a distribuição aberta de certas partes do firmware. Agora, parece que a AMD não fez nada, já que a empresa revelou publicamente que estava a começar a testar as placas gráficas Intel Arc. Obviamente, a NVIDIA é outra alternativa possível para a empresa.

Tiny Corp indica que o firmware da GPU AMD é complexo e não documentado

/images/TinyBox.jpg Caixa Pequena

Especificamente, a Tiny Corp indica que, depois de comunicar várias vezes à AMD o problema que tiveram ao criar seus clusters de IA, estes não receberam nenhuma resposta satisfatória , alegando que a AMD estava “hesitante” em abrir seu trabalho. Por aberto significam que o firmware da GPU AMD é “complexo, não documentado, de código fechado e assinado, são todos problemas que não teríamos com nosso hardware”. Isso significa não ser capaz de configurar bem seus clusters em computadores avaliados em US$ 15.000

Esses clusters que eles estavam criando usavam seis placas gráficas AMD Radeon RX 7900 XTX. Com isso estávamos tentando normalizar o uso de GPUs de consumo para trabalho de IA, e tudo isso a um preço atraente para aqueles profissionais ou organizações que não podiam recorrer ao hardware caro projetado para acelerar as cargas de trabalho de IA. Bem, sem software compatível, o produto realmente não era muito útil. Agora, do lado da AMD pode-se pensar que defende o consumidor , mas devemos lembrar que a própria AMD ofereceu suporte de software amd ROCm para que essas GPUs pudessem executar cargas de trabalho de IA.

O desenvolvimento do TinyBox da AMD foi temporariamente suspenso devido a dificuldades na criação e execução do firmware necessário para nossas unidades de processamento gráfico. Além disso, os drivers atuais estão enfrentando problemas de instabilidade que levam a falhas no sistema sem qualquer meio de depuração. Infelizmente, atualmente não existe nenhum mecanismo disponível para recuperar o estado de uma GPU em caso de falha ou travamento. Parece que esta questão vai além do MES, uma vez que se acredita que o Processador de Comando (CP) também contribui para estes desafios.

O plano B é usar o Intel Arc A770 e a NVIDIA GeForceRTX 4090

/images/hardware-de-Tiny-Corp-para-hacer-los-TinyBox.jpg

No momento, estamos investigando a possível integração da tecnologia Intel e expandindo o suporte para TinyGrad em nosso sistema. Além disso, oferecemos uma recompensa de US$ 400 pela implementação bem-sucedida do suporte XMX. Nossa equipe também examinou os recursos de desempenho de uma configuração topo de linha com seis placas gráficas NVIDIA GeForce RTX 4090. Embora isso possa ser considerado lamentável por alguns, demonstra a força do nosso software.

Essa é a continuação do texto acima. Como podemos perceber, o Plano B é recorrer ao Intel Arc A770. Esta é a GPU topo de linha da Intel compatível com 8 e 16 GB de memória VRAM. Como você pode perceber, eles estão pagando para que algum desenvolvedor obtenha compatibilidade com XMX. Assim como a NVIDIA, as GPUs Intel Arc possuem hardware dedicado para aceleração de IA, neste caso mecanismos XMX. Desta forma, se você deseja criar um cluster para aceleração de IA, é fundamental empregar este hardware dedicado para o seu propósito.

Se você não conseguir isso, ou se o desempenho que você espera não estiver à altura da tarefa, eles já planejam seu Plano C. Isso passa por voltar para NVIDIA. Embora indiquem que o software é o seu maior ponto positivo, o problema está no preço. Isso tornará seus clusters menos competitivos. Computação de IA. Suas despesas também aumentarão.

*️⃣ Link da fonte:

que compõem a Tiny Corp ,