A AMD acabou de lançar a versão mais recente de seu software de computação aberto, AMD ROCm™ 6.2.3, que suporta GPUs Radeon em sistemas Ubuntu® Linux® nativos. Notavelmente, esta nova versão oferece um desempenho de inferência incrível com o Llama 3 70BQ4 e agora permite que os desenvolvedores integrem recursos de Difusão Estável (SD) 2.1 de texto para imagem em seu desenvolvimento de IA.
“Após o lançamento anterior com AMD ROCm 6.1, visamos recursos específicos para acelerar o desenvolvimento de IA generativa. O AMD ROCm 6.2 oferece desempenho de nível profissional para inferência de Large Language Model via vLLM e Flash Attention 2. Além disso, esta versão também inclui suporte beta para a estrutura Triton, permitindo que mais usuários desenvolvam recursos de IA em hardware AMD”, afirma Erik Hultgren, Gerente de Produto de Software na AMD.
Os quatro principais destaques do AMD ROCm 6.2.3 para GPUs Radeon incluem o seguinte:
- Suporte oficial para a versão mais recente do Llama via vLLM – Incrível desempenho de inferência AMD ROCm™ em Radeon com Llama 3 70BQ4
- Suporte oficial para Flash Attention 2 «Ativar encaminhamento» – Projetado para reduzir os requisitos de memória e acelerar o desempenho de inferência
- Apoio oficial para difusão estável (SD) 2.1 – Integre o modelo de imagem de texto SD em seu desenvolvimento de IA
- Suporte beta para Triton – Aproveite a estrutura Triton para escrever facilmente código de IA de alto desempenho com o mínimo de conhecimento
O suporte AMD ROCm™ para GPUs Radeon já percorreu um longo caminho desde nosso lançamento inicial 5.7, há apenas 12 meses.
Com a versão 6.0, expandimos significativamente os recursos do AMD ROCm adicionando suporte para o popular tempo de execução ONNX e qualificamos formalmente o uso de várias GPUs Radeon, incluindo a Radeon PRO W7800 com 32 GB.
O lançamento do AMD ROCm 6.1 marcou outro marco importante, onde anunciamos o suporte oficial para configurações multi-GPU e a estrutura TensorFlow, além de fornecer acesso em nível beta ao subsistema Windows® para Linux® (WSL 2), que agora também é oficialmente qualificado para uso com 6.1.
Com a versão 6.2.3 mais recente, a pilha de soluções AMD ROCm™ para GPUs Radeon aparece da seguinte forma:
Embora nosso foco com o ROCm 6.2.3 tenha sido no Linux®, lançaremos suporte para WSL 2 em breve.
Caso você tenha perdido nosso anúncio anterior sobre ROCm 6.1.3, não deixe de conferir nosso vídeo de suporte e blog.
Foi um ano marcante para ROCm em Radeon para desenvolvimento de IA e aprendizado de máquina, e esperamos continuar a trabalhar em estreita colaboração com a comunidade para aprimorar ainda mais nossa pilha de produtos e ajudar nossos criadores de sistemas a criar soluções locais atraentes voltadas para o cliente.
Recursos:
Saiba mais >
Assista ao nosso último vídeo >
Baixe a folha de solução >
Leia nosso blog anterior >
Baixe o software >
Notas de versão >
Visite o Portal de Documentação >
Pré-requisitos >
Como dirigir >
David Diederichs é responsável pelo marketing de produtos, estações de trabalho e inteligência artificial
© 2024 Advanced Micro Devices, Inc. Todos os direitos reservados. AMD, o logotipo AMD Arrow, AMD RDNA, AMD ROCm, Radeon e suas combinações são marcas registradas da Advanced Micro Devices, Inc. Linux® é uma marca registrada de Linus Torvalds nos Estados Unidos e em outros países. Microsoft e Windows são marcas registradas da Microsoft Corporation nos Estados Unidos e/ou em outros países. PyTorch, o logotipo PyTorch e todas as marcas relacionadas são marcas registradas da The Linux Foundation. TensorFlow, o logotipo TensorFlow e todas as marcas relacionadas são marcas registradas da Google Inc. Ubuntu e o logotipo Ubuntu são marcas registradas da Canonical Ltd. Outros nomes de produtos usados nesta publicação são apenas para fins de identificação e podem ser marcas registradas de seus respectivos proprietários.