Apresentando AMD Nitro Diffusion: difusão em uma etapa…

Avanços recentes na pesquisa generativa de IA revolucionaram o campo da geração de imagens e criação de conteúdo visual, marcado por avanços significativos em qualidade e versatilidade. Vários algoritmos foram propostos para resolver este problema, incluindo Redes Adversariais Generativas (GANs)1 e autoencoders variacionais (VAE)2. Os modelos de difusão surgiram como uma técnica líder na geração de imagens, demonstrando capacidades impressionantes, como síntese de texto para imagem, transformação de imagem para imagem e pintura de imagens.3, 4, 5. Juntos, estes avanços não só ultrapassam os limites das aplicações artísticas e práticas, mas também abrem novas possibilidades em campos que vão do entretenimento à visualização científica.

A AMD tem o prazer de lançar modelos de difusão de uma etapa que demonstram a disponibilidade dos aceleradores AMD Instinct™ MI250 para treinamento de modelos e pesquisas adicionais. Os modelos são projetados para fornecer desempenho comparável aos modelos tradicionais de implantação completa, mantendo a eficiência necessária para treinamento em sistemas de data center ou implantação em dispositivos de ponta, como PCs e laptops habilitados para IA.

Modelos de difusão AMD Nitro:

Os modelos AMD Nitro Diffusio são construídos a partir de dois modelos populares de código aberto, Stable Diffusion 2.1 e PixArt-Sigma. Usando uma arquitetura UNet como backbone, com um modelo Contrastive Language-Image Pre-Train (CLIP) como codificador de texto para o primeiro, e um Diffusion Transformer (DiT) com um codificador de texto T5 maior para o último, a AMD criou modelos combine eficiência com alta qualidade de imagem. A implementação de inferência aproveita PyTorch, a biblioteca HuggingFace Accelerate e representações latentes pré-computadas para melhorar o rendimento do treinamento.

Para obter mais detalhes sobre a comparação visual das imagens geradas e o desempenho de inferência medido nos aceleradores AMD Instinct MI250, consulte o blog técnico completo AMD Nitro Diffusion: modelos de geração de texto para imagem em uma etapa. Instruções apropriadas também estão incluídas.

Para avançar nos avanços na inteligência artificial generativa, a AMD lançou modelos e códigos para a comunidade de código aberto para que mais usuários baixem e explorem novas possibilidades na geração de imagens e criação visual. Arquivos de modelo completos e instruções de código estão disponíveis nas folhas de modelo AMD Hugging Face AMD Stable Diffusion 2.1 Nitro, AMD PixArt Sigma Nitro e no repositório GitHub. Além disso, incentivamos os desenvolvedores a usar o AMD Developer Cloud, que oferece acesso remoto a GPUs AMD selecionadas para teste e desenvolvimento.

Para mais perguntas, sinta-se à vontade para entrar em contato com a equipe da AMD em amd_ai_mkt@amd.com.

FONTE

Por Staff

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *