Apresentando microsserviços NIM e projetos de IA

No ano passado, a IA generativa transformou a forma como as pessoas vivem, trabalham e se divertem, melhorando tudo, desde a escrita e criação de conteúdo até jogos, aprendizagem e produtividade. Os entusiastas e desenvolvedores de PC estão liderando o esforço para ultrapassar os limites desta tecnologia inovadora.

Inúmeras vezes, as inovações tecnológicas que definiram a indústria foram inventadas num só lugar: uma garagem. Esta semana marca o início Garagem RTX AI série, que oferecerá conteúdo de rotina para desenvolvedores e entusiastas que desejam aprender mais sobre microsserviços NVIDIA NIM e projetos de IA e como construir agentes de IA, fluxo de trabalho criativo, humano digital, aplicativos de produtividade e muito mais em PCs de IA. Bem-vindo ao Garagem RTX AI.

Esta primeira parte destaca anúncios feitos no início desta semana na CES, incluindo novos modelos básicos de IA disponíveis em PCs NVIDIA RTX AI que levam humanos digitais, criação de conteúdo, produtividade e desenvolvimento a um nível mais alto.

Esses modelos, oferecidos como microsserviços NVIDIA NIM, são equipados com as novas GPUs GeForce RTX Série 50. Construídas na arquitetura NVIDIA Blackwell, as GPUs Série RTX 50 oferecem até 3,352 trilhões de operações de IA por segundo de desempenho, 32 GB de VRAM e recursos de. Processamento FP4, dobrando o desempenho de inferência de IA e permitindo que a IA generativa seja executada localmente com um pequeno consumo de memória.

A NVIDIA também introduziu NVIDIA AI Blueprints: fluxos de trabalho pré-configurados e prontos para uso, baseados em microsserviços NIM, para aplicações como criação digital humana e de conteúdo.

Os microsserviços NIM e os projetos de IA permitem que entusiastas e desenvolvedores criem, iterem e forneçam experiências baseadas em IA no PC com mais rapidez do que nunca. O resultado é uma nova onda de recursos práticos e interessantes para usuários de PC.

IA acelerada com NVIDIA NIM

Existem dois desafios principais em trazer os avanços da IA ​​para os PCs. Em primeiro lugar, o ritmo da investigação em IA é vertiginoso, com novos modelos a aparecer todos os dias em plataformas como a Hugging Face, que hoje alberga mais de um milhão de modelos. Como resultado, as descobertas rapidamente se tornam obsoletas.

Em segundo lugar, a adaptação destes modelos para utilização em PC é um processo complexo e que consome muitos recursos. Otimizá-los para hardware de PC, integrá-los com software de IA e conectá-los a aplicativos requer um esforço de engenharia significativo.

O NVIDIA NIM ajuda a enfrentar esses desafios, oferecendo modelos de IA de última geração pré-empacotados e otimizados para PCs. Esses microsserviços NIM abrangem domínios de modelo, podem ser instalados com um único clique, vêm com interfaces de programação de aplicativos (APIs) para fácil integração e aproveitam o software NVIDIA AI e GPUs RTX para desempenho acelerado.

Na CES, a NVIDIA anunciou um pipeline de microsserviços RTX AI PC NIM, suportando casos de uso abrangendo grandes modelos de linguagem (LLMs), modelos de linguagem de visão, geração de imagens, fala, geração aumentada de recuperação (RAG), extração de PDF e visão computacional.

A nova família de modelos abertos Llama Nemotron oferece alta precisão em uma ampla gama de tarefas do agente. O modelo Llama Nemotron Nano, que será oferecido como um microsserviço NIM para PCs e estações de trabalho RTX AI, é excelente em tarefas de IA, como seguir instruções, chamar funções, chat, codificação e matemática.

Em breve, os desenvolvedores poderão baixar e executar rapidamente esses microsserviços em PCs com Windows 11 usando o Windows Subsystem for Linux (WSL).

Para demonstrar como entusiastas e desenvolvedores podem usar NIM para criar agentes e assistentes de IA, a NVIDIA apresentou o Project R2X, um avatar de PC com visão que pode colocar informações na ponta dos dedos do usuário, auxiliar com aplicativos de desktop e videoconferência, ler e resumir documentos e mais. Inscreva-se para receber atualizações do Projeto R2X.

Usando microsserviços NIM, os entusiastas de IA podem ignorar as complexidades de curadoria de modelos, otimização e integração de back-end e se concentrar na construção e inovação com modelos de IA de ponta.

O que há em uma API?

Uma API é como um aplicativo se comunica com uma biblioteca de software. Uma API define uma série de “chamadas” que a aplicação pode fazer à biblioteca e o que ela pode esperar em troca. As APIs de IA tradicionais exigem muita instalação e configuração, tornando os recursos de IA mais difíceis de usar e dificultando a inovação.

Os microsserviços NIM expõem APIs intuitivas e fáceis de usar para as quais um aplicativo pode simplesmente enviar solicitações e obter uma resposta. Além disso, são projetados de acordo com suportes de entrada e saída para diferentes tipos de modelos. Por exemplo, os LLMs aceitam texto como entrada e produzem texto como saída, os geradores de imagens convertem texto em imagem, os reconhecedores de fala transformam a fala em texto e assim por diante.

Os microsserviços são projetados para se integrarem perfeitamente às principais estruturas de desenvolvimento e agentes de IA, como AI Toolkit for VSCode, AnythingLLM, ComfyUI, Flowise AI, LangChain, Langflow e LM Studio. Os desenvolvedores podem baixá-los e implantá-los facilmente em build.nvidia.com.

Ao trazer essas APIs para RTX, o NVIDIA NIM acelerará a inovação de IA em PCs.

Espera-se que os entusiastas possam experimentar uma variedade de microsserviços NIM usando uma versão futura da demonstração da tecnologia NVIDIA ChatRTX.

Um projeto de inovação

Usando modelos de última geração, pré-empacotados e otimizados para PC, desenvolvedores e entusiastas podem criar rapidamente projetos baseados em IA. Indo um passo além, eles podem combinar vários modelos de IA e outros recursos para criar aplicativos complexos, como humanos digitais, geradores de podcast e assistentes de aplicativos.

Os NVIDIA AI Blueprints, baseados em microsserviços NIM, são implementações de referência para fluxos de trabalho complexos de IA. Eles auxiliam os desenvolvedores a conectar diferentes componentes, como bibliotecas, kits de desenvolvimento de software e modelos de IA, em um único aplicativo.

Os projetos de IA incluem tudo o que um desenvolvedor precisa para criar, executar, personalizar e estender o fluxo de trabalho de referência, que consiste no aplicativo de referência, código-fonte, dados de amostra e documentação para personalização e orquestração dos diferentes componentes.

Na CES, a NVIDIA anunciou dois projetos de IA para RTX: um para transformar PDF em podcast, permitindo aos usuários gerar um podcast a partir de qualquer PDF, e outro para IA generativa guiada em 3D, baseada em FLUX.1 [dev] e que será oferecido como um microsserviço NIM, dando aos artistas mais controle sobre a geração de imagens baseadas em texto.

Com AI Blueprints, os desenvolvedores podem facilmente passar da experimentação de IA para o desenvolvimento de IA para fluxos de trabalho avançados em PCs e workstations RTX.

As novas GPUs GeForce RTX Série 50 foram projetadas especificamente para enfrentar desafios complexos de IA generativa, apresentando um Tensor Core de quinta geração com suporte FP4, memória G7 mais rápida e um processador de gerenciamento de IA para multitarefa eficiente entre IA e fluxos de trabalho criativos.

A série GeForce RTX 50 adiciona suporte FP4 para melhor desempenho e mais modelos para PCs. O FP4 é um método de quantização inferior que reduz o tamanho do modelo, permitindo que as GPUs da série 50 ofereçam mais que o dobro do desempenho da geração anterior.

Espera-se que os microsserviços NVIDIA NIM e os projetos de IA estejam disponíveis a partir do próximo mês, com suporte inicial para GPUs profissionais GeForce RTX 50 Series, GeForce RTX 4090 e 4080, e GPUs profissionais NVIDIA RTX 6000 e 5000 no futuro.

Os PCs AI RTX prontos para NIM estarão disponíveis em diversos fabricantes e prometem potencializar a experiência dos usuários com IA de forma revolucionária. As GPUs e laptops GeForce RTX Série 50 oferecem um desempenho incrível, permitindo que os criadores concluam seus projetos de forma eficiente. Confira o discurso do CEO da NVIDIA, Jensen Huang, para saber mais sobre as inovações de IA da empresa na CES.

FONTE

Por Staff

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *