2025 Predictions: Enterprises, Researchers Home In on Humanoids, AI Agents

Da sala de reuniões ao refeitório, a inteligência artificial generativa dominou este ano, gerando discussões em diversas indústrias sobre como aproveitar melhor a tecnologia para aprimorar a inovação e a criatividade, melhorar o atendimento ao cliente, transformar o desenvolvimento de produtos e até mesmo aumentar a comunicação.

De acordo com a IDC, empresas em todo o mundo devem gastar US$ 307 bilhões em soluções de IA no próximo ano, chegando a US$ 632 bilhões até 2028, com uma taxa de crescimento anual composta de 29,0%. A IA terá um impacto econômico global cumulativo de US$ 19,9 trilhões até 2030 e impulsionará 3,5% do PIB global em 2030, prevê a IDC.

No entanto, algumas empresas e startups ainda estão lentas para adotar a IA, mantendo-se em experimentação e projetos isolados, mesmo com o avanço acelerado da tecnologia. Isso se deve em parte porque os benefícios da IA variam de acordo com a empresa, o caso de uso e o nível de investimento.

Abordagens cautelosas estão dando lugar ao otimismo. Dois terços dos respondentes da Pesquisa sobre o Estado da IA de 2024 da Forrester Research acreditam que suas organizações precisariam de menos de 50% de retorno sobre os investimentos para considerar bem-sucedidas suas iniciativas de IA.

O próximo grande avanço no horizonte é a IA agente, uma forma de IA autônoma ou «racional» que requer o uso de modelos de linguagem diversos, pilhas de geração aumentada por recuperação sofisticada e arquiteturas de dados avançadas.

Os especialistas da NVIDIA em verticais industriais já compartilharam suas expectativas para o próximo ano. Agora, ouça dos especialistas da empresa que impulsionam a inovação em IA em empresas, pesquisa e ecossistema de startups:

IAN BUCK
Vice-presidente de Hyperscale e HPC

A inferência impulsiona a carga da IA: À medida que os modelos de IA crescem em tamanho e complexidade, a demanda por soluções de inferência eficientes aumentará.

O surgimento da IA generativa transformou a inferência de um simples reconhecimento da consulta e resposta para uma geração de informações complexas — incluindo a sumarização de múltiplas fontes e grandes modelos de linguagem como o OpenAI o1 e o Llama 450B — o que aumenta drasticamente as demandas computacionais. Através de novas inovações em hardware, juntamente com melhorias contínuas em software, o desempenho aumentará e o custo total de propriedade deverá diminuir em 5x ou mais.

Acelere tudo: Com as GPUs se tornando mais amplamente adotadas, as indústrias buscarão acelerar tudo, desde o planejamento até a produção. Novas arquiteturas acrescentarão a esse ciclo virtuoso, oferecendo eficiências de custo e um desempenho computacional uma ordem de magnitude maior a cada geração.

À medida que nações e empresas correm para construir fábricas de IA para acelerar ainda mais as cargas de trabalho, muitas buscarão soluções de plataforma e arquiteturas de data center de referência ou planos que possam colocar um data center em funcionamento em semanas em vez de meses. Isso os ajudará a resolver alguns dos desafios mais difíceis do mundo, incluindo computação quântica e descoberta de medicamentos.

Computação quântica — todos os testes, nenhum erro: A computação quântica dará passos significativos à medida que os pesquisadores se concentram na supercomputação e simulação para resolver os maiores desafios do campo incipiente: os erros.

Os qubits, a unidade básica de informação na computação quântica, são suscetíveis a ruídos, tornando-se instáveis após a realização de apenas milhares de operações. Isso impede que o hardware quântico atual resolva problemas úteis. Em 2025, espera-se ver a comunidade de computação quântica avançar em direção a técnicas desafiadoras, mas cruciais, de correção de erros quânticos. A correção de erros requer cálculos rápidos e de baixa latência. Também espere ver hardware quântico fisicamente co-localizado dentro de supercomputadores, suportado por infraestrutura especializada.

A IA também desempenhará um papel crucial na gestão desses sistemas quânticos complexos, otimizando a correção de erros e aprimorando o desempenho geral do hardware quântico. Essa convergência da computação quântica, supercomputação e IA em supercomputadores quânticos acelerados impulsionará o progresso na realização de aplicações quânticas para resolver problemas complexos em vários campos, incluindo a descoberta de medicamentos, o desenvolvimento de materiais e a logística.

BRYAN CATANZARO
Vice-presidente de Pesquisa Aplicada em Aprendizado Profundo

Dando um rosto à IA: A IA se tornará mais familiar de usar, responsiva emocionalmente e marcada por uma maior criatividade e diversidade. Os primeiros modelos de IA generativa que desenhavam imagens tinham dificuldade em tarefas simples como desenhar dentes. Avanços rápidos em IA estão tornando as saídas de imagens e vídeos muito mais fotorrealistas, enquanto as vozes geradas por IA estão perdendo aquela sensação robótica.

Esses avanços serão impulsionados pelo aprimoramento de algoritmos e conjuntos de dados e pelo reconhecimento das empresas de que a IA precisa de um rosto e uma voz para importar para 8 bilhões de pessoas. Isso também causará uma mudança de interações de IA baseadas em turnos para conversas mais fluidas e naturais. As interações com a IA não se sentirão mais como uma série de trocas, mas oferecerão uma experiência de conversa mais envolvente e humanizada.

Repensando a infraestrutura da indústria e o planejamento urbano: Nações e indústrias começarão a examinar como a IA automatiza vários aspectos da economia para manter o padrão de vida atual, mesmo com a diminuição da população global.

Esses esforços poderão ajudar com a sustentabilidade e as mudanças climáticas. Por exemplo, a indústria agrícola começará a investir em robôs autônomos que possam limpar campos e remover pragas e ervas daninhas mecanicamente. Isso reduzirá a necessidade de pesticidas e herbicidas, mantendo o planeta mais saudável e liberando capital humano para outras contribuições significativas. Espere ver novos pensamentos nos escritórios de planejamento urbano para considerar veículos autônomos e melhorar a gestão do tráfego.

A longo prazo, a IA pode ajudar a encontrar soluções para reduzir as emissões de carbono e armazenar carbono, um desafio global urgente.

KARI BRISKI
Vice-presidente de Software de IA Generativa

Uma sinfonia de agentes — orquestradores de IA: Empresas estão prestes a ter uma série de agentes de IA, que são modelos semiautônomos, treinados, que trabalham em redes internas para ajudar com atendimento ao cliente, recursos humanos, segurança de dados e muito mais. Para maximizar essas eficiências, espere ver um aumento nos orquestradores de IA que trabalham com vários agentes para encaminhar de forma contínua as consultas humanas e interpretar os resultados coletivos para recomendar e tomar ações para os usuários.

Esses orquestradores terão acesso a um entendimento mais profundo do conteúdo, capacidades multilíngues e fluência com vários tipos de dados, variando de PDFs a fluxos de vídeo. Alimentados por volantes de dados autoaprendidos, os orquestradores de IA refinam continuamente insights específicos do negócio. Por exemplo, na manufatura, um orquestrador de IA poderia otimizar cadeias de suprimentos analisando dados em tempo real e fazendo recomendações sobre cronogramas de produção e negociações com fornecedores.

Essa evolução na IA empresarial aumentará significativamente a produtividade e a inovação em diversas indústrias, tornando-se mais acessível. Os trabalhadores do conhecimento serão mais produtivos porque poderão acessar uma equipe personalizada de especialistas impulsionados por IA. Os desenvolvedores poderão construir esses agentes avançados usando modelos de IA personalizáveis.

O raciocínio multietapa amplifica as percepções da IA: A IA há anos vem sendo boa em fornecer respostas a perguntas específicas sem precisar aprofundar o contexto de uma determinada consulta. Com avanços na computação acelerada e novas arquiteturas de modelo, os modelos de IA abordarão problemas cada vez mais complexos e responderão com maior precisão e análise mais profunda.

Usando uma capacidade chamada raciocínio multietapa, os sistemas de IA aumentam o tempo de «pensamento» dividindo grandes questões complexas em tarefas menores — às vezes até executando múltiplas simulações — para resolver problemas sob vários ângulos. Esses modelos avaliam dinamicamente cada etapa, garantindo respostas contextualmente relevantes e transparentes. O raciocínio multietapa também envolve a integração de conhecimento de várias fontes para permitir que a IA faça conexões lógicas e sintetize informações em diferentes domínios.

Isso provavelmente impactará campos que vão desde finanças e saúde até pesquisa científica e entretenimento. Por exemplo, um modelo de saúde com raciocínio multietapa poderia fazer várias recomendações para um médico considerar, dependendo do diagnóstico do paciente, medicamentos e resposta a outros tratamentos.

Inicie seu mecanismo de consulta de IA: Com empresas e organizações de pesquisa armazenando petabytes de dados, o desafio é obter acesso rápido aos dados para fornecer insights acionáveis.

Os mecanismos de consulta de IA mudarão a forma como as empresas exploram esses dados, e os mecanismos de busca específicos da empresa poderão filtrar dados estruturados e não estruturados, incluindo texto, imagens e vídeos, usando processamento de linguagem natural e aprendizado de máquina para interpretar a intenção do usuário e fornecer resultados mais relevantes e abrangentes.

Isso levará a processos de tomada de decisão mais inteligentes, melhores experiências do cliente e maior produtividade em diversas indústrias. As capacidades de aprendizado contínuo dos mecanismos de consulta de IA criarão volantes de dados autoaperfeiçoadores que ajudarão as aplicações a se tornarem cada vez mais eficazes.

CHARLIE BOYLE
Vice-presidente de Plataformas DGX

A IA agente torna a inferência de alto desempenho essencial para empresas: O surgimento da IA agente aumentará a demanda por respostas quase instantâneas de sistemas complexos de múltiplos modelos. Isso tornará a inferência de alto desempenho tão importante quanto a infraestrutura de treinamento de alto desempenho. Os líderes de TI precisarão de uma infraestrutura de computação acelerada escalável, feita sob medida e otimizada que possa acompanhar as demandas da IA agente para fornecer o desempenho necessário para a tomada de decisões em tempo real.

Empresas expandem fábricas de IA para transformar dados em inteligência: As fábricas de IA empresariais transformam dados brutos em inteligência de negócios. No próximo ano, as empresas expandirão essas fábricas para aproveitar grandes volumes de dados históricos e sintéticos, e depois gerar previsões e simulações para tudo, desde o comportamento do consumidor e otimização da cadeia de suprimentos até movimentações do mercado financeiro e gêmeos digitais de fábricas e armazéns. As fábricas de IA se tornarão uma vantagem competitiva fundamental que ajudará os primeiros adotantes a antecipar e moldar cenários futuros, em vez de apenas reagir a eles.

Fator de resfriamento — data centers de IA resfriados a líquido: À medida que as cargas de trabalho de IA continuam a impulsionar o crescimento, as organizações pioneiras farão a transição para o resfriamento a líquido para maximizar o desempenho e a eficiência energética. Provedores de nuvem em grande escala e grandes empresas liderarão o caminho, usando o resfriamento a líquido em novos data centers de IA que abrigam centenas de milhares de aceleradores de IA, redes e software.

As empresas escolherão cada vez mais implantar infraestrutura de IA em instalações de colocation em vez de construir as suas próprias — em parte para aliviar o ônus financeiro de projetar, implantar e operar a fabricação de inteligência em escala. Ou, elas alugarão capacidade conforme necessário. Essas implantações ajudarão as empresas a aproveitar a infraestrutura mais recente sem a necessidade de instalar e operar por conta própria. Essa mudança acelerará a adoção mais ampla da refrigeração a líquido como uma solução convencional para data centers de IA.

GILAD SHAINER
Vice-presidente sênior de Networking

Adeus rede, olá tecido de computação:  O termo «rede» no data center parecerá ultrapassado à medida que a arquitetura do data center se transforma em um tecido de computação integrado que permite a milhares de aceleradores se comunicarem eficientemente uns com os outros através de comunicações de escala para cima e para fora, abrangendo quilômetros de cabeamento e várias instalações de data center.

Esse tecido de computação integrado incluirá o NVIDIA NVLink, que permite comunicações de escala para cima, bem como capacidades de escala para fora habilitadas por switches inteligentes, SuperNICs e DPUs. Isso ajudará a mover dados de forma segura para e a partir de aceleradores e realizar cálculos em tempo real que minimizam drasticamente o movimento de dados. A comunicação em escala para fora por meio de redes será crucial para implantações de data center de IA em grande escala — e fundamental para colocá-las em funcionamento em semanas em vez de meses ou anos.

À medida

FONTE

Por Staff

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *