Vamos começar com uma estatística surpreendente: de acordo com a McKinsey, a inteligência artificial generativa, ou GenAI, adicionará entre 2,6 e 4,4 trilhões de dólares por ano à produção econômica global, com empresas na vanguarda. Seja você um fabricante que busca otimizar sua cadeia de suprimentos global, um hospital que analisa dados de pacientes para sugerir planos de tratamento personalizados ou uma empresa de serviços financeiros que busca melhorar a detecção de fraudes, a IA pode ser a chave para sua organização desbloquear novos níveis de eficiência, intuição e criação de valor.
Muitos dos CIOs e líderes de tecnologia com quem conversamos hoje reconhecem isso. Na verdade, a maioria afirma que suas organizações planejam adotar totalmente a GenAI nos próximos dois anos. No entanto, de acordo com o Cisco AI Readiness Index, apenas 14% das organizações afirmam que suas infraestruturas estão hoje prontas para a IA. Além disso, impressionantes 85% dos projetos de IA falham ou são interrompidos depois de iniciados.
A razão? Existe uma grande barreira à entrada. Pode exigir que uma organização reformule completamente a infraestrutura para atender às necessidades de casos de uso específicos de IA, desenvolva as habilidades necessárias para desenvolver e dar suporte à IA e aborde os custos adicionais e a complexidade da segurança e do gerenciamento dessas novas cargas de trabalho.
Acreditamos que existe um caminho mais simples a seguir. É por isso que estamos entusiasmados em apresentar uma ampla gama de produtos e soluções para casos de uso intensivo de dados e desempenho, como treinamento, ajuste e inferência de grandes modelos de linguagem para GenAI. Muitas dessas novas adições ao portfólio de infraestrutura de IA da Cisco foram anunciadas no Cisco Partner Summit e já estão disponíveis para encomenda.
Esses anúncios atendem aos requisitos abrangentes de infraestrutura que as empresas têm ao longo do ciclo de vida da IA, desde a criação e treinamento de modelos sofisticados até o uso generalizado para inferência. Vejamos como isso funcionaria com os novos produtos que estamos lançando.
Cálculo acelerado
Uma jornada típica de IA começa com o treinamento de modelos GenAI com grandes quantidades de dados para construir inteligência de modelo. Para esta importante fase, o novo Servidor Cisco UCS C885A M8 é uma potência projetada para enfrentar as tarefas de treinamento de IA mais desafiadoras. Com sua configuração de alta densidade de GPUs NVIDIA H100 e H200 Tensor Core, combinadas com a eficiência da arquitetura NVIDIA HGX e dos processadores AMD EPYC, o UCS C885A M8 fornece o poder computacional bruto necessário para lidar com conjuntos de dados massivos e algoritmos complexos. Além disso, sua implantação simplificada e gerenciamento simplificado tornam mais fácil do que nunca para os clientes empresariais adotarem a IA.
Estrutura de rede escalável para conectividade de IA
Para treinar modelos GenAI, clusters desses servidores poderosos geralmente trabalham em uníssono, gerando um imenso fluxo de dados que requer uma estrutura de rede que possa lidar com alta largura de banda com latência mínima. É aqui que o novo lançamento Comutador Cisco Nexus 9364E-SG2 brilha. Sua agregação de 800G de alta densidade garante um fluxo de dados suave entre servidores, enquanto o gerenciamento avançado de congestionamento e os grandes tamanhos de buffer minimizam as perdas de pacotes, mantendo a latência baixa e o desempenho do treinamento alto. O Nexus 9364E-SG2 serve como base para uma infraestrutura de rede altamente escalável, permitindo que os clusters de IA se expandam perfeitamente à medida que as necessidades organizacionais aumentam.

Simplicidade de compra
Depois que esses modelos poderosos forem treinados, a infraestrutura de inferência deverá ser implantada para fornecer valor real, muitas vezes em um cenário distribuído de data centers e pontos de presença. Simplificamos bastante esse processo com os novos Cisco AI PODs que aceleram a implantação de toda a pilha de infraestrutura de IA. Independentemente de onde você se enquadra no espectro de casos de uso mencionados no início deste blog, os AI PODs são projetados para oferecer uma experiência plug-and-play com computação acelerada NVIDIA. Pacotes de infraestrutura pré-dimensionados e pré-validados eliminam as suposições na implementação de inferência de borda, clusters em grande escala e outras soluções de inferência de IA, com mais casos de uso planejados para lançamento nos próximos meses.
Nosso objetivo é permitir que os clientes implantem AI PODs com segurança e previsibilidade em desempenho, escalabilidade, custo e resultados, ao mesmo tempo em que reduzem o tempo de inferência pronta para produção com uma pilha completa de infraestrutura, software e conjunto de ferramentas de IA. Os AI PODs incluem NVIDIA AI Enterprise, uma plataforma de software ponta a ponta nativa da nuvem que acelera pipelines de ciência de dados e simplifica o desenvolvimento e a implantação de IA. Gerenciados pelo Cisco Intersight, os AI PODs fornecem controle e automação centralizados, simplificando tudo, desde a configuração até as operações diárias, com mais casos de uso por vir.
Implantado na nuvem e gerenciado na nuvem
Para ajudar as organizações a modernizarem suas operações de data center e permitirem casos de uso de IA, simplificamos ainda mais a implantação e o gerenciamento de infraestrutura com o Cisco Nexus Hyperfabric, uma solução de malha como serviço anunciada hoje a partir deste ano no Cisco Live. O Cisco Nexus Hyperfabric apresenta um controlador gerenciado em nuvem que simplifica o design, a implantação e o gerenciamento da sua estrutura de rede para desempenho consistente e facilidade de operação. O desempenho acelerado por hardware do Cisco Nexus Hyperfabric, com sua alta largura de banda inerente e baixa latência, otimiza a inferência de IA, permitindo tempos de resposta rápidos e utilização eficiente de recursos para aplicações reais de IA que exigem muito tempo. Além disso, os recursos abrangentes de monitoramento e análise do Cisco Nexus Hyperfabric fornecem visibilidade em tempo real do desempenho da rede, permitindo a identificação e resolução proativa de problemas para manter um ambiente de inferência tranquilo e confiável.

Ao fornecer um conjunto contínuo de soluções, desde servidores de treinamento poderosos e redes de alto desempenho até implantações de inferência simplificadas, estamos permitindo que as empresas acelerem suas iniciativas de IA, liberem todo o potencial de seus dados e impulsionem inovações significativas.
Informações sobre disponibilidade e muito mais
O servidor Cisco UCS C885A M8 já está disponível para encomenda e deverá ser enviado aos clientes ainda este ano. Os Cisco AI PODs estarão disponíveis para encomenda em novembro. O switch Cisco Nexus 9364E-SG2 estará disponível para pedido em janeiro de 2025, com disponibilidade a partir do primeiro trimestre do ano civil de 2025. O Cisco Nexus Hyperfabric estará disponível para compra em janeiro de 2025 com mais de 30 parceiros certificados. O Hyperfabric AI estará disponível em maio e incluirá uma solução de IA plug-and-play, incluindo servidores Cisco UCS (com computação acelerada NVIDIA integrada e software de IA) e armazenamento VAST opcional.
Para mais informações sobre esses produtos, acesse:
Se você estiver participando do Cisco Partner Summit esta semana, visite o Solutions Showcase para ver o servidor Cisco UCS C885A M8 e o switch Cisco Nexus 9364E-SG2. Você também pode participar da sessão de insights de negócios BRI08 intitulado “Revolucione o amanhã: liberte a inovação através do poder da infraestrutura preparada para IA” para mais detalhes sobre os produtos e soluções anunciados.
Compartilhar: