Um novo modelo de inteligência artificial para a era dos agentes

Um comunicado do CEO do Google e da Alphabet, Sundar Pichai:

A informação é fundamental para o progresso humano. Por isso, há mais de 26 anos estamos dedicados à nossa missão de organizar a informação do mundo e torná-la acessível e útil. E é por isso que continuamos a expandir os limites da IA para organizar as informações em cada entrada e torná-las acessíveis através de qualquer saída, para que possam ser verdadeiramente úteis para você.

Essa era a nossa visão quando introduzimos o Gemini 1.0 em dezembro passado. O primeiro modelo construído para ser nativamente multimodal, o Gemini 1.0 e 1.5 trouxe grandes avanços com multimodalidade e contexto longo para compreender informações em texto, vídeo, imagens, áudio e código, e processar muito mais delas.

Atualmente, milhões de desenvolvedores estão trabalhando com o Gemini. E isso nos ajuda a repensar todos os nossos produtos, incluindo os 7 com 2 bilhões de usuários, e a criar novos. O NotebookLM é um excelente exemplo do que a multimodalidade e o contexto longo podem oferecer às pessoas e por que é tão amado por tantas.

No último ano, investimos no desenvolvimento de mais modelos de agentes, o que significa que eles podem entender melhor o mundo ao seu redor, antecipar situações e agir em seu nome, com a sua supervisão.

Hoje estamos entusiasmados em lançar nossa próxima era de modelos criados para esta nova era de agentes: apresentando o Gemini 2.0, nosso modelo mais capaz até agora. Com novos avanços na multimodalidade – como imagem nativa e saída de áudio – e a utilização de ferramentas nativas, permitirá construir novos agentes de IA que nos aproximem da nossa visão de um assistente universal.

Neste momento, estamos disponibilizando a versão 2.0 para desenvolvedores e testadores confiáveis. E estamos trabalhando rapidamente para incluí-la em nossos produtos, principalmente com o Gemini e o Search. A partir de hoje, nosso modelo experimental Gemini 2.0 Flash estará disponível para todos os usuários do Gemini. Também estamos lançando um novo recurso chamado Deep Research, que utiliza recursos avançados de raciocínio e contexto longo para atuar como assistente de pesquisa, explorando tópicos complexos e compilando relatórios em seu nome. Ele está disponível no Gemini Advanced hoje.

Nenhum produto foi tão transformado pela IA quanto a pesquisa. Nossas visões gerais de IA agora alcançam 1 bilhão de pessoas, permitindo que façam tipos de perguntas totalmente novos, tornando-se rapidamente um dos nossos recursos de pesquisa mais populares de todos os tempos. Como próximo passo, estamos trazendo os recursos avançados de raciocínio do Gemini 2.0 para as visões gerais de IA para abordar tópicos mais complexos e questões de várias etapas, incluindo equações matemáticas avançadas, consultas multimodais e codificação. Começamos os testes limitados esta semana e lançaremos de forma mais ampla no início do próximo ano. E continuaremos a levar visões gerais de IA para mais países e idiomas durante o próximo ano.

O progresso 2.0 é apoiado por investimentos de décadas em nossa abordagem diferenciada e abrangente à inovação em IA. Ele é baseado em hardware personalizado como Trillium, nossas TPUs de 6ª geração. As TPUs potencializaram 100% do treinamento e inferência do Gemini 2.0, e hoje o Trillium está geralmente disponível para os clientes, para que eles também possam construir com ele.

Se o Gemini 1.0 tratava de organizar e compreender informações, o Gemini 2.0 pretende torná-las muito mais úteis. Mal podemos esperar para ver o que esta próxima era trará.

– Domingo

FONTE

Por Staff

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *