Google melhora modelo de vídeo de IA em física

O Google pode ter começado recentemente a lançar sua IA generativa Veo para clientes corporativos, mas a empresa não perde tempo em apresentar uma nova versão da ferramenta de vídeo aos primeiros testadores. Na segunda-feira, o Google anunciou uma prévia do Veo 2. Segundo a empresa, o Veo 2 «entende a linguagem da cinematografia». Na prática, isso significa que você pode se referir a um gênero de filme, efeito cinematográfico ou lente específico quando o modelo for solicitado.

Além disso, o Google afirma que o novo modelo compreende melhor a física do mundo real e o movimento humano. Modelar corretamente os humanos em movimento é algo que todos os modelos generativos lutam para fazer. Portanto, é digna de nota a afirmação da empresa de que o Veo 2 é melhor quando se trata de ambos os pontos problemáticos. É claro que as amostras fornecidas pela empresa não são suficientes para ter certeza; o verdadeiro teste das capacidades do Veo 2 virá quando alguém solicitar que ele gere um vídeo da rotina de uma ginasta. Ah, e falando em coisas que os modelos de vídeo enfrentam, o Google diz que o Veo produzirá artefatos como dedos extras «com menos frequência».

Separadamente, o Google está lançando melhorias no Imagen 3. Em seu modelo de texto para imagem, a empresa afirma que a versão mais recente gera imagens mais brilhantes e melhor compostas. Além disso, pode renderizar estilos de arte mais diversos com maior precisão. Ao mesmo tempo, ele também segue melhor as instruções com mais fidelidade. A integração oportuna foi um problema que destaquei quando a empresa disponibilizou o Imagen 3 para clientes do Google Cloud no início deste mês, portanto, pelo menos, o Google está ciente das áreas onde seus modelos de IA precisam ser trabalhados.

O Veo 2 será implementado gradualmente para usuários do Google Labs nos Estados Unidos. Por enquanto, o Google limitará os testadores a gerar até oito segundos de filmagem em 720p. Para contextualizar, Sora pode gerar até 20 segundos de filmagem em 1080p, embora isso exija uma assinatura ChatGPT Pro de US$ 200 por mês. Quanto às melhorias mais recentes do Imagen 3, elas estão disponíveis para usuários do Google Labs em mais de 100 países via ImageFX.

FONTE

Google melhora modelo de vídeo de IA em física

PorStaff

Por Staff

Entrada relacionada

O que aguardar do evento de lançamento do Samsung Galaxy S25 Unpacked

Legion Pro 7i: laptop para jogos suporta gráficos até RTX 5090

Citizen Sleeper 2: como manter nossa humanidade em um futuro desolador

Perdeu-se?

O que aguardar do evento de lançamento do Samsung Galaxy S25 Unpacked

Desenvolva um assistente digital duplo com tecnologias de IA da Oracle

Legion Pro 7i: laptop para jogos suporta gráficos até RTX 5090

Como remover o menu G-Invoicing no centro de trabalho do comprador