Google apresenta suas novas apostas em ia, gemini omni e 3.5 flash

O Globo, Brasil 20 de mayo de 2026

O Google apresentou ontem, no evento Google I/O, seus dois novos modelos de inteligência ...

O Google apresentou ontem, no evento Google I/O, seus dois novos modelos de inteligência artificial (IA), o Gemini Omni e o Gemini 3.5 Flash. O primeiro tenta entender o mundo físico, enquanto o segundo mira o alto custo para construir agentes sem perder performance.
O Omni busca ir além daquilo que os grandes modelos de linguagem (LLMs) são capazes. Parte dos pesquisadores de IA acredita que, para atingir a chamada superinteligência artificial, os LLMs precisam ter compreensão profunda do mundo físico. Segundo o Google, o Omni dá o primeiro passo em direção aos "modelos de mundo", que buscam entender e simular a realidade.
" Esse é um grande salto na compreensão e modelagem do mundo. Modelos como Veo e Nano Banana conseguem criar vídeos e imagens bem realistas, mas não são simulações do mundo. Eles demonstram uma compreensão da física, o que é crucial. O Omni gera resultados baseados no conhecimento acumulado durante o treinamento " disse Koray Kavucuoglu, diretor de Arquitetura de IA do Google.
Isso significa que o Omni será usado inicialmente para tarefas mais prosaicas, como geração de vídeos e imagens, e não como inteligência de robôs. Ele permite criar animações complexas a partir de prompts simples ou editar vídeos existentes para mudar personagens e estilos, com imagens respeitando como gravidade, sombras e dinâmica de fluidos.
Edição sem parar
A companhia explica que o novo modelo é multimodal puro, ou seja, recebe comandos e gera imagens a partir de texto, áudio, vídeo e fotos. O processamento dos diferentes tipos de comando é feito de maneira simultânea.
Além disso, ele pode "consumir" o vídeo que acabou de gerar, permitindo que o usuário continue a melhorá-lo " superando uma das grandes restrições dos geradores de vídeo.
O novo modelo já está disponível para assinantes dos planos Google AI Plus, Pro e Ultra, que variam entre R$ 25 e R$ 1.210 mensais.
Também no evento Google I/O, a empresa mostrou a nova geração de sua principal família de IAs, apenas quatro meses após apresentar o Gemini 3.1. O Gemini 3.5 Flash supera o 3.1 Pro em quase todos os parâmetros. Seu foco, porém, é o custo e a velocidade de execução de tarefas, aspectos importantes para desenvolvedores.
" Vocês já devem ter ouvido histórias de diretores de tecnologia sobre companhias que já em maio estouraram o orçamento anual de tokens. Se elas usarem uma mistura do Flash com outros modelos de fronteira, podem economizar muito dinheiro " afirmou Sundar Pichai, CEO do Google, no evento.
Tokens são os pedacinhos de palavras processados e gerados por IA. O uso de IAs por desenvolvedores é cobrado pelo número de tokens enviados e recebidos pelos sistemas.
Processar um livro por meio de um chatbot pode consumir 30 mil tokens, enquanto tarefas de programação com agentes podem consumir rapidamente 20 milhões.
Segundo Pichai, grandes empresas, que processam cerca de 1 trilhão de tokens por dia, podem economizar mais de US$ 1 bilhão anualmente se migrarem 80% de suas cargas de trabalho para essa combinação de modelos.
O líder do Google explicou que o Gemini 3.5 Flash é também quatro vezes mais veloz do que outros modelos e que existe uma versão ainda mais otimizada na plataforma de desenvolvimento Antigravity, que é 12 vezes mais rápida que a concorrência. Isso significa que o Gemini surge como um forte candidato para tarefas de programação e execução de processos por agentes de IA, área hoje dominada pelo Claude Code, da Anthropic.
O 3.5 Flash não apenas já está disponível nas plataformas do Google voltadas para desenvolvedores, como também vai rodar no aplicativo do Gemini e turbinar o Modo IA nas buscas da companhia.
Daily Brief
O Gemini recebeu novos recursos. Um deles é o Daily Brief, que reúne informações pessoais de vários apps do Google para organizar o dia dos usuários. Ele analisa e-mails, calendário e tarefas para criar uma programação personalizada.
Foi apresentado ainda o Gemini Spark, mais um dos agentes do Google que pode ser configurado e se conectar aos outros serviços da big tech. Diferentemente do OpenClaw, o Spark roda em máquinas virtuais dedicadas no Google Cloud. Isso significa que ele está sempre ativo e pode trabalhar em segundo plano " mas isso pode limitar seu uso, já que alguns arquivos importantes só estão na máquina física do usuário.
Por fim, o aplicativo ganhou uma nova linguagem visual, que inclui animações fluidas e cores mais vibrantes.