Google revela IA que conversa em tempo real e óculos inteligentes

A Google apresentou nesta terça-feira (19) novidades que apontam para o futuro da inteligência artificial: aplicações que conversam em tempo real e se tornam cada vez mais autônomas. Demis Hassabis, presidente do braço de IA avançada da empresa, afirmou que o novo modelo Gemini Omni é capaz de “fazer qualquer coisa” ao receber “comandos de qualquer jeito”, com ênfase na geração de vídeos.

Gemini Omni: interação multimodal

Na prática, o Gemini Omni receberá comandos por meio de texto, imagem, fala e vídeo, permitindo interações quase instantâneas, como realizar edições, adicionar personagens ou objetos. Exemplos divulgados mostram cenas ultrarrealistas, com reflexos e física consistentes, geradas pela IA. “Esse sempre foi o nosso objetivo com o Gemini”, declarou Hassabis durante o Google I/O, principal evento para programadores. Ainda não há data de lançamento do Gemini Omni, que estará disponível, em versão limitada, para assinantes do Google AI Pro e Ultra por meio dos aplicativos Gemini, Google Flow, YouTube Shorts e YouTube Create.

Hassabis comparou a novidade com as ferramentas Nano Banana, Genie e Veo. Segundo ele, esses modelos já geram vídeos e simulações realistas com noções de realidade e física, mas ainda com limitações. O Omni vai além, representando ideias complexas como gravidade e energia cinética, algo que os modelos anteriores não conseguiam compreender.

—

Banner largo do Pickt — app de listas de compras colaborativas para Telegram

Óculos inteligentes: parceria com Samsung

Um futuro em que pessoas conversam com IA também se reflete no lançamento dos primeiros óculos inteligentes do Google, 11 anos após o fracasso do Google Glass (encerrado em 2015). O novo produto, voltado ao nicho dominado pelos Ray-Bans da Meta, surge de uma parceria com Samsung e as marcas de óculos Warby Parker e Gentle Monster. Os óculos reúnem lentes, câmera e alto-falantes de alta qualidade, em dois designs, permitindo que o usuário “fique com as mãos livres e a cabeça erguida”, segundo Shahram Izadi, executivo do Google que liderou o projeto. O lançamento está previsto para o segundo semestre deste ano.

A gigante de tecnologia, avaliada em US$ 4,7 trilhões, espera recuperar terreno frente a startups de IA utilizando seu mecanismo de busca, seu pacote de produtos e sua vasta base de dados para atrair bilhões de usuários. No que chamou de maior transformação dos últimos 25 anos, adicionou à Busca mais opções para pesquisas com IA, voltadas a perguntas complexas, incluindo uma ferramenta de programação facilitada.

Assistente Spark e Gemini 3.5

A empresa também anunciou um novo assistente chamado Spark, que pode ajudar a organizar a vida pessoal dos usuários, reduzir burocracias e automatizar tarefas repetitivas. Os usuários poderão permitir que o Spark se lembre de ações passadas e acesse dados de outros produtos, como Gmail e Maps, para personalizar os serviços. O Spark estará disponível na barra de pesquisa do Google, permitindo delegar tarefas como vasculhar a internet sem supervisão para compras, notícias, produtos específicos e reservas.

Hassabis posicionou o Google em relação aos concorrentes: o desempenho do Gemini 3.5, que chega ao público nesta terça, é comparável ao Claude Code (Anthropic) e ao Codex (OpenAI). O CEO Sundar Pichai afirmou que a plataforma é mais rápida e até duas vezes mais barata que os modelos concorrentes. O Gemini tem agora 900 milhões de usuários mensais, mais que o dobro em um ano. O recurso Resumos de IA na Busca tem 2,5 bilhões de usuários mensais, enquanto o AI Mode tem cerca de 1 bilhão.

Demanda por supercomputadores e AGI

A demanda por supercomputadores para rodar os modelos mais recentes de IA faz com que fornecedores precisem racionar o acesso de clientes. Fornecedores de servidores para data centers relatam dificuldade em entregar todos os pedidos desde 2024. O Google espera que seus chips proprietários mais recentes ofereçam maior capacidade com custo computacional menor. Uma versão Pro do Gemini 3.5 será lançada no próximo mês, com modelo de linguagem mais robusto. Hassabis disse que a inteligência artificial geral (AGI), que pode superar humanos na maioria das tarefas, está “no horizonte”, mas alertou sobre desafios potenciais e a necessidade de garantir a segurança dos sistemas de agentes.