Inteligência Artificial

Gemini 3.1 Flash Live: Tornando a IA de áudio mais natural e confiável

Publicado porRedacao AIDaily
5 min de leitura
Autor na fonte original: Yifan Ding

O emblema da Gemini aparece ao lado do texto “Gemini 3.1 Flash Live”. O fundo apresenta pontos azuis e multicoloridos que formam o ícone de um microfone

Compartilhar:
Gemini 3.1 Flash Live: Tornando a IA de áudio mais natural e confiável

Nosso mais recente modelo de voz apresenta maior precisão e menor latência, tornando as interações de voz mais fluidas, naturais e precisas.

O Gemini 3.1 Flash Live é o modelo de áudio de mais alta qualidade do Google, projetado para diálogos em tempo real naturais e confiáveis. Os desenvolvedores podem acessá-lo por meio da API Gemini Live no Google AI Studio, enquanto as empresas podem utilizá-lo para melhorar a experiência do cliente. Todos podem experimentá-lo através do Search Live e do Gemini Live, que agora oferece suporte a mais de 200 países.

O Gemini 3.1 Flash Live é o modelo de áudio de mais alta qualidade do Google, projetado para diálogos em tempo real naturais e confiáveis. Os desenvolvedores podem acessá-lo por meio da API Gemini Live no Google AI Studio, enquanto as empresas podem usá-lo para melhorar a experiência do cliente. Todos podem experimentá-lo por meio do Search Live e do Gemini Live, que agora oferece suporte a mais de 200 países.

O "Gemini 3.1 Flash Live" chegou, tornando o áudio de IA mais natural e confiável. Este novo modelo de áudio é mais rápido e melhor na compreensão do tom para conversas naturais. Os desenvolvedores podem usá-lo para criar agentes de voz que lidam com tarefas complexas de forma mais confiável. O Gemini Live e o Search Live agora oferecem respostas mais úteis em vários idiomas. Todo o áudio do 3.1 Flash Live possui marca d'água para ajudar a impedir a disseminação de desinformação.

O "Gemini 3.1 Flash Live" chegou, tornando o áudio da IA mais natural e confiável.

Este novo modelo de áudio é mais rápido e melhor na compreensão do tom para conversas naturais.

Os desenvolvedores podem usá-lo para criar agentes de voz que lidam com tarefas complexas de forma mais confiável.

O Gemini Live e o Search Live agora oferecem respostas mais úteis em vários idiomas.

Todo o áudio do 3.1 Flash Live possui marca d'água para ajudar a impedir a disseminação de desinformação.

Seu navegador não suporta o elemento de áudio.

Hoje, estamos aprimorando os recursos de diálogo em tempo real do Gemini com o Gemini 3.1 Flash Live, nosso modelo de áudio e voz de mais alta qualidade até o momento. Ele oferece a velocidade e o ritmo natural necessários para a próxima geração de IA com prioridade de voz, proporcionando uma experiência mais intuitiva para desenvolvedores, empresas e usuários comuns.

O 3.1 Flash Live está disponível em todos os produtos do Google:

Para desenvolvedores em pré-visualização por meio da API Gemini Live no Google AI Studio

Para empresas no Gemini Enterprise for Customer Experience

Para todos por meio do Search Live e do Gemini Live

Para desenvolvedores: raciocínio robusto e execução de tarefas

Melhoramos a qualidade geral do 3.1 Flash Live, tornando-o mais confiável para desenvolvedores e empresas criarem agentes com prioridade de voz capazes de realizar tarefas complexas em escala. No ComplexFuncBench Audio, um benchmark que captura chamadas de funções em várias etapas com diversas restrições, ele lidera com uma pontuação de 90,8% em comparação com nosso modelo anterior.

No Audio MultiChallenge da Scale AI, o Gemini 3.1 Flash Live lidera com uma pontuação de 36,1% com o recurso “thinking” ativado. O benchmark testa especificamente o cumprimento de instruções complexas e o raciocínio de longo prazo em meio às interrupções e hesitações típicas do áudio do mundo real.

O 3.1 Flash Live também aprimorou a compreensão tonal para proporcionar diálogos mais naturais. No Gemini Enterprise for Customer Experience, ele é ainda mais eficaz no reconhecimento de nuances acústicas, como tom e ritmo, do que o 2.5 Flash Native Audio. Ele também é melhor em ajustar dinamicamente sua resposta às expressões de frustração ou confusão dos usuários.

O 3.1 Flash Live permite criar agentes preparados para voz que lidam com tarefas complexas em ambientes ruidosos.

Demonstração ilustrativa criada com o Gemini 3.1 Pro, com tecnologia do Gemini 3.1 Flash Live.

O 3.1 Flash Live permite que você use sua voz para criar código e iterar rapidamente.

Demonstração ilustrativa criada com o Gemini 3.1 Pro, com tecnologia do Gemini 3.1 Flash Live.

Empresas como Verizon, LiveKit e The Home Depot deram feedback positivo sobre o 3.1 Flash Live em seus fluxos de trabalho, destacando sua conversa aprimorada e natural.

Para todos: interações mais naturais e intuitivas

No Gemini Live e no Search Live, o modelo 3.1 Flash Live oferece respostas mais úteis e naturais, seja para perguntas rápidas do dia a dia ou para conversas mais complexas.

Com o modelo 3.1 Flash Live por trás, o Gemini Live oferece respostas mais rápidas em comparação com o modelo anterior e consegue acompanhar o fio da conversa por duas vezes mais tempo, mantendo sua linha de raciocínio intacta durante sessões de brainstorming mais longas.

O 3.1 Flash Live torna o Gemini Live mais rápido e útil

O 3.1 Flash Live também é inerentemente multilíngue, o que possibilita a expansão global do Search Live nesta semana. Com este lançamento, pessoas em mais de 200 países e territórios agora podem ter conversas multimodais em tempo real com o Search em seu idioma preferido.

Obtenha ajuda para solução de problemas em tempo real usando o 3.1 Flash Live no Search Live

Todo o áudio gerado pelo 3.1 Flash Live possui uma marca d’água com SynthID. Essa marca d’água imperceptível é entrelaçada diretamente na saída de áudio, permitindo a detecção confiável de conteúdo gerado por IA para ajudar a prevenir a desinformação. Para obter mais informações sobre nossa abordagem em relação à segurança e responsabilidade, consulte o cartão do modelo.

Experimente a naturalidade e a confiabilidade do 3.1 Flash Live a partir de hoje. Estamos ansiosos para ver como você irá interagir e criar com ele.

Verifique sua caixa de entrada para confirmar sua inscrição.

Você já está inscrito em nossa newsletter.

Você também pode se inscrever com um endereço de e-mail diferente.

O que esta cobertura entrega

  • Atribuicao clara de fonte com link para a publicacao original.
  • Enquadramento editorial sobre relevancia, impacto e proximos desdobramentos.
  • Revisao de legibilidade, contexto e duplicacao antes da publicacao.

Fonte original:

Google AI Blog

Sobre este artigo

Este artigo foi curado e publicado pelo AIDaily como parte da nossa cobertura editorial sobre desenvolvimentos em inteligência artificial. O conteúdo é baseado na fonte original citada abaixo, enriquecido com contexto e análise editorial. Ferramentas automatizadas podem auxiliar tradução e estruturação inicial, mas a decisão de publicar, a revisão factual e o enquadramento de contexto seguem responsabilidade editorial.

Saiba mais sobre nosso processo editorial