LLMs

OpenAI launches new voice intelligence features in its API

Publicado porRedacao AIDaily
3 min de leitura
Autor na fonte original: Lucas Ropek

The new features could be handy for customer service systems, but OpenAI says they have applications that work across a variety of other fields, including education and creator platforms.

Compartilhar:

OpenAI said Thursday that its API will now include a number of new voice intelligence features designed to help developers create apps that can talk, transcribe, and translate conversations with users.

The company’s new GPT‑Realtime‑2 is another voice model, built to create a realistic vocal simulation that can converse with users. However, unlike its predecessor (GPT-Realtime-1.5) this one is built with GPT‑5‑class reasoning that OpenAI says was created to deal with more complicated requests from users.

The company is also launching GPT‑Realtime‑Translate, which, just as it sounds, is designed to provide real-time translation services that “keep pace” with the user, conversationally. The feature includes more than 70 input languages (that is, the languages that it can comprehend) and 13 output languages (the languages it relays to the speaker).

Finally, the company has also launched a new transcription capability, GPT-Realtime-Whisper, which gives users live speech-to-text capabilities that are captured as interactions occur.

“Together, the models we are launching move real-time audio from simple call-and-response toward voice interfaces that can actually do work: listen, reason, translate, transcribe, and take action as a conversation unfolds,” the company said.

Who will these updates be good for? Companies that want to expand customer service capabilities are an obvious target. However, OpenAI also notes that its new features will assist with a wide array of areas, including education, media, events, and creator platforms, among others.

As useful as these tools seem from an enterprise perspective, it also seems plausible that they could be misused. The company said it has built guardrails to stop its new features from being abused to create spam, fraud, or other forms of online abuse. Certain triggers have been embedded in the system so that “conversations can be halted if they are detected as violating our harmful content guidelines,” OpenAI said.

This Week Only: Buy one pass, get the second at 50% off

This Week Only: Buy one pass, get the second at 50% off

All of the new voice models are included in OpenAI’s Realtime API . Translate and Whisper are billed by the minute, while GPT-Realtime-2 is billed by token consumption.

When you purchase through links in our articles, we may earn a small commission . This doesn’t affect our editorial independence.

StrictlyVC Athens is up next. Hear unfiltered insights straight from Europe’s tech leaders and connect with the people shaping what’s ahead. Lock in your spot before it’s gone.

Hackers deface school login pages after claiming another Instructure hack Lorenzo Franceschi-Bicchierai Zack Whittaker

Hackers deface school login pages after claiming another Instructure hack

Hackers deface school login pages after claiming another Instructure hack

Hackers steal students’ data during breach at education tech giant Instructure Lorenzo Franceschi-Bicchierai

Hackers steal students’ data during breach at education tech giant Instructure

Hackers steal students’ data during breach at education tech giant Instructure

As workers worry about AI, Nvidia’s Jensen Huang says AI is ‘creating an enormous number of jobs’ Lucas Ropek

As workers worry about AI, Nvidia’s Jensen Huang says AI is ‘creating an enormous number of jobs’

As workers worry about AI, Nvidia’s Jensen Huang says AI is ‘creating an enormous number of jobs’

Anthropic and OpenAI are both launching joint ventures for enterprise AI services Russell Brandom

Anthropic and OpenAI are both launching joint ventures for enterprise AI services

Anthropic and OpenAI are both launching joint ventures for enterprise AI services

Ouster’s new color lidar is coming to replace cameras Sean O'Kane

Ouster’s new color lidar is coming to replace cameras

Ouster’s new color lidar is coming to replace cameras

This tiny, magnetic e-reader could stop you from doomscrolling Amanda Silberling

This tiny, magnetic e-reader could stop you from doomscrolling

This tiny, magnetic e-reader could stop you from doomscrolling

Uber wants to turn its millions of drivers into a sensor grid for self-driving companies Connie Loizos

Uber wants to turn its millions of drivers into a sensor grid for self-driving companies

Uber wants to turn its millions of drivers into a sensor grid for self-driving companies

Pontos-chave

  • As novas funcionalidades de voz da OpenAI podem revolucionar o atendimento ao cliente no Brasil, oferecendo experiências mais personalizadas.
  • A capacidade de tradução e transcrição em tempo real pode promover inclusão e democratização do conhecimento em ambientes educacionais.
  • A adoção responsável dessas tecnologias é essencial para prevenir abusos e garantir um uso benéfico no contexto brasileiro.

Análise editorial

A introdução das novas funcionalidades de inteligência de voz da OpenAI tem o potencial de transformar a forma como as empresas brasileiras interagem com seus clientes. No contexto do atendimento ao cliente, essas ferramentas podem não apenas melhorar a eficiência, mas também proporcionar uma experiência mais personalizada e envolvente. Com a crescente demanda por soluções automatizadas, especialmente em um mercado que busca inovação constante, a integração dessas tecnologias pode ser um diferencial competitivo significativo para empresas locais.

Além disso, as aplicações em educação e plataformas de criadores são particularmente relevantes para o Brasil, onde a diversidade linguística e cultural é um fator importante. A capacidade de traduzir e transcrever em tempo real pode facilitar o acesso à informação e à comunicação em ambientes educacionais, promovendo inclusão e democratização do conhecimento. As instituições de ensino que adotarem essas tecnologias poderão oferecer experiências de aprendizado mais interativas e acessíveis.

Entretanto, é crucial observar as implicações éticas e os desafios associados ao uso dessas ferramentas. A OpenAI menciona a implementação de salvaguardas para prevenir abusos, mas a eficácia dessas medidas ainda precisa ser avaliada. No Brasil, onde a desinformação e fraudes online são preocupações crescentes, a adoção responsável dessas tecnologias será essencial para garantir que elas sejam utilizadas de maneira benéfica e não prejudicial. O futuro da inteligência de voz dependerá não apenas da inovação tecnológica, mas também da construção de um ecossistema que priorize a ética e a responsabilidade social.

Por fim, as empresas brasileiras devem ficar atentas ao desenvolvimento contínuo dessas tecnologias. A evolução das capacidades de IA pode abrir novas oportunidades de mercado, mas também exigirá uma adaptação constante das estratégias empresariais. A integração de soluções como as da OpenAI pode ser um passo importante para empresas que buscam se destacar em um ambiente cada vez mais digital e competitivo.

O que esta cobertura entrega

  • Atribuicao clara de fonte com link para a publicacao original.
  • Enquadramento editorial sobre relevancia, impacto e proximos desdobramentos.
  • Revisao de legibilidade, contexto e duplicacao antes da publicacao.

Fonte original:

TechCrunch AI

Sobre este artigo

Este artigo foi curado e publicado pelo AIDaily como parte da nossa cobertura editorial sobre desenvolvimentos em inteligência artificial. O conteúdo é baseado na fonte original citada abaixo, enriquecido com contexto e análise editorial. Ferramentas automatizadas podem auxiliar tradução e estruturação inicial, mas a decisão de publicar, a revisão factual e o enquadramento de contexto seguem responsabilidade editorial.

Saiba mais sobre nosso processo editorial