ChatGPT com voz

ChatGPT agora conversa por voz e responde a imagens: entenda como funciona!

Publicado por

Publicado a 28 de setembro de 2023

Nesta segunda-feira (25/09), a OpenAI anunciou uma nova versão do ChatGPT capaz de interagir com os usuários por meio de texto falado. Agora, os usuários poderão ativar uma função para o chatbot se comportar de forma parecida com assistentes de voz, como Siri e Alexa: é só falar com o ChatGPT que ele vai responder.

Até a primeira semana de outubro, a nova versão será disponibilizada para os assinantes do ChatGPT Plus e Enterprise em dispositivos iOS e Android. Segundo a OpenAI, essas novas capacidades também devem ser lançadas em breve para desenvolvedores. 

Desde que foi anunciado em novembro de 2022, o ChatGPT atrai milhões de usuários por sua habilidade de responder a perguntas completas, escrever poesia e gerar códigos. De acordo com o New York Times, a nova versão do bot da OpenAI confronta chatbots rivais como Google Bard, ao mesmo tempo em que compete com Alexa e Siri. 

No entanto, apesar da interface de voz do ChatGPT se parecer com a interface de assistentes de voz anteriores, a sua tecnologia se baseia em grandes modelos de linguagem (large language models, ou LLM), que aprenderam a gerar linguagem analisando grandes volumes de textos coletados através da internet. 

Alexa e Siri atuam como centros de “comando e controle”, que podem performar um determinado número de tarefas ou dar respostas a um número limitado de questões programadas em sua base de dados, como “acender as luzes” ou “qual é a temperatura local?”. Por isso, adicionar novos comandos a esses assistentes poderia levar semanas. 

Devido ao uso de LLM, um dos grandes diferenciais do ChatGPT é a sua capacidade de responder praticamente qualquer questão em segundos, além de desenvolver conversas sobre quase todos os assuntos que o usuário sugerir. Com a nova capacidade de conversar por voz, a interação dos usuários com o ChatGPT deve se tornar ainda mais natural.

A OpenAI ainda afirma que o ChatGPT soa mais convincente do que outros assistentes, pois as vozes foram criadas em colaboração com dubladores profissionais e com o uso do Whisper, um sistema para reconhecimento de fala de código aberto que transcreve palavras faladas em texto. Os usuários podem escolher entre 5 opções de voz diferentes, incluindo masculinas e femininas, e é possível escutar amostras delas no blog da OpenAI

Além da capacidade de responder por voz, a nova versão do ChatGPT também pode responder a imagens. É possível, por exemplo, enviar uma foto de dentro da geladeira e pedir para o chatbot listar alguns pratos para cozinhar com os ingredientes disponíveis. A partir de uma fotografia, tabela ou diagrama, o novo ChatGPT pode descrever o conteúdo da imagem e responder questões relacionadas. 

Por sua capacidade de elaborar descrições detalhadas de imagens, a OpenAI considera que a ferramenta pode ser útil para pessoas que possuem deficiência visual. No entanto, por uma questão de políticas de segurança, a nova versão do ChatGPT se recusa a identificar rostos. 

Use a tecnologia do ChatGPT no seu chatbot

Sabia que você já pode integrar a tecnologia do ChatGPT ao seu bot de atendimento? Para isso, conheça a Cxpress, a plataforma da Elife para gestão de atendimento omnicanal no WhatsApp, redes sociais, telefonia e e-mail. 

Além do serviço de apoio na criação de bots com a IA do ChatGPT, a Cxpress oferece tudo o que você precisa para elevar a qualidade do seu atendimento, integrando os principais canais em uma só plataforma. 

Quer ver como a Cxpress funciona na prática? Acesse a página da plataforma e marque sua demonstração gratuita! Um de nossos especialistas logo vai entrar em contato.