Com 5 vozes distintas, chatgpt agora pode falar com o usuário
Em uma das principais atualizações já feitas no ChatGPT até agora, a startup de ...
Em uma das principais atualizações já feitas no ChatGPT até agora, a startup de inteligência artificial OpenAI lançou um recurso que permite ao chatbot ter voz para responder perguntas em áudio e reagir a comandos de fala dos usuários.
Nas próximas duas semanas, os usuários do robô virtual começarão a poder escolher no aplicativo uma entre as cinco vozes disponíveis, que encarnam diferentes personalidades. Cada uma terá um nome, como "Juniper", "Breeze" e "Ember".
Quem optar por usar essa função e interagir com a máquina por meio de áudio poderá ouvir respostas do ChatGPT na voz que escolher. O chatbot vai gerar um áudio a partir do texto, que até agora era é a única forma de ele se comunicar com o usuário. Poderá, por exemplo, ler em voz alta uma historinha para dormir gerada por inteligência artificial.
O recurso estará disponível para usuários que assinam o serviço ChatGPT Plus por US$ 20 por mês e usuários corporativos. A OpenAI lançou seu aplicativo ChatGPT em maio e já oferece um recurso de voz para texto que permite aos usuários conversar com o chabot. Adicionar um recurso de resposta em áudio pode ampliar a sensação de que as pessoas têm uma conversa mais humanizada com a máquina. A empresa espera que o recurso encoraje o uso de seu app em qualquer lugar, colocando-o em concorrência mais acirrada com assistentes pessoais digitais como Assistant, do Google; Siri, da Apple; ou Alexa, da Amazon.
O usuário pode pedir ao programa que fale sobre a história da Disneylândia enquanto dirige até o parque temático ou pedir uma receita de coquetel enquanto vasculha a cozinha. Em um teste da ferramenta, ela narrou habilmente uma história sobre uma estrela-do-mar e uma rutabaga (vegetal da família das couves). Mas, embora o ChatGPT possa criar letras para músicas, o aplicativo se recusará a cantar.
Interação com imagens
As vozes do ChatGPT soam bastante humanizadas " embora uma escuta atenta revele um tom um pouco robótico. A OpenAI disse que trabalhou com dubladores para construir o modelo de IA de conversão de texto em fala que sustenta o novo recurso.
O ChatGPT também vai responder perguntas sobre imagens. A empresa informou que, nas próximas semanas, os usuários pagos e corporativos poderão acessar um recurso do GPT-4, um dos modelos de IA que alimenta o ChatGPT, para enviar uma imagem e uma pergunta relacionada a ela. Por exemplo, será possível fazer upload de uma foto de um óculos de sol rosa e pedir ao chatbot uma sugestão de roupa para combinar com ele ou enviar uma foto de um problema de matemática e solicitar ajuda para resolvê-lo. O recurso está disponível no aplicativo e no site do ChatGPT.