Sábado, 10 de Mayo de 2025

Ia do google cria podcasts em português, de lady gaga ao inss

BrasilO Globo, Brasil 1 de mayo de 2025

"Depois que a música para e as luzes se apagam, o que realmente fica? Qual o legado de um evento ...

"Depois que a música para e as luzes se apagam, o que realmente fica? Qual o legado de um evento assim?", questiona a voz de inteligência artificial ao encerrar um podcast de sete minutos sobre os preparativos para o show de Lady Gaga na Praia de Copacabana, no próximo sábado.
O episódio não foi roteirizado, nem editado, mas criado pelo NotebookLM, ferramenta de inteligência artificial do Google. Voltado para análise de documentos e arquivos extensos, o sistema passou nesta semana a "falar" português. O conteúdo é apresentado por duas vozes sintéticas, que simulam uma conversa e apontam os principais tópicos extraídos do material original.
Em poucos minutos, um relatório técnico com algumas dezenas de páginas ou um conjunto de arquivos pode ser transformado em áudio pelo programa. As vozes de IA destrincham os principais pontos dos documentos, com uma interação que inclui comentários breves, perguntas de uma voz para a outra e, geralmente, uma "reflexão" final sobre o tema.
Ao criar o podcast, o usuário pode definir o foco da conversa, o estilo e o público-alvo. O resultado, no entanto, tende a seguir um formato semelhante: uma conversa didática, como se fosse um podcast educativo.
Disponível em inglês desde o ano passado, o recurso do NotebookLM passou na última terça-feira a gerar os áudios em português e outros 75 idiomas, entre eles espanhol, russo, japonês, chinês e francês. A ferramenta é gratuita, mas impõe limites à quantidade de episódios que podem ser gerados pelo usuário que não assina os serviços de IA do Google.
O GLOBO testou a ferramenta com a geração de três áudios: dois baseados em documentos públicos " um relatório do Banco Central e outro sobre o INSS " e um a partir de 13 reportagens sobre o show de Lady Gaga, publicadas no site do jornal.
entonação e pausas
Os resultados impressionam pela fluidez da conversa e a forma como a IA organiza os principais pontos do material, em formato de "mesa redonda". Os áudios, no entanto, mostram uma simplificação excessiva em conteúdos complexos.
Lançado em 2023 sob o nome de "Project Tailwind", o NotebookLM deixou de ser uma ferramenta experimental do Google no ano passado, quando a empresa começou a posicioná-lo como um dos seus principais produtos de IA. Diferentemente do ChatGPT, Gemini ou outro chatbot de inteligência artificial, ele tem como foco o processamento de arquivos enviados pelo próprio usuário.
Chamado de "Audio Overviews", o recurso de podcast foi lançado em setembro, inicialmente em inglês. Em diferentes idiomas, as vozes sintéticas soam intencionalmente naturais, o que inclui mudanças de entonação e pausas que "imitam" a fala humana. Além dessa ferramenta, o NotebookLM tem recursos como a interação com documentos por meio de perguntas em texto e a criação de resumos, de guias de estudos e de linhas do tempo.
Na terça-feira, depois de uma atualização, o NotebookLM passou também a gerar "mapas" de conteúdo e integrar fontes externas, como Wikipedia e ArXiv, que podem ser consultadas a partir da plataforma. Também passou a ler integralmente arquivos PDF e Word, incluindo imagens e gráficos.
Para gerar um episódio, é preciso entrar na ferramenta e fazer o upload do arquivo ou conjunto de arquivos. Do lado direito, há duas opções: de "gerar" ou de "customizar". A primeira gerará o áudio diretamente, após alguns minutos. Ao escolher a segunda opção, é possível escrever instruções para a ferramenta, como a de trazer um enfoque para determinado trecho ou assunto do documento.
‘Tema delicado’
Para criar um "podcast" em português, é preciso ajustar o idioma nas configurações e optar pelo português. Primeiro, O GLOBO criou um áudio com base no relatório de 37 páginas da Controladoria Geral da União (CGU), de setembro, em que o órgão avaliava descontos em folha de pagamento do INSS e indicava irregularidades sistemáticas nos valores cobrados.
"Hoje a gente mergulha em um tema delicado", afirma a voz de IA ao introduzir o tema. Em geral, os podcasts seguem formato semelhante: uma abertura com resumo do conteúdo e tema a ser tratado; desenvolvimento com perguntas e respostas; e uma conclusão com alguma reflexão. O áudio detalha descobertas da CGU, indícios de irregularidades e respostas do INSS.
No caso do podcast da Lady Gaga, o "podcast" foi gerado a partir de 13 arquivos " reportagens publicadas no GLOBO sobre o show. O áudio, com um tom mais leve, traz detalhes do evento, em tópicos, que vão das mudanças no trânsito em Copacabana até o esquema de hospedagem da artista na cidade. Segundo o Google, não há um limite de tempo para o áudio. Nos três testes feitos pelo GLOBO, no entanto, o resultado ficou em cerca de 8 minutos.
No futuro, até sotaque
No caso de um podcast sobre o Relatório de Política Monetária do Banco Central, de março, a apresentação diz que será "um mergulho" no documento. No áudio, as vozes de IA destacam uma deterioração das expectativas da inflação e fazem um panorama da leitura do Banco Central (BC) do cenário externo e interno. O resultado, no entanto, mostra alguma limitação para o programa sintetizar informações mais complexas.
Ao explicar o que é o "Audio Overviews", o Google alerta para o fato de que a ferramenta não oferece "visão abrangente ou objetiva sobre um tema, mas apenas reflete o conteúdo das suas fontes". E ressalta que o resultado é gerado por IA e, por tanto, pode conter "imprecisões e falhas".
Em entrevista coletiva, Michael Chen e Usama Bin Shafqat, engenheiros de software do Google Labs, explicaram que a empresa trabalha para que a ferramenta tenha mais níveis de personalização, como seleção de vozes, sotaques e edição de roteiro. O Google diz ainda que, em breve, lançará uma versão em aplicativo do programa.
La Nación Argentina O Globo Brasil El Mercurio Chile
El Tiempo Colombia La Nación Costa Rica La Prensa Gráfica El Salvador
El Universal México El Comercio Perú El Nuevo Dia Puerto Rico
Listin Diario República
Dominicana
El País Uruguay El Nacional Venezuela