Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

Google Gemini agora transcreve arquivos de áudio

byAytun Çelebi
11 Setembro 2025
in Inteligência Artificial
Home Notícias Inteligência Artificial
Share on FacebookShare on Twitter
Google Preferred Source

O Gemini AI Assistant do Google agora permite que os uploads de arquivos de áudio, permitindo que os usuários transcrevem, resumissem e extraem informações importantes das gravações. Esse novo recurso converte até 10 minutos de memorandos de voz, reuniões, palestras e entrevistas em documentos pesquisáveis ​​diretamente no ambiente da IA. Os uploads de arquivos de áudio são suportados nos aplicativos da Web e móveis. Os usuários podem acessar o recurso através da interface padrão-upload. Isso difere do processamento de comando de voz em tempo real do Gemini Live, à medida que a nova função processa áudio pré-gravado para extração e análise de dados. Josh Woodward, vice -presidente de gêmeos do Google, afirmou que o upload de arquivos de áudio era o recurso mais solicitado dos usuários de Gemini. Essa demanda destaca a necessidade de processamento de áudio simplificado dentro do assistente de IA.

Precisão da transcrição e integração de recursos

Durante os testes, a Gemini transcreveu com precisão vários tipos de áudio, incluindo esboços de álbuns de comédia e conversas telefônicas, com apenas pequenos erros no reconhecimento de nomes. O sistema também identificou efetivamente os elementos-chave e gerou listas de tarefas a partir do conteúdo de áudio. A adição de processamento de áudio alinha com integrações recentes de Gemini, como implementações em vários aplicativos, teste de uma interface visual baseada em cartão e opções de personalização expandidas. Essas atualizações aprimoram coletivamente a funcionalidade e a experiência do usuário de Gemini.

Comparação com outros assistentes de IA

Embora os recursos de áudio da Gemini não sejam únicos, eles são comparáveis ​​a recursos de concorrentes como o ChatGPT, que usa seu modelo de transcrição de sussurros. O Claude da Anthropic também suporta processamento de áudio em determinadas ferramentas de desenvolvedor, e a perplexidade pode extrair dados dos vídeos do YouTube. Gêmeos pretende focar nos casos de uso diário para uma ampla base de usuários.

Processamento avançado de dados de áudio

Além da transcrição simples, a Gemini permite que os usuários solicitem simplificação de idiomas, extraem comentários específicos do alto-falante, geram perguntas do conteúdo de áudio ou criem guias de estudo a partir de discussões gravadas. Essas opções fornecem ferramentas para manipular e redirecionar informações de áudio com eficiência.

Limitações do recurso de áudio

O limite atual de 10 minutos nos uploads de arquivo de áudio restringe sua aplicabilidade para gravações mais longas. Os usuários de nível livre também enfrentam limites de uso diário no processamento de áudio. Essas limitações podem afetar os usuários com extensas necessidades de processamento de áudio. O Google não lançou preços específicos para processamento de áudio de alto volume. No entanto, o processamento de áudio é integrado à cota regular de Gêmeos. Isso sugere que os usuários devem gerenciar seu uso para evitar recursos alocados excedentes.


Crédito da imagem em destaque

Tags: Google Gemini

Related Posts

Amazon adiciona visualizações de produtos geradas por IA aos resultados de pesquisa

Amazon adiciona visualizações de produtos geradas por IA aos resultados de pesquisa

4 Junho 2026
O Google lança o Ask Gemini in Drive para usuários qualificados do Workspace

O Google lança o Ask Gemini in Drive para usuários qualificados do Workspace

4 Junho 2026
Meta lança agentes de negócios de IA no WhatsApp, Instagram e Messenger

Meta lança agentes de negócios de IA no WhatsApp, Instagram e Messenger

4 Junho 2026
Anthropic convida mais 150 organizações para o Projeto Glasswing

Anthropic convida mais 150 organizações para o Projeto Glasswing

3 Junho 2026
Microsoft revela Projeto Solara para um futuro com agentes em primeiro lugar

Microsoft revela Projeto Solara para um futuro com agentes em primeiro lugar

3 Junho 2026
O Google permitirá que sites optem por não receber resultados de pesquisa de IA

O Google permitirá que sites optem por não receber resultados de pesquisa de IA

3 Junho 2026

Recent Posts

  • Amazon adiciona visualizações de produtos geradas por IA aos resultados de pesquisa
  • Suno levanta US$ 400 milhões com avaliação de US$ 5,4 bilhões, apesar dos crescentes processos judiciais de direitos autorais
  • Lovable e Google expandem IA plurianual e colaboração na nuvem
  • Pesquisadores criam worm de IA que adapta ataques sem intervenção humana
  • Google Wallet adicionará IDs digitais de países selecionados da UE neste verão

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.