Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
Subscribe
No Result
View All Result
Dataconomy PT
No Result
View All Result

Microsoft patenteia gerador de áudio para imagem em tempo real

byKerem Gülen
15 Outubro 2024
in Artificial Intelligence
Home Artificial Intelligence
Share on FacebookShare on Twitter

Você está em mais uma reunião interminável do Zoom ou do Teams. Vozes zumbindo, slides que mal prendem sua atenção e seus olhos vidrados enquanto alguém recita estatísticas trimestrais. Agora, imagine se, em vez de entediá-lo com planilhas, a IA da reunião começasse a criar recursos visuais na hora – imagens reais que dão vida à conversa, geradas em tempo real enquanto as pessoas falam. Parece futurista, mas é exatamente isso que a Microsoft está inventando com uma nova patente.

Microsoft patenteia voz para imagem

A ideia mais recente da Microsoft (e sim, ainda é apenas uma ideia por enquanto) é fazer transmissões de áudio ao vivo – palestras, reuniões, qualquer conversa verbal – e transformá-las em imagens, dinamicamente. O Escritório de Marcas e Patentes dos EUA acaba de abandonou os detalhes em 10 de outubro de 2024depois que a Microsoft o apresentou em abril. O sistema basicamente ouviria suas chamadas, geraria uma transcrição de texto, alimentaria isso por meio de um modelo de IA e exibiria imagens que correspondem ao que está sendo dito.

Chega de “deixe-me puxar um slide para isso”.

Microsoft patenteia gerador de áudio para imagem em tempo real
Uma captura de tela da patente (Crédito da imagem)

O fim das reuniões chatas? Talvez não, mas estará perto

A maioria das reuniões virtuais são bastante enfadonhas. E não vamos fingir que não passamos uma boa parte do tempo nos afastando.

Mas e se essas reuniões de repente começarem a exibir recursos visuais tão rápido quanto a conversa avança? Alguém menciona novos conceitos de produtos e, em segundos, imagens geradas por IA começam a aparecer na tela. Os números secos que as pessoas estão citando de repente se transformam em gráficos dinâmicos sem que ninguém clique em um botão. O que é isso? Um gargalo na cadeia de abastecimento no Sudeste Asiático? Bam! Um mapa interativo aparece, destacando as áreas de preocupação.

Agora, antes que você fique muito animado, sejamos claros: isso ainda está em fase de patente. E se você já existe há tempo suficiente, sabe que muitas patentes não levam a lugar nenhum. Registrar uma patente é como plantar uma semente: ela pode se transformar em algo incrível ou pode ser apenas uma ideia que nunca será desenvolvida.

Dito isto, se a Microsoft decidir, o lar óbvio para esta tecnologia é Equipes da Microsoft. Eles têm reforçado as equipes com todos os tipos de ferramentas baseadas em IA, desde o Copilot até recursos aprimorados de videoconferência, então este seria um passo a ser dado.

Já vimos ferramentas de conversão de texto em imagem como DALL-E e Meio da jornada impressionar as pessoas. Agora, poderíamos ver esse conceito aplicado à fala ao vivo. É como dar voz à criatividade da IA ​​em tempo real.

Mas por enquanto, esperamos.


Crédito da imagem em destaque: Kerem Gülen/meio da jornada

Tags: ApresentouIAinteligência artificialMicrosoft

Related Posts

AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção

AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção

15 Maio 2025
Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade

Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade

15 Maio 2025
A IA do YouTube agora sabe quando você está prestes a comprar

A IA do YouTube agora sabe quando você está prestes a comprar

15 Maio 2025
O CEO da SoundCloud admite que os termos da IA ​​não estavam claros o suficiente, emitem uma nova promessa

O CEO da SoundCloud admite que os termos da IA ​​não estavam claros o suficiente, emitem uma nova promessa

15 Maio 2025
Pronto para um chatgpt que realmente o conhece?

Pronto para um chatgpt que realmente o conhece?

14 Maio 2025
Lightricks revela o modelo de vídeo LTX 13B para geração de vídeo HQ AI

Lightricks revela o modelo de vídeo LTX 13B para geração de vídeo HQ AI

14 Maio 2025

Recent Posts

  • O impacto dos tecidos inteligentes no desempenho das roupas táticas
  • Databricks Aposta grande no servidor sem servidor com sua aquisição de neon de US $ 1 bilhão
  • AlphaEvolve: Como a nova IA do Google visa a verdade com a autocorreção
  • Tiktok está implementando textos alt gerados pela IA para melhor acessibilidade
  • Trump força a Apple a repensar sua estratégia de iPhone da Índia

Recent Comments

Nenhum comentário para mostrar.
Dataconomy PT

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.