A Meta Platforms Inc está definida para aprimorar suas capacidades de voz com a próxima versão de sua inteligência artificial, Llama 4, conforme relatado pelo Times financeiros. Esse desenvolvimento se alinha à estratégia da Meta de se concentrar em agentes de IA de conversação, em vez de interações tradicionais baseadas em texto.
Llama 4 de Meta: transformando a IA com recursos de voz
A introdução de recursos de voz aprimorados no Llama 4 é esperada nas próximas semanas, com o objetivo de facilitar um diálogo natural bidirecional, onde os usuários podem interromper a IA, em vez de aderir estritamente a um formato de pergunta e resposta. Essa mudança demonstra o compromisso da Meta em transformar a interação do usuário com a tecnologia de IA.
O CEO Mark Zuckerberg delineou objetivos ambiciosos para a empresa, designando 2025 como um ano crucial para sua gama de produtos de IA, que estão em desenvolvimento em meio a uma concorrência aumentada de empresas como OpenAi, Microsoft e Google. Para sustentar essas iniciativas, a Meta planeja investir até US $ 65 bilhões em 2025, concentrando principalmente esse gasto em infraestrutura de data center.
Meta Ai aborda 600 milhões de usuários mensais com llama 3.3
Juntamente com os avanços no LLAMA 4, a Meta está explorando a possibilidade de assinaturas premium para seu assistente de IA, a Meta AI, que permitiria executar tarefas como reserva de reservas e criação de vídeo. A empresa também está pensando em implementar publicidade paga ou postagens patrocinadas nos resultados de pesquisa da Meta AI.
O diretor de produtos Chris Cox indicou que o LLAMA 4 operaria como um “modelo OMNI”, permitindo que a fala funcione nativamente dentro do sistema, eliminando assim a necessidade de traduzir a voz em texto e volta. Ele enfatizou o significado dessa capacidade na conferência de Morgan Stanley Technology, Media & Telecom, afirmando: “Acho que ainda estamos envolvendo a cabeça sobre o quão poderoso isso é”.
A Meta tem discutido ativamente os corrimãos necessários para a produção mais recente do modelo de llama, ao mesmo tempo em que avalia a diminuição dessas restrições. Essas discussões surgem em meio a pressões competitivas, pois rivais como Openai e Xai de Elon Musk também avançam na implantação de recursos de voz, incluindo as ofertas de personalidade distintas do Openai e o Grok 3, que apresenta um “modo desequilibrado” que responde de maneiras deliberadamente objeções.
No ano passado, Meta abordou as críticas sobre seu Modelo LLAMA 2que relutou em responder a perguntas benignas, revelando uma versão mais flexível no lhama 3. A integração dos comandos de voz também é uma característica fundamental dos óculos inteligentes de Ray-Ban da Meta, que ganharam popularidade entre os consumidores, indicando ainda mais a estratégia da empresa para posicionar fones de ouvido leves como os principais dispositivos de computação do futuro.
Crédito da imagem em destaque: Dima Solomin/Unsplash