OpenAI tem lançado recursos de vídeo em tempo real no ChatGPT, aprimorando seu modo de voz avançado com compreensão visual. Esse recurso, que começou a ser implementado em 12 de dezembro, permite que os usuários interajam com a IA por meio de sua câmera para receber assistência contextual. A integração significa um avanço notável nas habilidades de conversação da IA, especialmente para aqueles que assinam ChatGPT Plus, Team ou Pro.
OpenAI aprimora ChatGPT com recursos de vídeo em tempo real
O Modo de Voz Avançado agora inclui análise de vídeo em tempo real e funcionalidades de compartilhamento de tela. Os usuários podem apontar seus telefones para objetos para obter respostas imediatas ou compartilhar suas telas para obter explicações detalhadas sobre configurações ou problemas. Esta adição baseia-se em capacidades anteriores, permitindo uma experiência de usuário mais interativa. A OpenAI demonstrou o recurso durante uma transmissão ao vivo, mostrando sua capacidade de participar de conversas casuais e fornecer insights com base em informações visuais.
Quanto à disponibilidade, o lançamento começou no dia 12 de dezembro e se estenderá pela semana seguinte. No entanto, os usuários europeus, juntamente com os assinantes do ChatGPT Enterprise e Edu, podem enfrentar atrasos; esses usuários receberão acesso no início do próximo ano. Esta expansão indica o foco da OpenAI em melhorar a interação do usuário com a IA, alinhando-se ao seu objetivo abrangente de fornecer recursos avançados dentro do seu conjunto de produtos.
Integrações com iOS 18.2
Num desenvolvimento paralelo, a Apple recentemente introduzido iOS 18.2, que incorpora vários recursos ChatGPT em Siri, Ferramentas de Escrita e Inteligência Visual. A integração com o Siri permite que o assistente de voz reconheça as consultas que estão fora do seu alcance e as redirecione para o ChatGPT. Os usuários serão notificados e deverão aprovar esta ação antes de prosseguir.
Para usuários com dispositivos iPhone 16, a Inteligência Visual permite que eles apontem suas câmeras para objetos ou situações para recuperar informações via ChatGPT ou Google. Além disso, o recurso Ferramentas de Escrita agora inclui uma nova ferramenta “Escrever”, permitindo a criação de conteúdo do zero usando os recursos do ChatGPT. Esses recursos, enfatizando a utilidade e o controle do usuário, foram estruturados para se alinharem aos limites de uso do ChatGPT, garantindo uma experiência organizada.
Atualizações dos ’12 dias de OpenAI’
A OpenAI organizou uma campanha chamada “12 Dias de OpenAI”, com início em 5 de dezembro, que apresenta sessões diárias de transmissão ao vivo revelando novos recursos ou produtos. O CEO Sam Altman descreveu a campanha como uma mistura de atualizações significativas e pequenas melhorias. Entre os anúncios notáveis estava a introdução de uma nova voz do Papai Noel para o Modo de Voz Avançado, que os usuários podem ativar por meio de um ícone de floco de neve.
Além disso, a campanha revelado Sora, o novo modelo de vídeo da OpenAI, agora disponível para ChatGPT Pro e usuários Plus. Este modelo pode gerar conteúdo de texto para vídeo e vídeo para vídeo, ampliando significativamente os caminhos criativos disponíveis para os usuários. Outras atualizações notáveis incluíram o anúncio do Canvas para todos os usuários da web, anteriormente um recurso beta, permitindo uma experiência de gerenciamento de projetos mais integrada.
Olhando para o futuro, a OpenAI tem planos de expandir as suas ofertas, incluindo uma versão completa do seu modelo de linguagem o1, destinada a melhorar ainda mais as capacidades de raciocínio. A empresa pretende tornar o ajuste fino de reforço mais amplamente disponível, com aplicações atualmente procuradas em institutos de pesquisa e universidades para ajustar modelos de IA para tarefas específicas.
Crédito da imagem em destaque: OpenAI