Em uma nova atualização de sua coleção Copilot AI, a Microsoft está lançamento uma série de melhorias esperadas para facilitar a interação com os dispositivos. Entre eles, Copilot Vision, Think Deeper e Copilot Voice foram projetados para oferecer uma experiência focada no usuário, oportuna e ciente do contexto no Windows, iOS, Android e Web.
Todos esses recursos pertencem, de uma forma ou de outra, à abordagem mais ampla que a Microsoft está adotando para ter o Copilot no meio das atividades diárias das pessoas, alocando soluções de IA mescladas com a proteção da privacidade dos usuários.
Visão do Copiloto: Uma nova visão e abordagem para o uso da World Wide Web
Entre as novidades, está o Copilot Vision, que permite ao usuário fazer todo tipo de pergunta sobre o conteúdo de sua tela – seja texto ou imagens de uma página web. Por exemplo, é possível solicitar uma determinada receita retratada em uma foto ou conselhos sobre móveis durante a utilização do site. O Copilot Vision então opera de maneira que examina o conteúdo que os usuários estão consumindo e responde ao usuário em tempo real, com base no conteúdo.
Acessível via Microsoft Edge digitando “@copilot” na barra de endereço, o Copilot Vision está disponível como parte do Copilot Labsum programa opcional exclusivo que oferece recursos experimentais para um grupo seleto de usuários. Embora esse recurso não seja totalmente inovador – a plataforma Android do Google oferece recursos semelhantes – a Microsoft afirma que o Copilot Vision vai um passo além, garantindo que nenhum dado seja armazenado ou usado para treinar modelos de IA.
Os complicados copilotos da Microsoft explicados em detalhes
A Microsoft tem feito questão de enfatizar o seu compromisso com a privacidade com esta ferramenta. Em uma postagem recente no blog, a empresa destacou que o Copilot Vision exclui todos os dados processados imediatamente após uma conversa, sem armazenar áudio, imagens ou texto. Isto é provavelmente uma resposta às preocupações crescentes sobre o uso indevido de dados em sistemas de IA, um ponto que a Microsoft teve o cuidado de abordar após o escrutínio legal sobre incidentes anteriores envolvendo os seus produtos de IA.
No entanto, o Copilot Vision apresenta certas limitações. Atualmente, a ferramenta não pode analisar conteúdo de sites confidenciais ou com acesso pago, restringindo sua funcionalidade a uma lista pré-aprovada de propriedades da web. Esta restrição parece ter sido concebida para evitar desafios legais semelhantes aos que a Microsoft enfrenta com o The New York Times, que acusou a empresa de permitir que as suas ferramentas de IA contornassem os acessos pagos e acedessem a conteúdos premium.
Pense mais profundamente: Enfrentando problemas complexos com raciocínio de IA
Outra adição significativa ao pacote Copilot é o Think Deeper, um recurso que aproveita modelos de raciocínio avançados para ajudar os usuários a navegar em tarefas complexas. Seja resolvendo problemas matemáticos complexos ou comparando várias opções de reforma residencial, o Think Deeper foi projetado para analisar e analisar cenários complicados.
A Microsoft descreveu o Think Deeper como uma ferramenta que fornece orientação passo a passo, tornando-o útil tanto para desafios diários quanto para problemas mais especializados. A empresa observou que o recurso é alimentado por “modelos de raciocínio” que levam mais tempo para responder, garantindo respostas mais completas e precisas. Embora a Microsoft tenha permanecido calada sobre os modelos específicos usados, é provavelmente uma versão personalizada do modelo o1 da OpenAI, que a Microsoft aperfeiçoou para esse fim.
Atualmente, o Think Deeper está disponível apenas para um grupo seleto de usuários do Copilot Labs em países como EUA, Reino Unido, Canadá, Austrália e Nova Zelândia, com planos para uma disponibilidade mais ampla no futuro.
Voz do copiloto: IA conversacional sob seu comando
O último na linha de recursos de IA da Microsoft é o Copilot Voice, a capacidade de abordar o Copilot e emitir comandos. Lançado primeiro nos EUA, Reino Unido, Canadá, Austrália e Nova Zelândia, o Copilot Voice amplia a filosofia do Copilot com respostas verbalizadas.
Assim como a voz do OpenAI no ChatGPT, o Copilot Voice é capaz de detectar o tom de voz e responder de acordo. Algumas funcionalidades do aplicativo o tornam ainda mais envolvente: por exemplo, os usuários podem pausar o Copilot durante a conversa ou interromper suas respostas no meio da frase. A característica do aplicativo são as quatro vozes sintéticas que são muito naturais e realistas ao toque.
No entanto, há limites para o quanto os usuários podem interagir com o Copilot Voice. A Microsoft implementou um limite de uso baseado no tempo, com os assinantes do Copilot Pro ganhando acesso a minutos adicionais dependendo da demanda geral.
Personalização: Adaptando o Copilot às suas preferências
Além das principais atualizações de recursos, a Microsoft também está introduzindo opções de personalização no Copilot. Essas configurações permitem que a IA personalize suas sugestões com base nas interações anteriores do usuário, extraindo insights da atividade em outros aplicativos e serviços da Microsoft. Segundo a Microsoft, isso ajudará o Copilot a oferecer recomendações mais relevantes e acesso mais rápido a recursos úteis.
No entanto, a implementação da personalização está atrasada em certas regiões. Por enquanto, esse recurso não estará mais disponível na UE ou no Reino Unido, à medida que a Microsoft continua a avaliar opções sobre como se adaptar às rígidas leis de proteção de dados nessas regiões. Segue a estratégia que empresas líderes de TI como Apple e Meta, bem como outras empresas, executaram ao implementar soluções de IA na União Europeia.
A Microsoft expressou que a empresa espera fornecer personalização incorporada aos usuários nessas áreas e, ao mesmo tempo, satisfazer as disposições legais, como a Lei de Serviços Digitais, que regula o uso de IA e a proteção de dados na UE. No passado, a empresa recebeu certas questões regulatórias, particularmente no sortimento da recente advertência da AEA à Microsoft de que poderia ser penalizada por não fornecer detalhes suficientes sobre seus produtos generativos de IA.Privacidade e responsabilidade no centro
Ao longo do lançamento desses novos recursos, a Microsoft manteve que a privacidade e o feedback do usuário estão no centro do seu processo de desenvolvimento. A empresa enfatizou que nenhum dos dados processados pelo Copilot Vision, Think Deeper ou Copilot Voice é usado para treinamento de IA ou armazenado além da sessão imediata.
Crédito da imagem em destaque: Microsoft