A Anthropic anunciou o lançamento de dois novos modelos de IA: um Claude 3.5 Sonnet atualizado e um novo Claude 3.5 Haiku. O Claude 3.5 Sonnet atualizado oferece melhorias completas, com ganhos significativos em capacidades de codificação. O novo Claude 3.5 Haiku traz recursos avançados de IA a um preço acessível, igualando o desempenho do modelo carro-chefe anterior da Anthropic, Claude 3 Opus, enquanto mantém velocidade e custo semelhantes aos de seu antecessor.
Soneto de Cláudio 3.5
O Claude 3.5 Sonnet atualizado baseia-se no sucesso do seu antecessor com desempenho aprimorado em diversas tarefas, especialmente na codificação. A Anthropic enfatizou que Claude 3.5 Sonnet lidera em tarefas de engenharia de software, mostrando melhorias marcantes em benchmarks como Banco SWE verificadoonde melhorou de 33,4% para 49,0%, superando outros modelos do mercado.
O modelo também teve um bom desempenho no uso de ferramentas ativas, melhorando as pontuações no Banco TAU de 62,6% para 69,2% no domínio do varejo e de 36,0% para 46,0% no domínio das companhias aéreas. De acordo com os primeiros testadores, como GitLab e Cognition, essas atualizações representam um salto substancial para a codificação e automação alimentadas por IA, com melhores capacidades de raciocínio e latência adicional mínima.
Claude 3.5 Haiku
O Claude 3.5 Haiku foi projetado para oferecer desempenho de última geração e, ao mesmo tempo, manter os custos baixos. O modelo obteve altas pontuações em benchmarks como SWE-bench Verified, alcançando 40,6%, o que supera muitos agentes que usam outros modelos de ponta, incluindo o Claude 3.5 Sonnet original e o GPT-4o. O modelo visa atender aplicações que necessitam de IA rápida e confiável, como produtos voltados para o usuário e tarefas que exigem experiências personalizadas.
A Anthropic lançará o Claude 3.5 Haiku ainda este mês, inicialmente disponível como um modelo somente texto com planos para suporte de entrada de imagens no futuro. Ele estará disponível por meio da API da Anthropic, Amazon Bedrock e Vertex AI do Google Cloud.
Claude AI da Anthropic agora está no seu iPad
O uso do computador está disponível como uma versão beta pública experimental
A Antrópico também introduzido um novo recurso experimental chamado “uso do computador”, disponível em versão beta pública. Os desenvolvedores podem direcionar o Claude 3.5 Sonnet para usar computadores como um ser humano – olhando telas, movendo cursores e digitando. Esse recurso ainda é experimental, com algumas limitações, mas desenvolvedores como Replit e The Browser Company já começaram a explorar como ele poderia automatizar processos complexos que envolvem muitas etapas.
Este recurso tem como objetivo ensinar habilidades gerais de informática à IA, tornando-a mais versátil na conclusão de tarefas que antes exigiam ferramentas personalizadas. Os desenvolvedores podem acessar este beta por meio da API da Anthropic e de outras plataformas de nuvem importantes. Embora os primeiros resultados sejam promissores, a Anthropic reconhece que a tecnologia ainda está em desenvolvimento, com desafios na execução de algumas tarefas comuns do computador, como rolar e arrastar.
Empresas como Asana, Canva, Cognition e DoorDash estão experimentando os novos recursos, explorando o potencial da IA para automatizar processos que tradicionalmente exigiam a participação humana. Os primeiros testes realizados pelo US AI Safety Institute e pelo UK Safety Institute descobriram que o Claude 3.5 Sonnet atualizado atende aos padrões de segurança da Antrópico e é adequado para uso público.
A Anthropic também está abordando riscos potenciais associados à capacidade da IA de interagir com computadores. Para garantir uma implantação responsável, a empresa implementou novas medidas de segurança para identificar o uso indevido, incluindo classificadores para detectar ações potencialmente prejudiciais. A Anthropic está incentivando os desenvolvedores a usar o recurso beta para tarefas de baixo risco enquanto a tecnologia amadurece.
O lançamento do Claude 3.5 Sonnet e do Claude 3.5 Haiku atualizados pela Anthropic destaca o esforço da empresa para expandir os recursos de IA, mantendo padrões de segurança. A adição de capacidades experimentais de uso de computadores representa um novo avanço no potencial da IA para realizar tarefas de uso geral, dando aos desenvolvedores novas possibilidades de exploração.
Créditos da imagem: Antrópico