Antrópico tem lançado Claude 3.7, o primeiro modelo de IA do mundo capaz de produzir saída padrão ou uma quantidade controlável de “raciocínio” para resolver problemas complexos. Esse modelo híbrido foi projetado para aprimorar a interação do usuário e do desenvolvedor, permitindo um equilíbrio entre respostas instintivas e raciocínio metódico.
Antrópico revela Claude 3.7: o primeiro modelo de IA de raciocínio híbrido

Michael Gerstenhaber, líder do produto em antropia, declarou: “O [user] Tem muito controle sobre o comportamento – quanto tempo ele pensa e pode negociar raciocínio e inteligência com tempo e orçamento. ” Claude 3.7 apresenta um recurso “Scratchpad” que exibe o processo de raciocínio do modelo, inspirando -se no popular modelo chinês de IA Deepseek. Essa funcionalidade ajuda os usuários a compreender a abordagem do modelo para resolver problemas, facilitando ajustes rápidos.
Dianne Penn, líder do produto da pesquisa em antropia, enfatizou a eficácia do scratchpad em conjunto com a capacidade de raciocínio ajustável. Os usuários podem instruir o modelo a alocar mais tempo para a resolução de problemas se as tentativas iniciais não produzirem a quebra desejada.

A estrutura híbrida de Claude 3.7 a distingue dos concorrentes. Enquanto o OpenAI lançou um modelo de raciocínio chamado O1 em setembro de 2024 e, posteriormente, uma versão mais robusta chamada O3, ambos exigem que os usuários alternem entre os modelos para acessar os recursos de raciocínio. O Claude 3.7 da Anthropic permite alternar sem costura entre respostas convencionais e raciocínio prolongado, uma vantagem significativa.
O modelo híbrido está alinhado às estruturas de raciocínio descritas pelo economista vencedor do Nobel-prêmio Daniel Kahneman em seu livro “Thinking, Fast and Slow”, oferecendo processos cognitivos instintivos e deliberados. Modelos padrão, como modelos de idiomas grandes (LLMs), geralmente geram respostas instantâneas, mas podem vacilar em tarefas que exigem raciocínio completo, como cálculos aritméticos.
Para aprimorar os recursos do Claude 3.7, o Antrópico empregou o aprendizado de reforço para treinar o modelo com dados adicionais com foco em aplicativos de negócios, como codificação e consultas legais. Penn observou que “as coisas em que fizemos melhorias são […] assuntos técnicos ou sujeitos que requerem um longo raciocínio. ” O modelo superou o Open O1 em estruturas específicas como o SWE-banch ao enfrentar desafios complexos de codificação.
Claude AI agora pode espelhar seu estilo de escrita perfeitamente
Código Claude
A empresa introduziu o Claude Code, uma nova ferramenta projetada para ajudar nas tarefas de codificação orientadas pela IA, que têm um bom desempenho em cenários complexos. “O modelo já é bom em codificação”, acrescentou Penn. ““[But] O pensamento adicional seria bom para casos que podem exigir um planejamento muito complexo – digamos uma base de código extremamente grande para uma empresa. ”

O Soneto Claude 3,7 está disponível em todos os planos de Claude – livre, profissional, equipe e empresa -, bem como através da API antrópica, da Amazon Bedrock e do vértice AI do Google Cloud. O modelo mantém a mesma estrutura de preços que seus antecessores: US $ 3 por milhão de tokens de entrada e tokens de produção de US $ 15 por milhão, que incluem tokens de pensamento.
A Anthropic desenvolveu Claude 3,7 sonetos com uma filosofia que integra o raciocínio como um componente central do modelo. Ele funciona como um LLM comum atualizado e um modelo de raciocínio, permitindo que os usuários escolham quando desejam respostas diretas ou respostas mais longas e refletivas. No modo de pensamento estendido, o Claude 3.7 refina suas respostas, aprimorando o desempenho em tarefas em matemática, física, seguidores de instruções e codificação.
Usando o soneto Claude 3,7 através da API, os usuários podem controlar seu orçamento de “pensamento” especificando um número máximo de tokens. Essa flexibilidade permite que os usuários priorizem a velocidade versus a qualidade do resultado.
As recentes avaliações de Claude indicam liderança em recursos de codificação em várias plataformas. O Cursor reconheceu Claude como melhor da categoria para tarefas de codificação do mundo real, com avanços no gerenciamento de bases de código complexas. A cognição relatou desempenho superior nas alterações do código de planejamento, enquanto a Vercel observou sua precisão na navegação de fluxos de trabalho complexos de agentes. A Replit empregou efetivamente Claude para o desenvolvimento de aplicativos da Web sofisticados, e os testes realizados pelo Canva revelaram que Claude fornece consistentemente código pronto para produção com melhoria da qualidade do projeto e significativamente menos erros.
O código Claude, atualmente em visualização de pesquisa limitada, funciona como uma ferramenta colaborativa que pode ler, editar código, executar testes e interagir com o GitHub, simplificando o processo de codificação. Os testes iniciais mostraram que o código Claude pode realizar tarefas em uma única sessão que geralmente exige um extenso esforço manual. Os aprimoramentos futuros se concentrarão na confiabilidade da ferramenta, suporte de comando longo e desempenho aprimorado.
A Anthropic enfatizou seu compromisso de desenvolver Claude 3,7 sonetos, com foco em segurança, segurança e confiabilidade. Claude 3.7 fez distinções discerníveis entre solicitações benignas e prejudiciais, alcançando uma redução de 45% em recusas desnecessárias em comparação com seu antecessor. O cartão do sistema que acompanha detalhes de avaliações de segurança que poderiam beneficiar outras iniciativas de pesquisa de IA e abordar riscos emergentes, incluindo ataques rápidos de injeção.
O código de soneto e claude de Claude 3,7 representa avanços significativos em relação aos sistemas de IA que podem efetivamente apoiar as capacidades humanas, integrando o raciocínio profundo e a colaboração autônoma.
Crédito da imagem em destaque: Antrópico