Antrópico tem lançado Claude Haiku 4.5, um pequeno modelo de IA com latência otimizada. Ele corresponde ao desempenho de codificação do Claude Sonnet 4 com mais que o dobro da velocidade e um terço do custo, e está disponível via API e parceiros de nuvem. O modelo tem como alvo aplicações com orçamentos de latência apertados e altas demandas de rendimento, incluindo assistentes em tempo real, automação de suporte ao cliente e programação em pares. A Anthropic posiciona o Haiku 4.5 como um substituto imediato do Haiku 3.5 e do Sonnet 4 em cargas de trabalho interativas e sensíveis ao custo. Ele supera o Sonnet 4 em tarefas de “uso do computador”, que envolvem manipulação de GUI e navegador para produtos como Claude for Chrome. O modelo também é descrito como melhorando materialmente a capacidade de resposta no Código Claude para projetos multiagentes e prototipagem rápida. Na hierarquia do modelo da Anthropic, o Haiku 4.5 oferece capacidades próximas da fronteira com maior eficiência de custos. A empresa afirmou que seu modelo Sonnet 4.5 continua sendo a oferta de ponta e “o melhor modelo de codificação do mundo”. A Anthropic sugere um padrão de orquestração onde o Sonnet 4.5 lida com planejamento complexo e de várias etapas, e um grupo de trabalhadores do Haiku 4.5 executa as subtarefas em paralelo. Esta abordagem é recomendada para equilibrar o raciocínio de alto nível com a execução econômica e de alta velocidade para projetos grandes ou complexos. Os desenvolvedores podem acessar o modelo imediatamente através da API da Anthropic com o identificador `claude-haiku-4-5`. Também está disponível no Amazon Bedrock e no Google Cloud Vertex AI, embora a Anthropic observe que a cobertura regional e os IDs de modelo nessas plataformas de nuvem podem ser atualizados com o tempo. O preço da API é de US$ 1 por milhão de tokens de entrada e US$ 5 por milhão de tokens de saída. Para fluxos de trabalho que utilizam cache imediato, as taxas estão listadas em US$ 1,25 por milhão de tokens de gravação e US$ 0,10 por milhão de tokens de leitura, oferecendo reduções de custos adicionais para consultas repetidas. https://www.youtube.com/watch?v=ccQSHQ3VGIc A Anthropic publicou resultados de benchmark com detalhes da metodologia, afirmando que os dados mostram paridade de codificação com o Sonnet 4 e desempenho superior em tarefas de uso de computador sob seus andaimes de teste. Os resultados incluem:
- Banco SWE verificado: 73,3% de sucesso em 50 testes, usando um andaime simples com duas ferramentas (bash, edição de arquivos), um orçamento de pensamento de 128K, amostragem padrão e sem cálculo de tempo de teste.
- Banco Terminal: Uma média superior a 11 execuções com o agente Terminus-2, onde seis execuções não tinham orçamento de reflexão e cinco tinham um orçamento de reflexão de 32 mil.
- Verificado pelo OSWorld: Uma média de quatro execuções com um máximo de 100 etapas, um orçamento total de pensamento de 128 mil e uma configuração de 2 mil por etapa.
- AIME / MMMLU: Médias de múltiplas execuções usando amostragem padrão e orçamentos de reflexão de 128 mil.
A empresa aconselha que os usuários repliquem os testes usando sua própria orquestração, pilhas de ferramentas e orçamentos específicos antes de generalizar os resultados de desempenho para seus próprios aplicativos. Claude Haiku 4.5 é lançado sob a licença ASL-2. De acordo com os testes internos da Anthropic, o modelo apresenta uma taxa de desalinhamento medida menor que o Sonnet 4.5 e o Opus 4.1, indicando um perfil de segurança diferente dentro da estrutura de avaliação da empresa.





