Lançamento do Claude Sonnet 4.6: A nova referência em modelos acessíveis para tarefas computacionais

A Anthropic acaba de apresentar o Claude Sonnet 4.6, um modelo que promete trazer capacidades de nível humano em diversas tarefas computacionais, como navegar em folhas de cálculo, atualizar websites e apresentações, e até mesmo renovar o registo do seu carro. Este novo modelo não apenas iguala, como em muitos casos supera, o desempenho do Opus 4.6 em várias métricas chave, enquanto custa aproximadamente um quinto do preço.

Principais Capacidades

O Claude Sonnet 4.6 destaca-se por suas habilidades excecionais no uso de computadores, alcançando uma precisão de 94% em benchmarks de seguros — a melhor performance testada pela Anthropic para tarefas de uso computacional. Segundo os primeiros utilizadores, o modelo apresenta um desempenho próximo do humano em manipulação de folhas de cálculo complexas e execução de formulários web multi-etapas.

Além disso, o Sonnet 4.6 apresenta melhorias significativas nas seguintes áreas:

  • Codificação
  • Raciocínio de longo prazo
  • Planeamento de agentes
  • Trabalho de conhecimento
  • Design

Estas melhorias são evidentes quando comparadas ao seu predecessor, o Sonnet 4.5, que já era bem avaliado.

Desempenho e Preços

O Sonnet 4.6 iguala ou supera o Opus 4.6 em vários benchmarks, especialmente em tarefas de escritório do mundo real e em correções de código complexas. O mais impressionante é que o modelo mantém o mesmo custo do Sonnet 4.5. Isto representa uma melhoria drástica na razão desempenho/preço, uma vez que agora os utilizadores podem obter capacidades que anteriormente exigiam investimento em modelos da categoria Opus.

ModeloPreço (por milhão de tokens)Desempenho (benchmark)
Sonnet 4.6$3 / $15Igual ou superior ao Opus 4.6
Opus 4.6Significativamente mais altoMaximizou desempenho em tarefas

Características Técnicas

Uma das inovações mais notáveis do Sonnet 4.6 é o seu contexto de 1 milhão de tokens, atualmente em beta, que suporta modos de pensamento adaptativo e estendido.

Outras características incluem:

  • Um novo parâmetro de esforço para os modelos Sonnet, com um nível médio recomendado para a maioria dos casos de uso, equilibrando rapidez, custo e performance.
  • O uso de ferramentas de pesquisa e recuperação que agora escrevem e executam automaticamente código para filtrar resultados, aumentando a qualidade das respostas e reduzindo o uso de tokens em 32%.

Casos de Uso Recomendados

A Anthropic recomenda o Sonnet 4.6 para os seguintes cenários:

  • Agentes de atendimento ao cliente
  • Fluxos de trabalho de codificação em produção
  • Geração de conteúdo em larga escala
  • Tarefas de pesquisa em tempo real

Conclusão

O Claude Sonnet 4.6 emerge como uma solução robusta e acessível para profissionais que necessitam de um assistente computacional avançado. Com suas capacidades melhoradas e um preço competitivo, este modelo promete não apenas aumentar a eficiência e eficácia nas tarefas cotidianas, mas também democratizar o acesso a tecnologia de ponta em inteligência artificial.

Para mais informações, pode consultar o anúncio oficial no site da Anthropic ou assistir ao vídeo de apresentação no YouTube.

Sources