Lançamento do Claude Sonnet 4.6: A nova referência em modelos acessíveis para tarefas computacionais

A Anthropic acaba de apresentar o Claude Sonnet 4.6, um modelo que promete trazer capacidades de nível humano em diversas tarefas computacionais, como navegar em folhas de cálculo, atualizar websites e apresentações, e até mesmo renovar o registo do seu carro. Este novo modelo não apenas iguala, como em muitos casos supera, o desempenho do Opus 4.6 em várias métricas chave, enquanto custa aproximadamente um quinto do preço.

Principais Capacidades

O Claude Sonnet 4.6 destaca-se por suas habilidades excecionais no uso de computadores, alcançando uma precisão de 94% em benchmarks de seguros — a melhor performance testada pela Anthropic para tarefas de uso computacional. Segundo os primeiros utilizadores, o modelo apresenta um desempenho próximo do humano em manipulação de folhas de cálculo complexas e execução de formulários web multi-etapas.

Além disso, o Sonnet 4.6 apresenta melhorias significativas nas seguintes áreas:

Codificação
Raciocínio de longo prazo
Planeamento de agentes
Trabalho de conhecimento
Design

Estas melhorias são evidentes quando comparadas ao seu predecessor, o Sonnet 4.5, que já era bem avaliado.

Desempenho e Preços

O Sonnet 4.6 iguala ou supera o Opus 4.6 em vários benchmarks, especialmente em tarefas de escritório do mundo real e em correções de código complexas. O mais impressionante é que o modelo mantém o mesmo custo do Sonnet 4.5. Isto representa uma melhoria drástica na razão desempenho/preço, uma vez que agora os utilizadores podem obter capacidades que anteriormente exigiam investimento em modelos da categoria Opus.

Modelo	Preço (por milhão de tokens)	Desempenho (benchmark)
Sonnet 4.6	$3 / $15	Igual ou superior ao Opus 4.6
Opus 4.6	Significativamente mais alto	Maximizou desempenho em tarefas

Características Técnicas

Uma das inovações mais notáveis do Sonnet 4.6 é o seu contexto de 1 milhão de tokens, atualmente em beta, que suporta modos de pensamento adaptativo e estendido.

Outras características incluem:

Um novo parâmetro de esforço para os modelos Sonnet, com um nível médio recomendado para a maioria dos casos de uso, equilibrando rapidez, custo e performance.
O uso de ferramentas de pesquisa e recuperação que agora escrevem e executam automaticamente código para filtrar resultados, aumentando a qualidade das respostas e reduzindo o uso de tokens em 32%.

Casos de Uso Recomendados

A Anthropic recomenda o Sonnet 4.6 para os seguintes cenários:

Agentes de atendimento ao cliente
Fluxos de trabalho de codificação em produção
Geração de conteúdo em larga escala
Tarefas de pesquisa em tempo real

Conclusão

O Claude Sonnet 4.6 emerge como uma solução robusta e acessível para profissionais que necessitam de um assistente computacional avançado. Com suas capacidades melhoradas e um preço competitivo, este modelo promete não apenas aumentar a eficiência e eficácia nas tarefas cotidianas, mas também democratizar o acesso a tecnologia de ponta em inteligência artificial.

Para mais informações, pode consultar o anúncio oficial no site da Anthropic ou assistir ao vídeo de apresentação no YouTube.

Sources

Share this post

Like this post? Share it with your friends!