Anthropic 今天推出了 Claude Sonnet 5。一句話總結它的定位:更會「做事」——相較前一代 Sonnet 4.6,最大的提升就在程式編寫與 Agent 代理任務上。
它是 Sonnet 4.6 的直接升級版,同樣的價格、同樣的工具與平台功能,但更聰明。對於本來就在用 AI 寫程式、串工具、跑自動化流程的人來說,這是很實際的一步。
重點速覽
- 主打程式 + 代理任務:官方明說,相較 4.6 最大的能力提升在 coding 與 agentic 工作(詳細 benchmark 見 Anthropic 透明度中心)。
- 1M token 脈絡視窗:預設也是最大值,搭配 128K 最大輸出。
- 自適應思考預設開啟:不再需要手動設定思考預算,模型自己決定要想多久。
- 同價:每百萬 token 輸入 $3、輸出 $15,與 4.6 相同;早鳥優惠 $2 / $10,到 2026-08-31 為止。
- 首個具即時網路安全防護的 Sonnet:高風險資安請求可能被拒絕(以成功回應帶
refusal標記,而非錯誤)。
開發者遷移,注意三件事
如果你要從 Sonnet 4.6 換過來,基本上是「改個 model ID」就好(claude-sonnet-4-6 → claude-sonnet-5),但有三個坑要留意:
- 新的 tokenizer:相同文字會產生約 30% 更多的 token。每 token 的價格沒變,但等效請求的成本、
max_tokens預算、脈絡能塞的文字量,都會受影響——記得重算,別直接沿用舊數字。 - 不再支援手動擴展思考:
thinking: {type:"enabled", budget_tokens:N}會回 400,改用自適應思考 +effort參數。 - 不接受取樣參數:
temperature、top_p、top_k設成非預設值會回 400,遷移時移除它們,改用系統提示引導行為。
可用性方面,發布即上:Claude API(所有客戶)、AWS Bedrock、Google Cloud(Vertex),以及 Microsoft Foundry(預覽)。
我的看法:模型是引擎,不是整台車
每次有更強的模型出來,總會有一波「這下 AI 真的要取代誰了」的討論。但我做了十年系統開發,想給你一個比較務實的視角:
模型變強,不代表你的系統就會變穩。
Sonnet 5 更會寫程式、更會當 Agent,這很好——它讓「執行」這件事更便宜、更強。但一個 AI Agent 要真的在你的業務裡跑起來,靠的不只是模型:
- 它要安全地接上你的資料與工具(權限、資安)
- 它要穩定地處理失敗與邊界情況(不能一出錯就整個垮)
- 它要能維護、能監控、能隨業務長大
這些,正是我在〈Vibe Coding 的四個隱形成本〉裡講的那些「地基」。模型再強,也補不了工程判斷。
換句話說:Sonnet 5 是一顆更好的引擎,但你還是需要有人幫你把整台車組起來、開上路。 這也剛好是我最近在做的事——用最新的模型,幫客戶打造真正能用、又撐得住的 AI Agent 與自動化。
如果你看著 Sonnet 5 這種「會做事」的模型,心裡有個「這能不能幫我做 XXX」的念頭,歡迎找我聊聊怎麼把它落地。
資料來源:Anthropic 官方文件〈What’s new in Claude Sonnet 5〉。