技術

Claude Fable 5重返全球市場:封堵的是漏洞利用手法,而非削減模型能力

Adrian Kessler

Anthropic迄今公開發布的最強AI模型Claude Fable 5已在全球重新上線。此次回歸距十八天完全暫停結束——暫停始於美國政府實施出口管制,要求Anthropic實時核驗用戶國籍。面對這一在Claude全球用戶規模下無法實現的技術要求,公司選擇完全停止訪問,而非部分合規。

觸發管制的是Amazon研究人員發現的一種特定越獄技術。該方法借助Fable 5以美國出口法規禁止某些外國公民使用的方式繪製軟體漏洞圖。內部調查揭示了一個讓監管邏輯更加複雜的事實:同類漏洞同樣可以透過能力弱得多的模型識別,包括Opus 4.8、GPT-5.5和Kimi K2.7。換句話說,這種能力並非Fable 5所獨有,管制是因為該模型被特定方式利用,而非因為它具有獨特的破壞性能力。

解除管制的關鍵修復

改變之處在於一個新安全分類器,專門訓練用於屏蔽Amazon記錄的繞過技術。Anthropic表示,該分類器能在99%以上的情況下攔截已披露的方法。這並非對未來越獄的全面防護承諾——而是針對已知漏洞的定向修復。分類器在輸入層工作,在模型處理請求之前將與記錄模式匹配的請求重定向。

更廣泛的影響關係到AI監管走向。出口管制之所以適用於Fable 5,不是因為該模型能獨立實現危害,而是因為一種已知技術對其加以利用。管制之所以解除,不是因為監管框架解決了這個問題,而是因為分類器填補了已記錄的漏洞。Anthropic正與Amazon、微軟和Google合作,根據四項標準構建AI越獄嚴重性評估共同框架:能力獲取程度、獲取範圍、武器化難易度和可發現性。該框架尚未作為公開標準確立。

模型能力與使用成本

模型本身未作任何改動。Fable 5專為高要求的長程推理和智能體工作而設計,適用於無需在每個步驟進行人工審批、橫跨長序列的規劃、執行和路線修正任務。上下文視窗為一百萬token,這也是預設值。每次回應最大輸出量為128,000 token。思維過程始終處於啟用狀態,以可讀摘要形式返回,而非原始推理鏈。

訪問附帶暫停前不存在的條款。Fable 5現要求保留30天資料,不適用於零資料保留協議。這直接影響醫療、法律和政府領域的機構——這些領域的AI工具採用通常以零保留協議為基本前提。定價高於Opus級別:每百萬輸入token收費10美元,每百萬輸出token收費50美元。觸發安全分類器的請求可能被轉交給備用模型處理,而非直接拒絕,該替換對最終用戶是否可見,取決於各營運方的配置。

可用性

Fable 5有一款同級模型Claude Mythos 5,擁有相同的基礎能力和定價,但包含Fable 5所沒有的進攻性網路安全功能。Mythos 5透過獨立訪問管道Project Glasswing提供。兩款模型並未同時回歸:Mythos 5的訪問在Fable 5全球回歸前一週已為部分美國機構恢復。

Fable 5現已在Claude平台、Claude.ai、Claude Code和Claude Cowork上線。Pro、Max、Team及部分Enterprise方案用戶可在7月7日前享受最高50%週使用額度包含該模型,此後切換為按使用量計費。透過AWS、Google Cloud和Microsoft Foundry的訪問正在分階段恢復。規範下一次新繞過技術出現時應對方式的框架仍在構建中。

標籤: , , , , ,

討論

共有 0 則留言。