技術

Claude一個月發現一萬多個嚴重漏洞,修補跟不上

Susan Hill

Anthropic一款尚未公開的模型在短短一個月內,從約五十家合作組織的程式碼庫中找出超過一萬個高危與重大級別的軟體漏洞。這款模型在公司內部代號為Claude Mythos Preview,被對準支撐現代網際網路相當大一部分的開源函式庫、瀏覽器與基礎設施。結果顛覆了長年支配軟體安全的等式。找出漏洞不再是工作裡最難的部分。最難的部分,現在變成把它們修好。

這項計畫名為Project Glasswing。Anthropic在發布這第一批數字大約一個月之前就啟動了它。約五十家合作組織同意讓該模型掃描自家的生產程式碼。Cloudflare把模型放上自家關鍵系統,收到約兩千筆發現,其中四百筆被列為高危或重大。Mozilla把模型對準Firefox,為瀏覽器下一個大版本一次挖出271個不同的瑕疵——這一數字是同一團隊在前一版本上使用公開模型Claude Opus 4.6所得結果的十倍以上。

這些數字代表什麼,要看你實際上用的是什麼軟體。該模型在wolfSSL中找到一個憑證偽造漏洞;這個密碼學函式庫被裝在全球數十億台家用路由器、智慧家庭中樞與工業控制器之中。該漏洞已被分配CVE編號CVE-2026-5194,修補檔正在派送。同一輪掃描擴展到一千多個開源專案,估算共產出6,202個高危或重大級事件。這不是發生在玩具基準測試上的學術發現。這些是真實程式碼裡的漏洞,那些程式碼正在處理你的加密連線、你的瀏覽器分頁,以及線纜另一端的機器。

Mythos Preview不是任何人都能買到的Claude版本。Anthropic選擇不對外發布。公司認為,能以這種規模找出漏洞的同一個模型,一旦落入不對的手上,就會變成工業規模的漏洞利用工廠。聲明寫道:「沒有任何一家公司開發出足夠強大的防護機制,能阻止這類模型被濫用。」目前,Mythos Preview只在一個受控計畫內運作,配備經過審查的合作對象與協調一致的揭露管道。

這款模型究竟找出哪些類型的漏洞?C與C++函式庫中的記憶體安全錯誤、像wolfSSL那種的憑證處理瑕疵、網路協定實作中的邏輯錯誤,以及廣泛部署服務裡的驗證繞過。正是這些類別在過去幾十年造成過真實世界的資安事件。英國人工智慧安全研究所(UK AI Security Institute)回報,Mythos Preview是該機構測試過的第一款能端到端解開其兩套cyber range模擬的模型;那些模擬是模仿完整攻擊鏈路的受控環境。獨立資安公司XBOW將該模型描述為相對先前工作的「重大躍進」,並形容其具備「絕對前所未見的精準度」。

對任何使用過自動掃描器的人,接下來的問題是:這些發現裡有多少是真的。獨立資安公司複核了其中1,752份被標示為高危或重大的報告。約90.6%,也就是1,587份,被確認為合法漏洞。這比模糊測試或模式比對工具的典型雜訊水準要乾淨得多。Cloudflare還回報,在自家測試中,該模型的誤報率比公司內人類紅隊成員更低。但這依然意味著大約每十條警報就有一條是誤報。在這個規模下,那就意味著一堆報告裡夾雜大約一千份「並非漏洞」的報告,每一份還是得有人讀過再剔除。

更困難的問題是真實漏洞被通報之後會發生什麼。在這次首份更新時,向維護者通報的530個高危或重大漏洞中,只有75個已經修補。平均修復時間約兩週。一些開源維護者據傳已不堪負荷,要求Anthropic放慢揭露節奏。公司寫道:「軟體安全的進展過去受限於我們能多快找出新漏洞。現在則受限於我們能多快驗證、揭露並修補AI找出的大量漏洞。」

對一般使用者而言,實際結論並不光鮮。你今天在用的軟體——也許正是打開這個頁面的瀏覽器——幾乎肯定帶有AI已經知道、而人類還來不及修補的關鍵漏洞。協調揭露的前提是修補檔先於公開通告抵達,而這個順序只有在修補檔真的按時到位時才成立。Project Glasswing目前仍以美國與英國為基地。具名的參與者包括Cloudflare、Mozilla、英國人工智慧安全研究所與XBOW。多數其他國家並沒有對等的協調揭露計畫。該模型在中國、台灣、日本、韓國、印度或巴西的軟體堆疊中所找到的漏洞,是否能獲得相同的緊迫程度,仍是個開放的問題。

Anthropic表示Project Glasswing正在擴展到更多合作夥伴。Mythos Preview模型本身仍未上市,公司也沒有公布開放發布的時程;依其目前的判斷,任何更大規模的部署都需要目前尚不存在的安全機制。第二份更新預期將在2026年稍晚發布。值得關注的指標,不會是一款AI能找到多少漏洞。而是另一端的人類,最終來得及修好其中多少個。

討論

共有 0 則留言。