技術

OpenAI通用模型破解八十年未解的幾何難題,並非數學專用模型

Susan Hill

OpenAI的通用推理模型剛剛打破了離散幾何中一個八十年未解的猜想。這個模型並非為了做數學而訓練。它跑在與寫電郵、寫Python程式碼同一套架構之上,而週二它生出了一族新的幾何配置,目前已由四位數學家核驗完成。

這個問題的敘述簡單到近乎欺人。在平面上取n個點。其中有多少對可以彼此相距完全相同的距離,比方說一個單位?Paul Erdős於1946年提出此問題,並給出一條上界:約莫n的(1加o(1))次方,意思是「僅僅略多於線性」。數十年來,最佳的已知配置都來自正方格的各種變體,而正方格幾乎貼著那道天花板。在崗的數學家把這條上界當作實質緊致來處理。

OpenAI的模型並未把上界收緊。它把它撞斷。系統給出一整族點的排列,至少含有n的(1加δ)次方對單位距離配對,其中δ為某個大於零的固定常數。這不是修飾,而是該猜想核心斷言的反例。複核工作的四位數學家之一Will Sawin把這條新指數化簡為一個乾淨的表式。Thomas Bloom、Melanie Wood與Noga Alon,複核小組其餘三人,確認構造站得住。

這個方法有意思的地方在於,它並非從幾何內部長出來。模型跨入了代數數論,把高斯整數推廣到其他代數數體,並把所得格點視為候選的配置。那座橋,把幾何拉進數論的這一步,正是人類八十年一再錯過的跳躍。在一場數學討論班上,這種動作通常換到的是一陣緩慢點頭與一段長長的沉默。

在崗數學家的反應在頭一天就到了。Fields獎得主Timothy Gowers稱之為「AI解一道真正廣為人知的數學問題、第一個真正清楚的例子」。OpenAI研究員Alexander Wei寫道,這個結果是Annals of Mathematics的審查人會「毫無遲疑地」接收的那一類。最後這項斷言可以驗證。證明已經以PDF形式公開,並附帶一份說明文件,更廣泛的數學社群目前正在閱讀。

OpenAI所倚靠的論述是:這是AI系統第一次自主地解開數學某一領域核心位置上一道重要的開放問題。「自主」這個詞在此承擔了極多的份量。模型給出了構造;在任何公告發出之前,證明先經過四位真人數學家的篩選、打磨與壓力測試。這個區分要緊,因為OpenAI從前在同一位置上站過。

2025年10月,該公司散布過一個說法,稱另一個內部模型已解開Erdős提出的十道開放問題。幾天內,數學家們就指出那些「答案」中有不少不是早已知,就是直接錯了。OpenAI撤回了那一波宏大的說法。那一段插曲,正是本週公告以核驗者的姓名而非模型名稱開頭的原因。四位數學家就是保證。

另一處值得記下的細節是,是哪一類模型生出這個結果。OpenAI並未公布系統名稱,只說那是一款通用推理模型,與支撐聊天、起草程式碼、回覆客服工單的是同一族系統。迴路裡沒有任何數學專用變體。處理日常對話的同一套架構也處理了這件事。其意涵在於,AI驅動數學的瓶頸,也許從來不是一個為數學微調的模型。也許是算力與耐心。

那一條瓶頸斷裂,才是真正的故事。長久以來,研究者間的工作假設是,真正原創的數學需要量身打造的系統:定理證明器、形式化驗證框架、在證明語料上訓練的窄模型。週二落下的,是另一類證據。一台推理器被指向一道著名、未解、八十年的問題;給它足夠思考的餘地,它生出了Sawin、Bloom、Wood、Alon一致同意是正確的東西。從聊天視窗到Erdős的那段路,比想像中還短。

仍有若干保留。模型並未對外公開。最初四人小組以外的獨立群體會在接下來幾週讀這份證明,而Annals或其他頂級期刊的完整同行評審程序將要耗時數月。指數δ並不大。該構造並未解決球面上或更高維度下相關的單位距離問題。這些都不會縮減週二發生的事的份量。只是替它定位。

改變的是預期。一年前,關於AI能否進入數學的提問是:這些系統有一天會不會給出夠份量的原創證明。本週起,問題換成了:下一道開放問題會在哪裡塌下來,以及核驗證明的數學家會不會繼續取得這裡Alon與同事所取得的那種署名功勞。

1946年的一道猜想,是那種靜靜地擺在架上等候合適的手把它取下來的東西。這週把它取下來的那隻手跑在一組GPU叢集上,並未為這份工作受過訓練,在四位數學家注視之中把工作收尾。

討論

共有 0 則留言。