DeepSeek把AI做便宜了，而美國AI泡沫押注它會一直貴下去

DeepSeek（深度求索），一家脫胎於量化避險基金的中國實驗室，執拗地做著美國AI產業當作不可能來定價的事。它造出逼近前沿的模型，用對手在美國所花的零頭來訓練，然後把權重公開，任何人都能下載執行。每一次發布都重新點燃同一場爭論：整個美國AI板塊的估值，建立在一個被DeepSeek悄悄拆解的前提之上——智慧必須一直昂貴。

這個前提並不抽象。它撐起在建資料中心裡的數千億美元，撐起幾乎每一檔指數基金中都有的晶片廠商與雲端業者的股價，也撐起許多讀者已經在為聊天機器人支付的月費。如果對手以低得多的代價交出可比的結果，還把軟體白送，那麼為稀缺而昂貴的算力支付的溢價，看起來就不再像護城河，而更像一場下注。

DeepSeek的說法關乎效率，而非魔法。其工程師押注於一種混合專家設計——每次查詢只喚醒模型的一部分，大量使用較低精度的運算，並把訓練流程調到能在更少、且部分受出口管制的晶片上運行。圍繞其一次主要訓練被反覆引用的數字，低於六百萬美元。可比的美國訓練，若把整張帳單加總，被認為要貴上許多倍。

模型如何發布，和它花了多少同樣重要。DeepSeek放出開源權重，於是聖保羅的開發者、華沙的大學實驗室、首爾的新創公司，都能把模型拉下來跑在自己的機器上，既不必為每次查詢向美國供應商付費，也不必把資料送往海外。這裡有個反諷：本想靠切斷最強晶片來拖慢中國AI的出口管制，似乎反而把DeepSeek逼向以少搏多，而那些精打細算的方法，如今隨開源權重所到之處一同流傳。

對只是使用這些工具的人來說，立竿見影的效果是選擇權。更便宜的模型壓低訂閱價格，把更能幹的助理送進普通筆電和手機，也削弱了把自己鎖定在單一供應商上的理由。原本像是租來的服務，開始像是可以擁有的軟體。

談泡沫需要很大的保留。那個不到六百萬美元的數字只涵蓋一次最終訓練，並不包含讓它成為可能的研究、走過的彎路、薪資與硬體，因此把它擺在一家美國實驗室的全部開支旁邊，是在比較兩樣不同的東西。開源權重也不等於開源程式碼；訓練資料與完整方法仍然不公開。而且效率這把刀兩邊都開刃。被問及DeepSeek時，微軟（Microsoft）的高層搬出了傑文斯悖論——一個古老的觀察：當一種資源用起來更便宜，總消耗往往不降反升。更便宜的智慧也許只是意味著世界買得更多，這對賣算力的人是好消息，而非壞消息。

泡沫被宣告死亡，這也不是頭一回。同一家實驗室曾引發美國史上單日最大的市值蒸發，一個下午就從一家晶片廠商（輝達／Nvidia）身上抹去近六千億美元，隨後又看著股價在數週內幾乎盡數收復。美國的AI巨頭並沒有以少花錢來回應。它們募得更多，建得更大。任何關於泡沫終於破裂的斷言，都必須經得起這樣一個事實：恰恰是桌上押注最大的那些人，正在把賭注翻倍。

DeepSeek真正做到的事，比一顆破掉的泡沫更難戲劇化。它拿走了一種安逸的假設——領先的美國實驗室被一堵別人爬不上去的資本高牆護著。如果前沿級能力可以被廉價逼近、又能免費散布，價值便不再棲身於擁有模型。它轉移到散布，轉移到圍繞模型搭起的產品，轉移到誰握住客戶。下一場考試雖未標註日期，卻已排上日程：DeepSeek每一次新發布都重新打開同一個問題，落進一個已經承諾要花更多、而非更少的市場，因為它篤信規模仍會取勝。勝負將在未來幾個季度的財報電話與資本支出指引中見分曉，而不是在一個宣告戰鬥早已結束的論壇貼文裡。

標籤: 人工智慧, 輝達, DeepSeek, microsoft, AI bubble, open-weight AI