技術

DeepSeek把AI做便宜了,而美國AI泡沫押注它會一直貴下去

Susan Hill

DeepSeek(深度求索),一家脫胎於量化避險基金的中國實驗室,執拗地做著美國AI產業當作不可能來定價的事。它造出逼近前沿的模型,用對手在美國所花的零頭來訓練,然後把權重公開,任何人都能下載執行。每一次發布都重新點燃同一場爭論:整個美國AI板塊的估值,建立在一個被DeepSeek悄悄拆解的前提之上——智慧必須一直昂貴。

這個前提並不抽象。它撐起在建資料中心裡的數千億美元,撐起幾乎每一檔指數基金中都有的晶片廠商與雲端業者的股價,也撐起許多讀者已經在為聊天機器人支付的月費。如果對手以低得多的代價交出可比的結果,還把軟體白送,那麼為稀缺而昂貴的算力支付的溢價,看起來就不再像護城河,而更像一場下注。

DeepSeek的說法關乎效率,而非魔法。其工程師押注於一種混合專家設計——每次查詢只喚醒模型的一部分,大量使用較低精度的運算,並把訓練流程調到能在更少、且部分受出口管制的晶片上運行。圍繞其一次主要訓練被反覆引用的數字,低於六百萬美元。可比的美國訓練,若把整張帳單加總,被認為要貴上許多倍。

模型如何發布,和它花了多少同樣重要。DeepSeek放出開源權重,於是聖保羅的開發者、華沙的大學實驗室、首爾的新創公司,都能把模型拉下來跑在自己的機器上,既不必為每次查詢向美國供應商付費,也不必把資料送往海外。這裡有個反諷:本想靠切斷最強晶片來拖慢中國AI的出口管制,似乎反而把DeepSeek逼向以少搏多,而那些精打細算的方法,如今隨開源權重所到之處一同流傳。

對只是使用這些工具的人來說,立竿見影的效果是選擇權。更便宜的模型壓低訂閱價格,把更能幹的助理送進普通筆電和手機,也削弱了把自己鎖定在單一供應商上的理由。原本像是租來的服務,開始像是可以擁有的軟體。

談泡沫需要很大的保留。那個不到六百萬美元的數字只涵蓋一次最終訓練,並不包含讓它成為可能的研究、走過的彎路、薪資與硬體,因此把它擺在一家美國實驗室的全部開支旁邊,是在比較兩樣不同的東西。開源權重也不等於開源程式碼;訓練資料與完整方法仍然不公開。而且效率這把刀兩邊都開刃。被問及DeepSeek時,微軟(Microsoft)的高層搬出了傑文斯悖論——一個古老的觀察:當一種資源用起來更便宜,總消耗往往不降反升。更便宜的智慧也許只是意味著世界買得更多,這對賣算力的人是好消息,而非壞消息。

泡沫被宣告死亡,這也不是頭一回。同一家實驗室曾引發美國史上單日最大的市值蒸發,一個下午就從一家晶片廠商(輝達/Nvidia)身上抹去近六千億美元,隨後又看著股價在數週內幾乎盡數收復。美國的AI巨頭並沒有以少花錢來回應。它們募得更多,建得更大。任何關於泡沫終於破裂的斷言,都必須經得起這樣一個事實:恰恰是桌上押注最大的那些人,正在把賭注翻倍。

DeepSeek真正做到的事,比一顆破掉的泡沫更難戲劇化。它拿走了一種安逸的假設——領先的美國實驗室被一堵別人爬不上去的資本高牆護著。如果前沿級能力可以被廉價逼近、又能免費散布,價值便不再棲身於擁有模型。它轉移到散布,轉移到圍繞模型搭起的產品,轉移到誰握住客戶。下一場考試雖未標註日期,卻已排上日程:DeepSeek每一次新發布都重新打開同一個問題,落進一個已經承諾要花更多、而非更少的市場,因為它篤信規模仍會取勝。勝負將在未來幾個季度的財報電話與資本支出指引中見分曉,而不是在一個宣告戰鬥早已結束的論壇貼文裡。

討論

共有 0 則留言。