技術

微軟洽談讓Anthropic成為Maia 200首個外部客戶

Susan Hill

微軟正在與Anthropic洽談供應自家研發的人工智慧晶片Maia 200。如果成行,將是這款矽晶片首次走出微軟自己的資料中心。最早由The Information披露、並由CNBC證實的這場討論,把一段此前主要存在於試算表中的財務關係,推上了實際營運的舞台。

目前在桌上的安排範圍不大,但分量不輕。Anthropic將在Azure上租用搭載Maia 200晶片的伺服器,用於推論,也就是Claude向使用者輸出回答的高成本環節,與訓練新模型那種更顯眼的工作明顯不同。推論正是當前每一家前沿實驗室都在持續燒錢的地方。一次查詢的單位經濟,乘上數以億計的使用者,就是當下決定AI業務走向的最關鍵數字。

對微軟而言,把Anthropic搬上Maia 200,將是這個長期以內部研發形式存在的晶片計畫所能拿到的最強商業驗證。亞馬遜的Trainium與Inferentia在外部客戶手中已運行多年。Google的TPU則是大型語言模型革命中相當一塊靜默的支柱。Maia則不同,至今只在微軟位於亞利桑那州與愛荷華州的自家設施中部署,跑著公司並未公開拆解的內部AI負載。拿下全球關注度第二高的前沿實驗室,等於是一夜之間把這顆晶片從內部基礎設施推向商用產品。

財務邏輯已經就位。微軟在Anthropic持有價值五十億美元的股權;Anthropic則承諾在Azure上長期投入大約三百億美元的算力支出。這筆錢無論如何都要透過某種矽晶片流動。懸而未決的問題,也是這椿交易要回答的問題,就是Anthropic會把這筆錢燒在向微軟租用的Nvidia GPU上,還是微軟能把其中可觀的一部分引向自家設計的晶片。

Maia 200是微軟第二代推論加速器。這顆元件由台積電以3奈米製程製造,每個封裝內串接四顆加速器,被微軟定位為以推論為先的矽晶片,針對回答而非學習的工作優化。執行長Satya Nadella告訴投資人,與Azure機隊中已有的最新GPU矽晶片相比,這顆晶片可帶來「每美元token數提升超過百分之三十」的效益。這是成本的主張,而不是能力的主張;在推論領域,決定一顆晶片是否能活到具有意義的尺度,正是這個成本指標。

從Anthropic這一邊看,Maia 200的洽談落在一條清晰的脈絡之中。過去一年,這個實驗室刻意打造了一套異質算力堆疊:跨多家雲端的Nvidia GPU、與亞馬遜在估值超過一千億美元的多年合約下取得的AWS Trainium晶片,以及訓練管線部分使用的Google TPU。再加上微軟的矽晶片,這個組合便閉合完整。在前沿實驗室中,Anthropic實際上將擁有供應商多元化程度最高的算力架構。這是Dario Amodei數月來反覆傳遞的策略的營運層表達——綁住實驗室的不是人才,而是算力。

但這一切尚未拍板。雙方都把談判描述為初期階段,Maia 200也還沒有以任何商用形式對Azure的外部客戶開放。微軟提出的百分之三十數字,本身是供應商在自家端到端掌控的負載上跑出來的供應商指標。針對Nvidia當前Hopper或Blackwell世代的獨立基準測試,在公開領域仍未出現。戰略視角至少在一個方向上也並不輕鬆——微軟是Anthropic最直接的競爭對手OpenAI的最大單一支持者。將Maia算力同時賣給兩家實驗室,是微軟從未實際測試過的格局;要讓這個格局在合約上可信地分割,並不是簡單的工程。

接下來的事屬於程序。商業條件沒有外洩,微軟自家設施之外的Maia 200普遍上市時程也尚未公布,兩家公司都沒有確認時間表。下一個明確訊號將出現在微軟下一次季度業績發表中,屆時任何具分量的對外承諾客戶都得被認列。在那之前,雷德蒙德與舊金山之間的財務編舞,仍跑在矽晶片本身之前。

討論

共有 0 則留言。