商業與金融

梁文鋒與DeepSeek:用600萬美元顛覆AI產業格局的幕後人物

Penelope H. Fritz
梁文鋒
梁文鋒
出生1985年1月1日
Zhanjiang
職業科技創業家與人工智慧研究者
獲獎Time 100 u00b7 Nature's 10

DeepSeek問世後的數月裡,矽谷始終未能給出答案的那個問題,並非技術層面的疑惑。那是一個哲學命題。如果一支不到兩百人的工程師團隊,在杭州用美國出口管制本該限制的硬體,能夠以極低成本打造出與世界頂尖模型比肩的系統,那些巨額投入究竟是為了什麼?梁文鋒是那個提出這一問題的人。但他沒有留下來等待辯論的結果。

他成長的地方是廣東省的海濱小城吳川,這裡並不出現在通常講述人工智慧起源的敘事中。他的父母都是小學教師。他在初中便自學了高等數學,以湛江地區最高分通過高考,十七歲進入浙江大學。他先後學習了電子資訊工程與資訊通訊工程,並以低成本攝影機目標追蹤演算法研究完成了碩士論文。研究課題看似平常,但那種思維底色——在約束條件下用應用數學解決現實問題——將貫穿他此後所做的一切。

2008年金融危機席捲市場之際,他開始嘗試將機器學習應用於量化交易。歷經成都的探索期和數個早期項目之後,2016年他與兩位浙大同學在杭州共同創辦了幻方量化(High-Flyer Capital Management)。公司迅速躋身中國最成功的量化對沖基金之列:管理規模超過700億元人民幣,2025年平均收益率超過50%。核心優勢在於演算法——運行在梁文鋒大規模積累的GPU叢集上的深度學習模型。到2021年,他購入輝達A100晶片的數量,已足以昭示一個遠超交易公司規模的計畫。

這些基礎設施成為DeepSeek的根基。2023年7月,梁文鋒將其作為幻方量化的分拆公司正式建立。公司的目標並非開發聊天機器人或商業產品,而是他所描述的「人工智慧基礎研究」——那種沒有產品路線圖、沒有季度目標的工作。DeepSeek約有160名員工,來自刻意選擇的多元學科背景,營運預算在OpenAI或谷歌DeepMind的帳本上幾乎可以忽略不計。2024年底DeepSeek-V3發布時,訓練成本估計約為600萬美元。2025年1月DeepSeek-R1發布,並登上美國iOS應用程式商店榜首、超越ChatGPT,此時流傳的數字是560萬美元。全球最大科技公司耗資數億美元開發的模型,遭遇了一個實力相當且造價低廉的挑戰者。

幾乎隨即附著在DeepSeek身上的「顛覆者」敘事並非完全有誤,但在關鍵之處存在重要缺失。金融市場講述的故事——DeepSeek證明了美國的AI投入是浪費、出口管制戰略宣告失敗——預設了梁文鋒團隊所做的事可以在任何地方、由任何人、以有限預算複製。這一假設值得細究。幻方量化的GPU基礎設施建立於最嚴格出口限制生效之前。以低訓練成本生產高效模型的工程決策,需要極深的專業積累。DeepSeek所證明的,並非大型AI模型可以廉價構建;而是架構創新能夠壓縮訓練特定能力水準的邊際成本。兩者之間的距離相當大,而公眾評論大多將二者混為一談。

2025年2月,梁文鋒與多位中國科技界領軍人物一同出席了習近平主持的座談會。這是他最為顯眼的一次公開亮相。此後他便再未出現在公眾面前。DeepSeek於2026年4月發布了V4預覽版,並據報正在尋求以百億美元估值融資3億美元。他透過直接和間接持股掌握的約84%股權,賦予了他控制權,也顯然給了他待在麥克風以外任何地方的自由。

關於私生活,他幾乎沒有留下任何公開記錄。沒有經過核實的伴侶或子女資訊。在DeepSeek成為全球新聞之前,他沒有公開的社群媒體存在;在此之後也沒有。

DeepSeek還將發布更多模型。R1發布以來,公司的軌跡沒有顯示出任何放緩的跡象。真正懸而未決的,是梁文鋒是否會在某個時刻現身,就這一切說些什麼——抑或是,那些工作將在他選擇沉默的地方,繼續代他發聲。

標籤: , , , , ,

討論

共有 0 則留言。