梁文鋒與DeepSeek：用600萬美元顛覆AI產業格局的幕後人物

梁文鋒

出生	1985年1月1日 Zhanjiang
職業	科技創業家與人工智慧研究者
獲獎	Time 100 u00b7 Nature's 10

DeepSeek問世後的數月裡，矽谷始終未能給出答案的那個問題，並非技術層面的疑惑。那是一個哲學命題。如果一支不到兩百人的工程師團隊，在杭州用美國出口管制本該限制的硬體，能夠以極低成本打造出與世界頂尖模型比肩的系統，那些巨額投入究竟是為了什麼？梁文鋒是那個提出這一問題的人。但他沒有留下來等待辯論的結果。

他成長的地方是廣東省的海濱小城吳川，這裡並不出現在通常講述人工智慧起源的敘事中。他的父母都是小學教師。他在初中便自學了高等數學，以湛江地區最高分通過高考，十七歲進入浙江大學。他先後學習了電子資訊工程與資訊通訊工程，並以低成本攝影機目標追蹤演算法研究完成了碩士論文。研究課題看似平常，但那種思維底色——在約束條件下用應用數學解決現實問題——將貫穿他此後所做的一切。

2008年金融危機席捲市場之際，他開始嘗試將機器學習應用於量化交易。歷經成都的探索期和數個早期項目之後，2016年他與兩位浙大同學在杭州共同創辦了幻方量化（High-Flyer Capital Management）。公司迅速躋身中國最成功的量化對沖基金之列：管理規模超過700億元人民幣，2025年平均收益率超過50%。核心優勢在於演算法——運行在梁文鋒大規模積累的GPU叢集上的深度學習模型。到2021年，他購入輝達A100晶片的數量，已足以昭示一個遠超交易公司規模的計畫。

這些基礎設施成為DeepSeek的根基。2023年7月，梁文鋒將其作為幻方量化的分拆公司正式建立。公司的目標並非開發聊天機器人或商業產品，而是他所描述的「人工智慧基礎研究」——那種沒有產品路線圖、沒有季度目標的工作。DeepSeek約有160名員工，來自刻意選擇的多元學科背景，營運預算在OpenAI或谷歌DeepMind的帳本上幾乎可以忽略不計。2024年底DeepSeek-V3發布時，訓練成本估計約為600萬美元。2025年1月DeepSeek-R1發布，並登上美國iOS應用程式商店榜首、超越ChatGPT，此時流傳的數字是560萬美元。全球最大科技公司耗資數億美元開發的模型，遭遇了一個實力相當且造價低廉的挑戰者。

幾乎隨即附著在DeepSeek身上的「顛覆者」敘事並非完全有誤，但在關鍵之處存在重要缺失。金融市場講述的故事——DeepSeek證明了美國的AI投入是浪費、出口管制戰略宣告失敗——預設了梁文鋒團隊所做的事可以在任何地方、由任何人、以有限預算複製。這一假設值得細究。幻方量化的GPU基礎設施建立於最嚴格出口限制生效之前。以低訓練成本生產高效模型的工程決策，需要極深的專業積累。DeepSeek所證明的，並非大型AI模型可以廉價構建；而是架構創新能夠壓縮訓練特定能力水準的邊際成本。兩者之間的距離相當大，而公眾評論大多將二者混為一談。

2025年2月，梁文鋒與多位中國科技界領軍人物一同出席了習近平主持的座談會。這是他最為顯眼的一次公開亮相。此後他便再未出現在公眾面前。DeepSeek於2026年4月發布了V4預覽版，並據報正在尋求以百億美元估值融資3億美元。他透過直接和間接持股掌握的約84%股權，賦予了他控制權，也顯然給了他待在麥克風以外任何地方的自由。

關於私生活，他幾乎沒有留下任何公開記錄。沒有經過核實的伴侶或子女資訊。在DeepSeek成為全球新聞之前，他沒有公開的社群媒體存在；在此之後也沒有。

DeepSeek還將發布更多模型。R1發布以來，公司的軌跡沒有顯示出任何放緩的跡象。真正懸而未決的，是梁文鋒是否會在某個時刻現身，就這一切說些什麼——抑或是，那些工作將在他選擇沉默的地方，繼續代他發聲。

標籤: 人工智慧, ceos, 商業, DeepSeek, 中國科技, 梁文鋒