起底 DeepSeek,為什麽 DeepSeek 偏愛沒有工作履歷的年輕人?
起底 DeepSeek,為什麽 DeepSeek 偏愛沒有工作履歷的年輕人?
0. 寫在前面

最近一段時間,接連出現的DeepSeek V3,R1讓美國的AI研究員,創業者和投資人們開始Fomo。這一場盛宴,甚至可以和ChatGPT在2022年年底問世一樣讓人驚訝。

憑藉DeepSeek R1的徹底開源(HuggingFace可免費下載模型進行本地推理)和極低的價格(是OpenAI o1的1/100的價格),DeepSeek在短短5天時間內,登上了美區Apple AppStore的冠軍。

那麼,這家神秘的,由一家中國量化公司所孵化出來的AI新勢力,究竟源自何方?

1.DeepSeek的由來

我第一次聽說DeepSeek,還是在2021年,當時,在達摩院工作時,隔壁組的天才少女,一年發表8篇ACL(自然語言處理頂會)的北大碩士羅福莉,離職加入了幻方量化(High-Flyer Quant)。當時大家都非常好奇,非常賺錢的量化公司,為何要招募AI領域的人才: 難道幻方也需要發paper嗎?

當時,據我所知,幻方招募的AI研究員大多是各自為戰,找一些前沿的方向進行探索,其中最核心的方向當屬大模型(LLM)以及文生圖模型(當時的OpenAI Dall-e)相關。

時間轉眼來到了2022年底,幻方逐漸開始吸納越來越多的頂級AI人才(大部分是清華北大的在校生)。在ChatGPT的刺激下,讓在AI領域積累多年的幻方CEO梁文鋒下定決心要進軍通用人工智慧領域了:「我們建了一個新公司,從語言大模型開始,後面也會有視覺等。」

是的,這個公司就是DeepSeek,在2023年初,以智譜,月之暗面,百川智慧等為代表的六小龍公司逐步走勢舞台中央,在熱鬧繁華的中關村和五道口中間,DeepSeek的存在感很大程度上被這些熱錢擊中的公司奪走了"注意力"(Attention)。

因此,在2023年,作為一個純研究機構,沒有明星創始人的DeepSeek(如李開複的零一萬物,楊植麟的月之暗面,王小川的百川智慧等)很難獨立從市場上融資。

因此,幻方決定剝離DeepSeek,並全資資助DeepSeek的開發。在2023年這個烈火烹油的時代,沒有風險投資公司願意為DeepSeek提供資金,一是DeepSeek裡面大多是剛畢業的PHD們,沒有非常有知名度的頂級研究員坐鎮,二是因為資本退出遙遙無期。

在充滿噪音和浮躁的環境下,DeepSeek開始書寫其在AI探索上的一個個故事:

  • 2023 年 11 月,DeepSeek 推出了 DeepSeek LLM,其參數多達 670 億個,其性能接近 GPT-4。
  • 2024 年 5 月,DeepSeek-V2 正式上線。
  • 2024 年 12 月,DeepSeek-V3 發布,基準測試表明,它的表現優於 Llama 3.1 和 Qwen 2.5,同時與 GPT-4o 和 Claude 3.5 Sonnet 相當,引爆了業內關注。
  • 2025 年 1 月,第一代有推理能力的大模型模型DeepSeek-R1發布,以OpenAI o1 1/100不到的價格和卓越的性能,讓全世界科技界為之戰栗: 世界真正意識到,中國力量真的來了... 開源永遠贏!
2.人才戰略

我很早期的時候認識一些DeepSeek的研究員,主要是研究AIGC方向的,如2024年11月發布的Janus的作者以及DreamCraft3D的作者,其中還有一位幫助我最佳化過最新的論文 @xingchaoliu。

根據我的發現,我認識的研究員們大多是非常年輕,基本都是在讀博士生或者畢業3年以內的。

其中,這些人大都是在北京地區讀研究生或者博士的學生,在學術方面有著極強的造詣: 多為發表了3-5篇頂會論文的研究員。

我問過DeepSeek的朋友,為什麼梁文峰隻招募年輕人?

他們給我轉了幻方CEO梁文峰的話,其原話如下:

DeepSeek團隊的神秘面紗讓人們好奇:它的秘密武器是什麼?外媒說,這一秘密武器是「年輕天才」,他們足以與財力雄厚的美國巨頭展開競爭。

在AI行業,聘請經驗豐富的老將是常態,許多中國本土的AI新創公司更傾向於招募資深研究人員或擁有海外博士學位的人才。然而,DeepSeek卻反其道而行,偏愛沒有工作履歷的年輕人。

一名曾與DeepSeek合作的獵頭透露,DeepSeek不招資深技術人員,「工作經驗在3-5年已經是最多的了,工作超8年的基本就pass了。」梁文鋒在2023年5月接受36氪採訪時也表示,DeepSeek的大多數開發人員要嘛是應屆畢業生,要嘛是剛開始從事人工智慧職業的人。他強調:「我們的核心技術崗位大多由應屆畢業生或具有一兩年工作經驗的人擔任。」

沒有工作履歷,DeepSeek是如何選人的?答案是,看潛力。

梁文鋒曾說,做一件長期的事,經驗其實沒那麼重要,相比之下基礎能力、創造性和熱愛等更重要。他認為,或許目前世界排名前50的頂尖AI人才還不在中國,「但我們能自己打造這樣的人。」

這個戰略讓我想起了OpenAI的早期策略,OpenAI在2015年底成立的時候,Sam Altman的核心思路就是找年輕有野心的研究員,因此,除了總裁Greg Brockman和首席科學家Ilya Sutskever以外,剩下四個核心創始技術團隊成員(Andrew Karpathy,Durk Kingma,John Schulman,Wojciech Zaremba)都是應屆的博士畢業生,分別畢業於史丹佛大學,荷蘭阿姆斯特丹大學,加州柏克萊分校以及紐約大學。

這種「幼狼戰略」,已經讓OpenAI嚐到了甜頭,孵化出了如GPT之父Alec Radford(相當於民辦三本畢業),文生圖模型DALL-E之父Aditya Ramesh(NYU大學生),以及GPT-4o的多模態負責人,三屆奧賽金牌得主Prafulla Dhariwal等。讓成立初期,拯救世界計劃並不明確的OpenAI,在年輕人的橫衝直撞中,生生的撞開了一條生路,將OpenAI從DeepMind身邊的無名小卒,成長為巨擘。

梁文峰正是看到了Sam Altman這個成功的戰略,才堅定的選擇了這條路,不過,不同於OpenAI等待了7年時間才見到了ChatGPT。梁文峰的投入,用了2年多就見到了成效,可謂是中國速度。

3.為DeepSeek發聲

在DeepSeek R1的文章中,其各項指標驚人的優異。但也引發了大家的懷疑: 有兩個疑點,

  1. 它所使用的專家混合 (MoE)技術,對訓練要求高,對數據要求高,這表明了,大家質疑Deepseek使用OpenAI數據訓練是有道理的。
  2. Deepseek使用強化學習 (RL)的強化學習技術,有對硬體要求很高,但相比Meta,OpenAI的萬卡集群,Deepseek的訓練只用了2048張H800。

由於算力的限制和MoE的複雜性,這讓只用500萬美元就一次成功的DeepSeek R1看著有些可疑,但是,無論你對R1的態度是頂禮膜拜其「低成本奇蹟」,還是質疑其「華而不實」,都無法忽視其功能性創新的炫目。

BitMEX聯合創始人Arthur Hayes發文表示: DeepSeek崛起是否會導緻全球投資者質疑美國超卓主義?美國的資產價值是否被嚴重高估?

史丹佛大學教授吳恩達在今年的達佛斯論壇公開表示:「我對 DeepSeek 的進展印象深刻。我認為他們能夠以非常經濟的方式訓練模型。他們最新發布的推理模型,非常出色……『加油』!」

A16z的創始人,Marc Andreessen表示,「Deepseek R1 是我見過的最令人驚嘆、最令人印象深刻的突破之一——而且作為開源,它是給世界的一份深刻的禮物。」

2023年站在舞台角落的DeepSeek,終於在2025年,農曆春節前,站上了世界AI之巔。

4.Argo和DeepSeek

作為Argo的技術開發者和AIGC研究者,我將Argo裡面的重要功能進行了DeepSeek化: 作為一個工作流(workflow)系統,粗糙的原始工作流生成工作,Argo是用DeepSeek R1進行的。

此外,Argo將LLM內建為標準的DeepSeek R1,並選擇拋棄閉源昂貴的OpenAI模型,原因是Workflow系統通常包含大量的Token消耗和上下文資訊(平均>=10k token),這就導緻了如果使用高價的OpenAI或Claude 3.5,Workflow的執行成本非常昂貴,在web3用戶沒有得到真正的價值捕獲之前,這種提前透支的花銷,是一種對產品的傷害。

隨著DeepSeek越來越好,Argo會和DeepSeek為代表的中國力量進行更密切的合作: 包括不限於Text2Image/Video介面的中國化,LLM的中國化。

在合作方面,Argo將會在未來邀請DeepSeek的研究員分享技術成果,並為頂級AI研究員提供grants,為web3投資人和用戶了解AI進展,提供助力。

本文合作轉載自:深潮

往下滑看下一篇文章
從「矽盾之島」到「資本樞紐」,國發會聯手證交所為AI新十大建設引進資源活水
從「矽盾之島」到「資本樞紐」,國發會聯手證交所為AI新十大建設引進資源活水

在人工智慧(AI)浪潮席捲全球的當下,臺灣不僅要守住半導體矽盾,更要將這股技術優勢轉化為長期的經濟動能,國家級計畫「AI新十大建設」將是重要推力之一!盤點AI新十大建設目標,最關鍵是2040前創造超過15兆元產值,提供50萬個AI高薪就業機會。然而,這項宏大的計畫若要成功,除了技術研發,最核心的動力來源正是「市場資本」。

打磨技術引擎的重要資源,對接全球資本作為動力

攤開AI新十大建設的政策綱領,可發現這項計畫涵蓋數位基磐、關鍵技術、智慧應用共三大層面的整合發展。主導規劃這項計畫的國家發展委員會(以下稱國發會)過去曾指出,AI若要普及到百工百業,必須建構強韌的數位基磐,這不僅包含主權AI與高效算力的布建,更涵蓋資料治理、人才培育,甚至引導市場資金驅動創新等核心支柱。

確實,發展AI極需大量資金挹注。依據CB Insights資料,全球資金持續向AI領域靠攏,2025年Q3單筆一億美元以上的交易件數,較去年同期增加41.82%。至於國內情況,國發基金與數位部合作推動AI新創方案,從今年3月底啟動到11月,已投資3家AI及數位經濟相關企業,累積投資6,100萬元,帶動民間投資約2億3,000萬元。另其他各項方案投資於AI產業累積129家,投資金額24.12億元。

不過從民間角度來看,臺灣投入AI創新的資本規模仍有成長空間。國家發展委員會常務副主委詹方冠就以AI新十大建設的三大關鍵技術之一「矽光子」為例,他表示:「在台積電帶動下,臺灣的矽光子技術已處於全球領先地位,但我們陪同總統參加矽光子產業聯盟座談時發現,廠商最憂心的問題之一就是『資金』的充沛」。

「相較於國外大廠動輒有30、50億美元的併購規模,臺灣矽光子廠商多屬中小企業,儘管我們技術優異,若要進入大量生產或與國際巨頭競爭,就需要資本市場支持,這也是為什麼『亞洲創新籌資平臺』將扮演關鍵角色,」詹方冠補充道。換言之,亞洲創新籌資平臺將為前瞻科技增添「燃油」的戰略價值,透過活絡資金與提升新創成功率,帶動下一波經濟動能。

啟動資本樞紐戰略!國發基金與市場資本協作賦能新創

至於亞洲創新籌資平臺如何讓具備利基技術但尚在成長期的新創或企業,更有效率上市及籌集擴張所需的資金?詹方冠觀察到,證交所創新板近兩年大幅鬆綁制度。相關措施包括縮短集保期間(2年變1年)、免除3年的承銷商保薦、上市後申報會計師內控審查報告期間,從3個會計年度縮短為1個會計年度,有助於縮短企業掛牌時程。

另外詹方冠也提到,國發會的國發基金與證交所的市場資本,兩者也可以相輔相成,扶植更多代表性的AI新創獲得成長需要的銀彈。國發基金先以「創業天使投資方案」提供早期育成支援,當企業具備一定規模後,隨後由亞洲創新籌資平臺輔導機制接手,轉向資本市場獲取更多資源。待企業上市後,國發基金再將獲利的資金進行再投資,形成資本的正向循環。

隨著亞洲創新籌資平臺將其定位為「亞洲那斯達克」,資本投資標的也將突破國界,轉向吸納全球頂尖的創新能量。詹方冠解釋,為了讓臺灣成為亞洲新創資本的匯聚地,國發會的投資政策更趨於開放且具有彈性。他表示,「國發基金的投資並不受限於傳統的公司註冊地,只要外國新創的研發團隊在臺灣、營運主體或主要市場與臺灣連結,無論是國發基金直接投資,或是透過合作的VC共同參與,皆能靈活注資。」

這種跨國投資、落地臺灣的模式,即是「引水入渠」且已有實際案例。詹方冠舉例,過去臺灣為了促進與中東歐合作,設立「中東歐投資基金」,即是瞄準當地具實戰優勢的無人機產業進行布局。換言之,藉由國發會及亞洲創新籌資平臺雙方的協作,有助於臺灣從研發優勢,進一步成為全球產業的資本樞紐與技術整合中心。

培養人才、催化產業生態系,打造臺灣AI導向的護國群山

資本市場不僅吸引資金,更能留住全球頂尖人才。針對AI人才的培育與延攬,詹方冠提到政府採取「教育扎根」與「即戰力養成」雙軌並行,經濟部推動「AI新秀計畫」讓非AI工程背景的畢業生在一年內的培訓、實作後為企業所用。穩固本土人才根基後,目光也會轉向吸引國際人才,目前已修訂《外國專業人才延攬及僱用法》來招攬國際人才。

對內培養、對外延攬的策略,也與亞洲創新籌資平臺相輔相成。當國際AI企業或新創因籌資環境友善而選擇在臺掛牌、投資或設立據點,協助在地人才吸收世界級的實務經驗。更重要的是,資本市場的推動力將帶動AI職缺的薪酬競爭力,進一步吸引海外優秀人才來臺,或驅使旅外臺灣人才歸國發展,為臺灣創造具國際競爭力的高薪職位。

回顧過去十年,臺灣新創家數已擴增三倍,最後詹方冠強調,下一階段國發會的戰略將引導更多創新領域的企業朝向規模化成長。此目標不僅促成單一公司的成功,更期望讓AI、半導體、安控、次世代通訊等「五大信賴產業」產生群聚效應,進而打造科技創新的「護國群山」,藉此鞏固臺灣在全球供應鏈中的戰略地位。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓