DeepSeek解析1|神秘AI公司掀起全球AI風暴,一篇看懂553天關鍵布局
DeepSeek解析1|神秘AI公司掀起全球AI風暴,一篇看懂553天關鍵布局

2025年開年沒多久,中國AI公司DeepSeek(深度求索)發布低成本AI模型DeepSeek,讓全世界都嚇了不小一跳:在受到美國牽制的背景下,這家神秘AI公司究竟是如何利用有限的資源,做出性能不輸OpenAI的AI模型?本篇文章回顧DeepSeek從成立到發布DeepSeek R1的553天,究竟經歷了什麼?

1月13日,彭博資訊(Bloomberg)專欄作家、美國喬治梅森大學經濟學教授柯恩(Tyler Cowen)發表一篇文章,談及中國在拜登政府嚴格禁止AI晶片隊中國出口的環境下,仍然能夠創造出與知名的ChatGPT、Claude等模型不相上下的大語言模型。

柯恩在文章提及「DeepSeek V3」,經過他使用好幾天後,認為這是幾年來他用過的眾多大語言模型(LLM)中,可以名列前茅的LLM。

DeepSeek V3速度快、好用,而且有免費版。雖然在對於精深或困難問題的回應,DeepSeek V3還比不上美國的頂尖LLM,不過柯恩仍然把它列入第一流,包括一些測試人員,很多人也都認為DeepSeek V3表現傑出。

DeepSeek_shutterstock_2577325425.jpg
圖/ shutterstock

DeepSeek-V3這款參數高達6,710億的大語言模型,在預訓練階段(pre-training,指在一個較小的、特定任務的數據集上進行微調fine-tuning之前,先在一個大數據集上訓練模型的過程)只用了55天,使用2048張H800 GPU叢集,費用僅557.6萬美元。這對動輒必須耗資數十億美元訓練大語言模型的美國先進AI公司而言,無異是敲出一記警鐘。

以往開發大語言模型需要龐大的資源,必須購買數量龐大的AI伺服器,建立人數眾多的研發團隊,因此投入資金從數十億美元起跳。

如今大語言模型投入的資源可大幅降低,這將會有更多的公司投入大語言模型的開發,尋求新的商機。

柯恩這篇專欄發表後,市場淡然處之,不知之後「風暴」將起。

DeepSeek開源、便宜、性能佳,讓全球瘋狂下載

1月20日川普就任美國總統,DeepSeek於同一天發布他的推理模型「DeepSeek R1」,這個模型與Open AI的o1的性能相距不遠,互有高下。

DeepSeek R1的使用價格較o1便宜很多,每百萬輸入Token為0.14至0.55美元,而o1每百萬輸入Token為7至15美元。DeepSeek R1每百萬輸出Token為2.19美元,o1每百萬輸出Token為60美元。

DeepSeek R1 與 OpenAI o1成本比較

模型 輸入價格 (每百萬Token) 輸出價格 (每百萬Token)
DeepSeek R1 0.14-0.55美元 2.19美元
o1 7-15美元 60美元

DeepSeek R1開始在全球廣受注意,在很多地區AI類App的下載次數名列前茅,短短數星期,目前累積下載次數超過1,800萬次。

DeepSeek R1、V3皆是開源模型,使用者可自由下載模型,然後安裝在自己的終端設備上,個人電腦加裝高階的圖形顯示卡後,即可將DeepSeek R1或DeepSeek V3安裝在電腦上自己運作。

DeepSeek創辦人「洞燭先機」,3年前就開始研發LLM及採購輝達GPU

DeepSeek是中國AI公司DeepSeek(深度求索)推出的AI模型,背後是一家利用AI進行投資的對沖基金「幻方量化」(High-Flyer)所設立。該公司積極研發機器學習、深度學習等建立AI進行金融操作,共同創辦人是現年40歲的梁文鋒與其2位浙江大學同窗。

幻方量化的AI模型非常成功,因此能在金融市場獲得豐碩的報酬,2022年ChatGPT問世後,梁文鋒應該注意到AI新時代來臨,推想他應該已經在幻方量化公司內開始研發大語言模型,並且採購輝達的GPU。

延伸閱讀:
黃仁勳是DeepSeek暴紅推手?為何輝達寧可「便宜AI」崛起,也不願放棄中國市場?

DeepSeek 553天關鍵布局

2023年7月17日,幻方量化成立DeepSeek,招募100多位博士生、碩士生、大學剛畢業、或畢業一兩年的青年。重點是這些員工是成績名列前茅,並且有在國外知名期刊發表過論文的紀錄。

2023年10月28日,DeepSeek成立僅3個多月,旋即發表DeepSeek-Coder,這是DeepSeek的第一個大語言模型。

1個月後、也就是11月29日,DeepSeek發表DeepSeek-LLM。

2023年12月15日,DeepSeek發表DreamCraft3D,這是一個3D生成模型。

成立短短5個多月,DeepSeek發表4個大語言模型,成就相當驚人。

進入2024年,DeepSeek在技術更加精進,發表出性能更佳的大語言模型。

2024年1月11日,DeepSeek發布DeepSeek-MoE,這是個「混合專家模型」,效能超越Llama 2-7B,且計算量降低60%。

2024年2月5日,DeepSeek發布DeepSeekMath,DeepSeekMath在競賽級「MATH基準」測試中取得了51.7%的優異成績,效能接近Gemini-Ultra和GPT-4的水準。

2024年3月11日,DeepSeek發布DeepSeek-VL。

2024年5月,DeepSeek發布MoE大模型DeepSeek-V2,該模型為開源,不僅公開技術內容,並且可讓大家自由下載模型。DeepSeek-V2的API定價為每百萬Tokens輸入人民幣1元、輸出人民幣2元,價格僅為GPT-4 Turbo的百分之一。

2024年6月17日,DeepSeek發表DeepSeek-Coder-V2。DeepSeek-Coder-V2在程式設計和數學基準測試中表現優異,超越了GPT4-Turbo、Claude 3 Opus和Gemini 1.5 Pro等模型。

2024年8月16日,DeepSeek同時發布DeepSeek-Prover-V1.5和DeepSeek-Prover-V1。

2024年9月5日,DeepSeek 宣布合併 DeepSeek Coder V2 和 DeepSeek V2 Chat 兩個模型,升級推出全新的 DeepSeek V2.5 新模型。

2024年11月20日,DeepSeek 發布 DeepSeek-R1-Lite,這是DeepSeek第一個推理模型,是DeepSeek-R1的先行版。

2024年12月13日,DeepSeek發布用於高級「多模態理解的專家混合視覺語言模型」DeepSeek-VL2。

2024年12月26日,DeepSeek發布DeepSeek-V3,這也是開源模型。DeepSeek-V3的評測成績超越Qwen2.5-72B和LLaMA 3.1-405B等開源模型。與GPT-4o、Claude 3.5-Sonnet等閉源模型性能相抗衡。

2025年1月20日,發布DeepSeek-R1開源模型,在數學、代碼、自然語言推理等任務上,效能與OpenAI o1正式版相當。

2025年1月27日,發布多模態大模型Janus-Pro

DeepSeek「無懼禁令」,俄羅斯、伊朗也能循DeepSeek模式?

DeepSeek的模型能夠受到西方世界的注意及使用,主要是直接可在線上透過App或網站下載,不像其他中國開發的大語言模型必須與微信等綁定。

DeepSeek在2024年共發布10個大語言模型,最後發表的DeepSeek-V3獲得美國AI產業界的重視,讓大家見識到運算資源受限的中國,也能用相對較少的資金,開發出性能優越的大語言模型。

其他受美國管制AI晶片出口的國家(如俄羅斯、伊朗、巴基斯坦等),或許也能夠循此模式,開發出類似的大語言模型。

DeepSeek.jpg
DeepSeek是由中國對沖基金「幻方量化」(High-Flyer)於2023年成立的新創公司,對此獨立科技新聞記者高燦鳴(Tim Culpan)指出,Deepseek的突破性進展,「可歸功於其獨特的量化背景。」
圖/ shutterstock

進入2025年,DeepSeek於1月20日發布DeepSeek-R1模型,這也是開源模型。DeepSeek-R1在數學、代碼、自然語言推理等任務上,效能與OpenAI o1正式版相當。

DeepSeek-R1發布後效應擴大,讓許多人懷疑,將來建立大語言模型時不需要像之前一樣部署大量的GPU,導致1月28日輝達股價大跌17%。

2025年1月27日,DeepSeek發布多模態大模型Janus-Pro。

最後我們談DeepSeek-V3最後一次預訓練僅用55天、2048塊H800 GPU叢集,耗資557.6萬美元。這是DeepSeek-V3最後一次預訓練所使用的資源,實際上DeepSeek的算力資源遠大於此。

根據SemiAnalysis網站的資料,DeepSeek可運用的算力資源有A100 1萬張、H20 3萬張、H800 1萬張、H100 1萬張。這些GPU應該是幻方量化在2021年起就開始購買的,推測A100是禁令前購買,H800、H20應該是合法購買,因它們是為中國市場生產的降規版GPU。

這些GPU加上組裝成伺服器及營運成本4年預估總共約25.73億美元,因此DeepSeek雖然開發成本遠低於OpenAI等大咖,但是仍須25.73億美元,可見開發大語言模型是資金與腦力密集的投資。

延伸閱讀:DeepSeek解析2|輝達高階GPU成長因它放緩,「邊緣AI」將加速成長

關鍵字: #AI
往下滑看下一篇文章
看見「電話」的數位轉型契機:有河科技3大優勢,打造AHOY雲端總機服務
看見「電話」的數位轉型契機:有河科技3大優勢,打造AHOY雲端總機服務

數位轉型人人都在談,但你有想過,辦公室裡那支「電話」,升級了嗎?

隨著數位轉型成為企業生存的基本功,中小企業紛紛導入各式雲端服務,包括 ERP、CRM 到協作平台等,卻常常忽略最基本、卻最高頻的工具——通訊系統。事實上,當行動、遠距與多據點辦公成為常態,傳統總機不僅建置與維護成本高、佈線不易,更無法滿足企業靈活運作的需求,成為數位轉型中最容易「卡關」的一環。

也因此,雲端總機迅速崛起,成為企業溝通的新基礎設施。它不只是把「打電話」這件事搬上雲,更讓企業擁有隨時、隨地、跨裝置的溝通能力,真正落實以效率為核心的數位轉型。

很早便洞察此一趨勢的有河科技,以自行研發的 AHOY 雲端總機服務切入市場,短短幾年內便累積近 3,000 家企業用戶,其中高達六到七成來自客戶主動推薦——顯示其服務品質與系統穩定性深受用戶肯定。2025 年上半年,營收更較去年同期成長 16%,在競爭激烈的 B2B SaaS 市場中穩步擴張,展現出強勁的產品實力與市場潛力。

從底層架構開始,打造真正為中小企業而生的雲端總機

提及當初切入雲端總機市場的原因,其實是有河科技創業團隊從實務觀察出發,轉化為產品創新的成果。

「父親本來就在電信領域,而我們一家都有宅男基因,兄弟三人從小就對寫程式很有興趣。」有河科技創辦人 Hank 開玩笑的說,也因此創業初期便以異業合作開發模式,雖能發揮電信系統專長、案件金額相對高,卻也受限於合作方技術本身的瓶頸,或是發展方向的不一致。

為此,有河科技開始思考下一步發展,「我們想跳脫客製化電信系統開發的框架,打造能直接面對市場與客戶的產品。」Hank 坦言,這樣的想法促使他們決定結合父親多年來在電信領域累積的經驗,切入雲端總機領域,發展可長期經營的 SaaS 服務。

有河科技02.JPG
有河科技 Hank
圖/ 有河科技

有河科技另一位共同創辦人 Henry 進一步說明,當時市場上雖已有部分業者推出雲端總機服務,但多半是傳統電話總機的延伸應用。這些業者將國外第三方開源軟體整合至自家的電話交換機產品中,讓客戶可以透過手機接聽公司電話。

「但這些廠商本身擅長的是硬體,不具備軟體開發能力,無法提供完整、穩定的雲端解決方案。」Henry 說,更關鍵的是,企業仍需購買硬體交換機與佈線,才能使用行動分機、內外線錄音等雲端總機功能。「這對新創公司或小微型企業其實很不友善。」Henry 坦言,許多中小企業其實只是希望客戶來電時,可以有一段簡單的語音歡迎詞,建立專業形象,但傳統總機高昂的設備與維運成本,卻讓這些簡易需求難以實現。

有河科技03.JPG
有河科技 Henry
圖/ 有河科技

正因如此,有河科技決定從底層架構開始出發,打造一套高品質、易上手且低成本的雲端總機服務,企業不必添購任何硬體設備,也無需佈線,透過 app 或瀏覽器就能即時接聽與撥打公司電話,實現真正的雲端通訊轉型。

為了實現此一理念,有河科技從底層架構到前端應用,皆選擇自行研發,並在過程中建立起三大關鍵優勢,成為其在市場中脫穎而出的基礎。

優勢1》從硬體到軟體的一條龍架構,確保通訊品質

「建構一套語音系統並不難,難的是讓它穩定、清晰、不中斷,」有河科技共同創辦人 Ian 舉例指出,通話中偶爾出現的海浪聲、波浪聲等,不是單靠軟體就能解決,必須有足夠的電信產業 Know-how 和技術,才知道如何排除問題。

有河科技植基於一代在電信領域的技術、經驗與人脈,結合新一代的軟體開發工程概念,不僅奠定自身在雲端通訊系統的穩固基礎,更能打造從伺服器、後台到前端 app 的一條龍架構,確保每一個環節都能做到最佳化整合。

這種從基礎建設到應用層的全面掌控,不只是技術整合能力的展現,更讓有河科技在眾多雲端總機服務中,建立起一道高品質、高彈性的競爭壁壘。

優勢2》從零打造前端 app,用戶需求即產品動力

在前端 app 上,有河科技選擇從底層開始重新構建 app,而非像多數同業僅使用既有開源軟體或代理第三方軟體,確保未來在功能擴充與版本更新上的自主性與彈性。

「我們很多功能其實都是客戶給的建議,」 Ian 分享,只要客戶提出功能需求,內部就會評估是否具有普遍性,若評估後發現可以滿足八成以上客戶的使用需求,就會主動投入開發並進行系統更新,提供給所有客戶使用。

這種用戶驅動的產品設計思維,不僅讓功能更貼近實務需求,也讓有河科技可以將開發資源集中在最具價值的地方,持續強化系統的共用性與延展性,打造出真正能隨企業成長而調整的雲端通訊平台。

優勢3》彈性 API 整合,支援多元通訊情境

有河科技的軟體研發能力,不只能夠與時俱進的更新產品,還能根據企業需求彈性整合 CRM 等各種系統或客製化開發特殊服務,打造多元化通訊場景。

舉例來說,外送或代駕媒合平台希望提供號碼遮罩(Number Masking)機制,保障司機與用戶的個資安全,有河科技便為此進行開發,當司機在與客戶聯繫時,客戶手機上只會顯示公司的代表號,之後若客戶回撥,AHOY 也能將來電導至接單司機,達到保護隱私又不中斷溝通的雙重目標。

又或是與 LINE API 整合,可以將既有官方帳號商家的通話,直接升級成專業雲端總機系統等級、甚至可以一併介接各家不同特色的 AI 文字客服以及 AI 語音客服,即時產生逐字稿並進行服務品質情緒分析。

在許多企業還將總機視為「基礎設施」時,有河科技早就運用 AHOY 雲端總機服務,重新定義企業與客戶、內部團隊之間的溝通方式。

隨著企業通訊越來越重視彈性與效率,有河科技運用 SaaS 模式與與技術實力,悄悄搶下這波通訊革新的先機。未來,有河科技將聚焦在 WebCall 網頁電話整合介接與 AI 客服兩大應用場景,不僅讓用戶能在 LINE 官方帳號或網站上直接使用 AHOY 通話,也希望藉由異業合作導入更多元 AI 應用,提升服務效率與回應品質,打造更聰明、更好用的智慧通訊平台。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓