華為AI全用抄的?旗下模型遭爆「套殼」通義千問:匿名員工發不自殺聲明,官方怎麼說?
華為AI全用抄的?旗下模型遭爆「套殼」通義千問:匿名員工發不自殺聲明,官方怎麼說?
2025.07.08 |

華為旗下的盤古大模型近日捲入一場震撼中國AI業界的抄襲爭議。2025年6月底,華為正式開源其盤古AI模型,聲稱為完全自主研發, 但隨即遭到匿名研究團隊HonestAGI指控涉嫌抄襲阿里巴巴的通義千問模型。

這起事件不僅引發技術層面的激烈辯論,更有華為內部員工匿名爆料,揭露模型開發過程中的「套殼」行為,並發布「不自殺聲明」,將爭議推向高峰。

而被指控抄襲的華為「諾亞方舟實驗室」,則於7月5日下午迅速發布聲明,強調盤古Pro MoE開源模型是基於昇騰硬體平台開發、訓練的基礎大模型,並非基於其他廠商模型增量訓練而來。

這場席捲中國AI界的抄襲事件,究竟有何來龍去脈?

HonestAGI的報告說了什麼?

2025年7月4日,一個名為HonestAGI的匿名研究團隊在GitHub發布技術報告,使用「模型指紋」技術分析華為盤古Pro MoE模型與阿里巴巴通義千問Qwen-2.5 14B模型的相似度。 該研究發現,兩個模型在注意力參數分布上的平均相關性高達0.927,遠超業界認為正常的0.7閾值。

HonestAGI團隊指出,深度學習模型的訓練具有高度隨機性,涉及複雜的數據採樣、權重初始化及優化路徑, 兩個模型在眾多注意力參數上呈現近乎一致的分布,其自然發生的概率極低。 更令人質疑的是,研究人員在盤古模型的開源代碼中發現了標注「Copyright 2024 The Qwen team, Alibaba Group」的版權聲明。

根據《新浪財經》報導,HonestAGI提出的「模型指紋」是一種通過分析各層注意力參數(Q、K、V、O投影矩陣)的標準差形成特徵簽名的技術。該方法具備三個特徵: 穩健性(Robustness,能在大量持續訓練後保留)、內在性(由模型架構自然產生)、以及簡單性(僅需對參數矩陣使用torch.std()計算)。

研究結果顯示,盤古模型與Qwen2.5-14B在QKV偏置分析中呈現幾乎相同的模式,早期層出現特徵性峰值後收斂,而這個設計被認為是Qwen 1-2.5代獨有的特色。

QKV偏差分析.jpg
QKV 偏差分析顯示,盤古模型與 Qwen2.5-14B 在三種投影類型(Q、K、V)上均表現出驚人的相似性。兩個模型都表現出幾乎相同的模式,尤其是在早期層的特徵峰值以及隨後的收斂行為方面。

若要用比喻解釋「特徵性峰值後收斂」的意思, 這就像是兩個人的心電圖顯示出幾乎一模一樣的波形模式,幾乎不太可能。而如果兩種模型都出現這種特色,可合理懷疑是否有抄襲的情況。

注意力參數(Q、K、V)是什麼?

在深度學習中,特別是Transformer架構的AI模型裡,有一個叫做「注意力機制」的關鍵技術。這個機制使用三個重要組件:

  • Q(Query,查詢):就像你在搜尋引擎中輸入的關鍵字。
  • K(Key,鍵值):就像資料庫中用來匹配的索引。
  • V(Value,數值):就像搜尋後得到的實際內容。

用一個簡單的比喻: 當你在網路上搜尋「晚餐食譜」時,「晚餐食譜」就是Q(你的查詢),網站上各種菜單的標籤就是K(鍵值),而實際的食譜內容就是V(數值)。

一篇6000字長文附「不自殺聲明」,讓抄襲說延燒全網

2025年7月6日凌晨,一名自稱華為諾亞方舟實驗室員工的匿名人士在GitHub發表題為《盤古之殤:華為諾亞盤古大模型研發歷程的心酸與黑暗》的6000多字長文。這位爆料者詳細披露了盤古大模型開發過程中的內部問題。

爆料者指出,當華為盤古與千問等國內競爭對手的差距越來越大時,由於內部質疑聲和領導壓力增大,團隊狀態幾乎陷入絕境。在這種情況下, 實驗室主任王雲鶴出手,通過「套殼」方式瞬間將各項指標平均提升了10個點左右。

根據原文,王云鶴及其小模型實驗室聲稱,盤古大模型135B V2是基於舊有的135B參數進行改造,並通過少量數據訓練,實現了指標的大幅提升。 然而,內部分析發現,實際上這個模型是以Qwen 1.5 110B為基礎進行續訓,並在此基礎上加層、擴展FFN維度,並加入盤古論文中的部分機制,最終湊足了135B的參數規模。

此外,這個新模型的層數、配置與舊版135B並不一致,且訓練完成後的參數分布與Qwen 110B極為相似,甚至連模型代碼的類名都未更改,仍為Qwen。這個所謂的135B V2模型後來還被提供給多個下游部門及外部客戶。

整體來看,文章揭示了華為內部在模型研發過程中存在將外部開源模型「套殼」後對外宣稱為自研成果的現象。

這位匿名爆料者在文末發布了引人注目的「不自殺聲明」,寫道:「寫了這麼多,某些人一定想把我找出來,抹殺掉。公司搞不好也想讓我噤聲乃至追責。如果真的這樣,我,甚至我的家人的人身乃至生命安全可能都會受到威脅。」

爆料者表示:「如果我消失了,就當是我為了真理和理想,為了華為乃至中國能夠更好地發展算力和AI而犧牲了吧」,並承諾會每日對外報平安以此自保。

華為官方回應:堅決否認抄襲指控

面對洶湧的質疑聲浪,華為旗下負責盤古大模型研發的諾亞方舟實驗室於7月5日下午迅速發布聲明。聲明強調盤古Pro MoE開源模型是基於昇騰硬體平台開發、訓練的基礎大模型,並非基於其他廠商模型增量訓練而來。

華為方面指出,盤古Pro MoE在架構設計、技術特性等方面做了關鍵創新,是全球首個面向昇騰硬體平台設計的同規格混合專家模型,創新性地提出了分組混合專家模型(MoGE)架構。實驗室還強調,開發團隊嚴格遵守開源許可證要求,在源代碼文件中清晰標註開源代碼的版權聲明。

華為方面質疑HonestAGI的「模型指紋」方法過於簡單粗暴,存在選擇性挑選數據的空間,且使用參數標準差來判定模型相似度並不科學。華為認為,相同參數量的MoE模型可能因架構約束產生相似曲線,不能僅憑相似曲線判定抄襲。

此外,華為強調該公司有足夠算力重新訓練大模型,沒必要套用Qwen的參數,並指出HonestAGI的研究缺乏大規模基準測試,核心假設缺乏權威文獻支撐。

延伸閱讀:「華為沒那麼厲害!」任正非坦承AI晶片落後美國一代:化合物半導體機會還更大

資料來源:新浪財經盘古之殇HonestyAGI諾亞方舟實驗室

責任編輯:李先泰

往下滑看下一篇文章
外送平台變軍師!foodpanda用數據當武器,殺進轉型顧問市場
外送平台變軍師!foodpanda用數據當武器,殺進轉型顧問市場

台灣餐飲業正面臨「三高」壓力——店租高、物價高、人力成本高。疫情後商圈景氣逐漸回流,店面需求攀升帶動餐飲業租金持續上揚;與此同時,根據行政院主計總處統計,台灣食物類物價自2021年起連續四年上漲,累積漲幅達13.98%;儘管2025年基本工資調漲4%,仍難以紓解餐飲業缺工困境,勞動部人力需求調查顯示,住宿餐飲業人力缺口估計高達24萬人。

面對嚴峻挑戰,餐飲經營者必須追求單位產出極大化,方能在有限資源下維持營運效益。對此,全台最大外送平台 foodpanda 憑藉每日百萬活躍用戶的數據優勢,透過精細化分析平台數據金礦,提出「極效經營」新思維,協助餐飲業者投入極小資源、創造極大效益,開啟可持續的經營新常態。

foodpanda拋出新極效思維,以數據洞察助攻極效經營

餐飲經營效益的關鍵,或許不只在於菜好不好吃。許多店家面對業績不振時,直覺反應往往是延長營業時間、加碼廣告投放或更換菜單,卻不一定能看到改善效果。攸關經營效益的問題,難道只能憑感覺判斷?

Foodpanda
圖/ 數位時代

foodpanda 商務總監簡紫涵指出,這些「憑感覺」的決策缺乏數據支持,所以適得其反。例如延長營業時間雖能多開放時段,但若缺乏消費需求,只是徒增人力與水電成本;顧客評價不佳,也未必完全與餐點味道相關,可能是包裝體驗造成印象扣分;為了衝業績而進行廣告投放,若沒有精準鎖定目標客群,流量依舊難以轉化為營收。

「工具不缺,缺的是以數據為基礎的問題意識與策略思維。」對此,foodpanda 率先提出「新極效思維」,將經營效益拆解為三個核心變數:人效、時段效、通路效,將平台累積的海量消費數據金礦轉換成深度洞察,以營運顧問的角色協助店家重新理解營收從哪裡來、何時來,以及如何放大,取代傳統的經驗式判斷。

集結產學資源,打造接地氣的數位轉型方案

從POS系統、訂單系統到報表介面,儘管數位工具普及,實際能將數據轉化為經營策略的餐飲業者卻少之又少。深耕台灣13年的 foodpanda,累積超過 10 億筆訂單,合作店家逾萬間,實地輔導過上千商家;平台所累積的數據不只包含訂單紀錄,也涵蓋消費者輪廓、消費頻率、地區飲食習慣、客群結構與品項偏好等,對多數中小餐飲業而言,都是難以自行蒐集的珍貴經營資產。

為了讓數據真正轉化為行動力,foodpanda 自2024年起組建百人商業顧問團隊,經過內部的商務學院專案分享、跨部門培訓與餐飲實戰演練,將平台 know-how 轉化為輔導實力。同時,foodpanda也攜手財團法人商業發展研究院以及 AMT 亞太行銷數位轉型聯盟協會,補強數位轉型方法論,針對不同餐飲業者量身打造成長方案,在台率先推出「餐飲錢力股計畫」,以「診斷-訓練-優化」三階段打造轉型模型:

  1. 數據認知期 :透過12題線上檢測,免費協助店家快速盤點經營現況,建立數據意識。
  2. 行為調整期 :針對檢測結果與平台分析,產出「客製化錢力數據報告」,內容涵蓋曝光數、轉換率、回購率、客群結構與市場趨勢,並由顧問解析機會點,制定行動方案,如新客優惠、廣告投放策略、商品組合優化等,並以月度、季度或半年度為單位持續追蹤與調整。
  3. 數據經營期 :透過「錢力股實戰坊」4小時濃縮課程與顧問小組,協助店家從認識數據、活用數據,到發展長期經營策略。
Foodpanda
圖/ 數位時代

簡紫涵指出,推動數位轉型的最大阻力往往來自「心態」。許多商家老闆秉持「東西好吃就好」的傳統觀念,對於改變現狀抱持疑慮。因此,foodpanda 顧問的角色不僅是提供數據分析,更要與店家並肩作戰,明確告知投入成本、執行時間與預期成效,並透過同業成功案例創造「跟進效應。」

而顧問服務的核心,則是將數據洞察落地為行動——從菜單設計、商品攝影到促銷搭配,確保流量變現。例如:北部一間便當店,新客轉換率低,經雙軌策略(新客優惠+廣告曝光)半年營收翻倍並展店;一間早餐店則在調整商品組合並搭配廣告後,成功帶動業績與客數雙成長;還有一間滷味店透過菜單 A/B 測試,成功提升高客單價品項的銷售比例。

不只是外送平台,foodpanda也是專業餐飲轉型顧問

外界談到外送平台,往往聚焦於抽成比例與外送服務,卻鮮少注意到,它們同樣能成為餐飲業的成長推手,就像 foodpanda 發起的「餐飲錢力股計畫」,為合作商家全面賦能、提供全額免費的顧問服務,除了客製化潛力數據報告,非合作商家也可透過12題線上檢測進行數位轉型健檢,並免費參加實體工作坊。

首波實戰坊將於9月啟動,首批輔導50間潛力商家,目標逐步擴大至每年1,000間,協助業者翻倍成長。「我們與餐飲業是互利共生,商家成長,我們才有長期合作的基礎。」簡紫涵強調,只要有改變意願且具成長潛力,合作商家皆能獲得顧問服務。

據統計,創業後三個月是餐飲業的存活關鍵期,奠定能否進入長期成長循環的基礎。「數位轉型不是少數大型商家的專利,而是餐飲業的新常態。懂得善用數據的店家會不斷成長,不懂的則可能被淘汰。」

不侷限於外送平台的角色,foodpanda 更願意擔起專業餐飲轉型顧問的責任,發揮數據力與企業影響力,讓餐飲業能站在巨人的肩膀上成長,從存活走向壯大,更帶動餐飲產業發展更上層樓。

立即領取專屬錢力報告

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓