不同語言不同價，AI鴻溝出現了？英文訓練成本最便宜，中文費用要貴2倍！|數位時代 BusinessNext

不同語言不同價，AI鴻溝出現了？英文訓練成本最便宜，中文費用要貴2倍！

牛津大學的一項研究顯示，從諸多語言模型的計費方式看，英語的輸入和輸出比其他語言還要便宜，成本差異導致形成AI鴻溝。

標記化導致成本差異，漢語輸出費用為英語2倍

成本的差異也間接導致英語使用者和世界其他語言使用者之間形成AI鴻溝。

成本差異主要是因數據標記化所帶來的。標記化就是將訓練文本分解成更小的單元，這個更小的單元就是標記（Token）。這是一個人工智慧（AI）公司將用戶輸入轉換為計算成本的過程。

研究顯示，使用英語以外的語言訪問和訓練模型的成本都更高。例如中文，無論是在語法上還是在字符數量上，都有更複雜的結構，從而導致更高的標記化（Token）率。

英語成本效益最高

舉例來看，基於OpenAI公司的GPT2模型，對於「國家不同，所得稅的結構是不同的，稅率和稅率等級也有很大的差異」這句話來看，在簡體中文處理中運用到了66個Token，在英語處理中僅用到了24個Token，而在撣語處理中使用到了468個Token。

就每次輸出所需的費用而言，漢語的成本是英語的兩倍。所以在AI相關的費用中，英語的成本效益是最高的。

當涉及到語言模型時，設計者的主要目標是實現低成本和高效功能之間的平衡。隨著AI領域的不斷發展，科技公司必須仔細考慮語言選擇對成本和可訪問性的影響。

這種成本差異促使中國、印度等國家紛紛開發自己的母語LLM項目。

本文授權轉載自：網易科技

責任編輯：蘇祐萱

從生成式AI訓練、推論，到代理式工作流程（Agentic Workflow）與未來的實體AI，資料流量正以指數級成長，讓記憶體從過去支援運算的配角躍升為決定AI效能與能源效率的關鍵角色。

全球知名的半導體與微電子技術分析機構TechInsights指出，AI競爭正逐漸從晶片算力擴展到記憶體架構設計能力，加速「Computational Memory」等新架構興起；在這波浪潮中，深耕記憶體與儲存技術數十年的美光科技，正與關鍵夥伴展開深度協同設計，包含攜手NVIDIA共同開發適用於新世代資料中心的低功耗記憶體技術，在AI基礎建設的新賽局中成為不可或缺的關鍵。

當GPU不再是唯一主角，記憶體為何躍上AI舞台中央？

過去，半導體的焦點多圍繞在晶片，例如CPU、GPU跟AI加速器等，市場普遍認為，晶片運算能力是左右科技產業發展速度的關鍵，但在進入生成式AI世代後，產業逐漸發現另一個事實：真正限制AI效能的瓶頸不是運算，而是資料能否快速被存取與傳輸。

從大型語言模型訓練，到AI推論、代理式工作流程（Agentic Workflow），甚至未來的機器人與自駕車，龐大的資料流量正持續推升對高頻寬、低延遲、高容量記憶體的需求，讓記憶體產業從過去相對標準化、以價格競爭為主的市場，逐漸轉變為AI基礎建設的重要核心。

「仔細觀察AI應用服務會發現，大多數工作負載都被頻寬限制。」美光科技全球業務執行副總裁Mike Cordano認為，記憶體是突破（頻寬）瓶頸的關鍵，也讓AI競賽從晶片算力升級到記憶體與儲存架構的系統級競爭。這樣的產業洞察，也正是Mike在歷經二十餘年的儲存產業資歷，加上四年半的創投生涯後，選擇加入美光的核心原因之一：在AI重塑產業結構的浪潮下，記憶體將成為這波成長最直接的動能所在。

從零組件供應商到策略夥伴，記憶體共創時代來臨

AI的崛起，正在改變記憶體廠商與客戶的關係。

過去，記憶體產品多是標準化元件，客戶關注的是價格、供貨與規格；合作模式也偏向短期採購與交易導向。然而隨著AI系統規模愈來愈大，從資料中心、雲端平台到終端裝置，記憶體已經成為決定系統效能的重要關鍵，也因如此，越來越多企業將記憶體視為「策略性資產」，而非單純零組件。

Mike表示：「現在，我們跟客戶合作的時間跨度改變了，在產品正式上市前三到四年便開始合作，從系統架構階段就共同規劃未來需求。」例如，美光科技與NVIDIA共同研發的資料中心所使用的低功耗記憶體，便是雙方提前多年展開深度合作（co-design）的成果。

值得特別注意的是，美光科技除從技術層面與晶片製造商等夥伴共創產品，也在需求層面與客戶進行密切合作，例如，將過去較無約束力、期限僅一年的長期協議（LTA）轉變成為期五年、條款更具約束力的策略性客戶協議（SCA），藉此掌握客戶的未來需求，進而在技術層面做更深度的合作。Mike坦言，深度協同設計是高成本的投入，美光的做法是先廣泛進行市場感知，理解不同場域的需求方向，再與生態系統中的夥伴們展開客製化合作。

從裝置導向轉為Token導向，AI浪潮重寫記憶體成長模式

除了合作模式改變，更大的典範轉移是需求的改變。

Mike解釋，過去記憶體需求跟PC、手機跟伺服器出貨量息息相關，但在AI新世代，推動記憶體需求成長的核心不再是設備數量，而是AI模型所產生的運算與資料消耗量。「AI產業逐漸走向以『Consumption』或『Token』為主的新經濟模式，每一次的模型運算都需要消耗大量的記憶體跟儲存資源，這意味著，即使設備銷量成長趨緩，記憶體需求仍可能持續上升。」

更重要的是，AI應用正從資料中心外擴至手機、PC、自駕車與機器人等場域，儘管不同場域對記憶體的需求不盡相同，但是，Mike認為：所有AI裝置都存在三項共同需求：更快的速度、更大的容量，以及更高的能源效率。

正如Mike在受訪時提到的：「我們最大的挑戰，是如何與客戶和整個生態系保持高度一致，一方面創造供給與產能，另一方面持續推動技術創新。」可以預期，在接下來的五年，記憶體產業面臨的挑戰不僅僅是擴展產能，而是如何與客戶共同規劃需求、同步投入技術創新，而這也是美光科技積極經營AI生態體系的原因。

總的來說，AI帶來的改變，不只是算力提升，而是重新定義整個運算架構：過去，記憶體被視為支援運算的基礎元件；現在，則是決定AI效能、能源效率與創新速度的關鍵資源；當產業競爭從晶片性能延伸到資料流動效率，從裝置數量轉向Token消耗量，記憶體的重要性也將隨之水漲船高，對美光科技來說，這將是其從供應商走向AI生態系核心夥伴的關鍵角色轉變。