AI模型「野蠻擴張」時代結束了?奧特曼:想進步不能再靠擴大規模,下步怎麼走?
AI模型「野蠻擴張」時代結束了?奧特曼:想進步不能再靠擴大規模,下步怎麼走?

4月18日消息,OpenAI的聊天機器人ChatGPT可謂是功能強大,引起了人們對人工智慧的極大興趣和投資。但該公司的CEO山姆·奧特曼(Sam Altman)認為,現有研究策略已經失效,未來的AI進步需要新的思路。

近年來,OpenAI通過將現有的機器學習演算法擴展到以前無法想像的規模,在處理語言方面取得了一系列令人印象深刻的進步。其最近開發的項目是GPT-4,據稱已經使用數兆字的文本和數千個強大的計算機晶片進行訓練,耗資超過1億美元。

但是,奧特曼表示,未來AI的進步不再依賴於將模型變得更大。在麻省理工學院的一次活動上,他說:「我認為,我們正處在一個時代的盡頭。在(即將過去的)這個時代,模型變得越來越大。現在,我們會在其他方面讓它們變得更好。」

奧特曼的表態意味著,開發和部署新AI演算法的競賽出現了出人意料的轉折。自去年11月推出ChatGPT以來,微軟就開始利用這一底層技術在其必應搜索引擎中添加了聊天機器人,Google也推出了名為Bard的競爭對手。許多人都迫不及待地嘗試使用這種新型聊天機器人來幫助完成工作或個人任務。

與此同時,許多資金充足的新創公司,包括Anthropic、AI21、Cohere和Character.AI等,正在投入大量資源用於構建更大的演算法,以努力趕上OpenAI的腳步。 ChatGPT的初始版本是基於GPT-3構建的,但用戶現在也可以接觸到功能更強大的GPT-4版本。

奧特曼的陳述也暗示,採用將模型擴大並提供更多數據進行訓練的策略後,GPT-4可能是OpenAI最後一項重大成果。不過,他沒有透露任何可能替代當前方法的研究策略或技術。在描述GPT-4的論文中,OpenAI表示,其估計表明,擴大模型規模的回報正在減少。奧特曼說,該公司可以建立的數據中心數量以及建設這些中心的速度也都受到物理限制。

Cohere的聯合創辦人尼克·弗羅斯特(Nick Frosst)曾在Google從事人工智慧研究,他表示,奧特曼所說的「不斷擴大模型規模並不是無限制的有效解決方案」是正確的。他認為,針對GPT-4和其他transformers類型(transformers直譯為轉換器,而GPT是Generative pre-trained transformers的簡寫,意思是基於轉換器的生成式預訓練模型)的機器學習模型,進展不再只是靠擴大規模。

弗羅斯特補充說:「有很多方法可以讓transformers變得更好、更有用,而且很多方法都不涉及給模型增加參數。新的人工智慧模型設計或架構,以及基於人類反饋的進一步調整,都是許多研究人員已經在探索的前進方向。」

在OpenAI的語言演算法家族中,每個版本都由人工神經網絡組成,這個軟體的設計靈感來自於神經元之間相互作用的方式,經過訓練後,它可以預測應該跟隨在給定文本字符串後面的單詞。

2019年,OpenAI發布了其第一個語言模型GPT-2。它最多涉及到15億個參數,這一指標能夠衡量神經元之間可調整的連接數量的大小。這個數字非常大,這在某種程度上要歸功於OpenAI研究人員的發現,擴大規模使模型變得更加連貫。

2020年,OpenAI推出GPT-2的後繼者GPT-3,該模型規模更大,參數高達1750億個。 GPT-3在生成詩歌、電子郵件和其他文本方面具備廣泛能力,這令其他公司和研究機構相信,他們可以將自己的AI模型擴展到與GPT-3類似甚至更大的規模。

去年11月,ChatGPT首次亮相後,表情包製造者和科技專家猜測,當GPT-4問世時,它將是個擁有更多參數、更為複雜的模型。然而,當OpenAI最終宣布新的人工智慧模型時,該公司沒有透露它有多大,也許是因為規模不再是唯一重要的因素。在麻省理工學院的活動上,奧特曼被問及GPT-4的培訓成本是否有1億美元,他回答說:「不止如此。」

儘管OpenAI對GPT-4的規模和內部工作原理保密,但很可能它已經不再僅僅依賴於擴大規模來提高性能。有一種可能性是,該公司使用了名為「強化學習與人類反饋」的方法,用於增強ChatGPT的能力,包括讓人類判斷模型答案的質量,以引導它提供更有可能被判斷為高質量的答案。

GPT-4的非凡能力讓許多專家感到震驚,並引發了關於AI改變經濟潛力的辯論,以及其可能傳播虛假訊息和製造失業的擔憂。許多企業家和AI專家最近簽署了一封公開信,呼籲暫停開發比GPT-4更強大的模型6個月,其中包括特斯拉執行長伊隆·馬斯克。

在麻省理工學院的活動中,奧特曼證實,他的公司目前沒有開發GPT-5。他補充說:「這封公開信的早期版本聲稱OpenAI正在訓練GPT-5。實際上我們並沒有這樣做,短期內也不會。」

本文授權轉載自:網易科技

責任編輯:傅珮晴、錢玉紘

關鍵字: #ai人工智慧
往下滑看下一篇文章
深根台灣35年!KLA頂尖技術和人才, 如何引領全球半導體未來?
深根台灣35年!KLA頂尖技術和人才, 如何引領全球半導體未來?
2025.09.01 |

2025年是KLA在台灣成立的第35年。這家來自美國的半導體檢測和量測設備領導企業,在全球擁有15,000多名員工,2024年營收達109億美元,專精於晶圓製造中最關鍵的檢測與量測技術。在AI驅動半導體製程要求日趨嚴苛的今天,KLA正扮演著「良率守門員」的關鍵角色,其先進檢測技術的重要性也反映在與客戶的緊密合作關係上—在台積電2024年供應鏈管理論壇中,KLA憑藉卓越的技術協作與生產支援能力,榮獲「Excellent Technology Collaboration and Production Support Awards」肯定,展現了其在半導體製程控制的技術領導地位。

KLA Senior Vice President暨KLA台灣總經理Rollin Kocher強調:「KLA的競爭優勢源自於我們對技術卓越與品質的不懈追求。在AI晶片製造需求比以往更為復雜的時代,客戶尋求的不僅僅是設備,而是能夠協助他們迎接未來挑戰的技術夥伴。」

1990年在新竹起步,到成為全球最大的客戶服務據點之一,KLA台灣35年來以技術深度結合企業韌性,創造了超越市場預期的競爭優勢。35年來,KLA台灣的成功並非偶然,而是在技術突破、客戶協作與人才文化三個面向上的持續深耕,逐步建構起難以撼動的競爭優勢。

從技術突破開始,KLA台灣35年創新不輟的秘密

過去35年,KLA台灣的核心競爭力始終建立在對先進製程控制技術的深耕與創新。隨著AI晶片節點逼近原子尺度,並大量導入2.5D/3D與異質整合封裝架構,單靠傳統光學或電子束檢測已難以掌握奈米級變異。KLA透過將機器學習與AI演算法深度整合到缺陷檢測、復判、量測與製程數據分析平台,協助晶圓廠在關鍵步驟即時定位並分類缺陷,進而提升高效能AI晶片的良率、時脈與功耗表現。

1756695098037.jpg
KLA在先進製程控制技術持續突破與創新,建構難以撼動的市場競爭優勢。
圖/ KLA

面對先進封裝市場的快速擴張,以及AI應用逐漸從雲端延伸至行動與邊緣裝置的趨勢,KLA亦結合etch、PECVD、PVD等晶圓處理設備與完整製程控制解決方案,橫跨前段製造、晶圓級封裝到組裝與基板製造,成為客戶實現下一代AI晶片與系統級封裝藍圖不可或缺的技術合作夥伴。

不只是供應商,KLA如何與客戶建立35年夥伴關係?

KLA台灣TSMC事業群總經理Hawk Wu分析,技術領先、高績效團隊與堅持不懈的企業精神是保持領先的三大關鍵。35年來,KLA與客戶建立的不僅是供應商關係,更是技術夥伴關係。顧客堅定信任,讓雙方即使在全球級難題下也能合作突破,團隊與客戶連月努力終攻克技術難關。這種客戶夥伴關係的深度讓KLA能更精確感知市場需求,開發「真正符合客戶需要」的技術解決方案。

留住人才35年,KLA台灣的企業文化有何特別?

在KLA的發展歷程中,企業文化是最核心的競爭優勢。公司的五大核心價值包括堅持不懈(Perseverance)、積極進取(Drive to Be Better)、高效團隊(High Performance Teams)、誠實正直一致性(Honest, Forthright and Consistent)與不可或缺(Indispensable for Customers)。完善的人才發展機制也確保優秀員工在組織內多元發展。技術人才可跨產品業務、技術支援、市場銷售、應用製程或軟體研發等多樣選項,培育與傳承是競爭力關鍵。這樣的人才文化,造就今日KLA穩定的核心戰力和優質的團隊環境。

35年後的今天,KLA台灣已成為亞太區最具規模的技術研發與支援基地之一,與台灣半導體產業建立了深度的合作夥伴關係,服務範圍跨足晶圓代工、記憶體及特殊製程,穩居檢測量測領域領導者。

1756695099391.jpg
KLA以完善的人才發展機制培育優秀人才多元發展,造就穩定的核心戰力。
圖/ KLA

新世代共鳴:價值驅動與職涯歸屬感

June Yeh是KLA的應用開發工程師,從材料科學系畢業後直接加入KLA。June特別認同KLA的企業文化:「同事們都專注於技術本業,我們可以把精力完全用在解決問題和創新上,這種單純的工作環境讓我能夠專心發揮專業能力。更重要的是,公司真正實踐『堅持不懈』的價值觀,即使面對困難的技術挑戰,團隊也會一起堅持到底。」

另一位應用工程師Bryan Fu則從不同角度分享他的觀察。這位清大材料科學系畢業、曾在其他大規模的半導體製造商任職過一年半的工程師直言:「很多公司新人都要自己想辦法學習,但在KLA台灣完全不同,主管很願意跟員工分享市場現況和產品及客戶的訊息,這種開放的資訊分享讓新人成長很快。」

在近期的員工滿意度調查結果,目標設定、團隊關係、主管支持、成長學習和包容等領域獲得KLA台灣的員工高度認可。這種積極投入的工作文化,成為KLA廣納頂尖人才的重要因素。

「在KLA,每位員工都專注於解決複雜且深刻的問題。」Rollin Kocher表示,「兼具深厚專業基礎與以客戶導向的服務模式,正是我們與眾不同的關鍵優勢—也是難以複製的核心競爭力。」

延伸對談:KLA台灣的實務觀察

Q:什麼樣的人才是「核心戰力」?

A:我們需要能「同時理解技術與理解人」的人。KLA的應用工程師角色需直接面對全球頂尖半導體客戶以解決複雜問題,也要用服務業心態應對現場變化,兼具「高科技」和「服務業」的雙重能力。

Q:為何KLA有同甘共苦的工作氛圍?

A:我們相信團隊合作,在關鍵專案的緊要關頭,整個團隊包括高階主管都會全力投入,大家共同迎戰挑戰。久而久之,KLA內部形成高度互信、互助文化。

35年的厚度,為下一個世代蓄力

經歷技術突破、客戶信任、人才文化三大核心競爭力淬煉,KLA台灣已為AI時代的半導體升級打下厚實基礎。對不同世代的科技人才而言,這裡是實現技術理想與職涯發展的最佳舞台。

值此35週年,KLA台灣即將啟用台灣總部新竹辦公室與全球最大訓練中心。同時,持續積極招募設備客服、製程應用、產品裝機、演算法、系統和軟體工程師!詳情請關注KLA CAREERSKLA台灣Facebook專頁

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓