GPT-4超強的「PR90」成績嚇到人類!但OpenAI警告:還是有兩大缺陷
GPT-4超強的「PR90」成績嚇到人類!但OpenAI警告:還是有兩大缺陷

今天凌晨,OpenAI公佈了其大型語言模型的最新版本——GPT-4。該公司表示,GPT-4在許多專業測試中表現出超過絕大多數人類的水平。

具體而言,GPT-4實現了以下幾個方面的飛躍式提升:更聰明,答題水平越來越好;支持圖像輸入,擁有強大的識圖能力,但目前只限內部測試;更長的上下文,文字輸入限制提升至2.5萬字;回答準確性顯著提高;更安全,有害資訊更少。

對於普通人而言,如何理解GPT-4到底有多強多聰明?

據OpenAI透露,GPT-4通過了所有基礎考試而且是高分通過。例如,GPT-4在模擬律師資格考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數學考試中排名前11%左右。相比之下,曾經令人震撼的GPT-3.5 ,真實得分在倒數10%左右,GPT-4的強大已經可想而知。

ChatGPT4
圖/ 微軟

有網友評論,「如果真跟報告說的那樣就太可怕了,我感覺能力已經遠超我了。」也有人笑稱,「我躺好了!我生在了適合我的時代!」

最多的聲音則是對未來工作不保的擔憂,「還有哪個行業可以不被替代?」「消除任何幻想,AI時代橫掃全球,先思考下GPT-4不能做但你能做的。」

比以前的版本「更大」,或許也更燒錢

OpenAI稱,GPT-4比以前的版本「更大」,這意味著其已經在更多的數據上進行了訓練,並且在模型文件中有更多的權重,這使得它的運行成本更高。

同時,OpenAI並未公佈這個模型的參數量有多少。

OpenAI表示,它使用的是微Azure訓練模型,微軟已經向這家新創公司投資了數十億美元。 OpenAI沒有公佈具體模型大小的細節,也沒有公佈用來訓練模型的硬件,理由是「競爭情況」。

目前,此領域的許多研究人員認為,人工智能領域的許多最新進展,都來自於在數千台超級計算機上運行越來越大的模型,這些模型的訓練過程可能耗資數千萬美元。

為了不斷提高GPT-4性能,OpenAI還為其研發大搞「基建」。

在過去的兩年裡,OpenAI重建了整個深度學習堆棧,並與Azure一起為其工作負載從頭開始設計了一台超級計算機。一年前,OpenAI 在訓練GPT-3.5時第一次嘗試運行了該超算系統,之後他們又陸續發現並修復了一些錯誤,改進了其理論基礎。這些改進的結果是 GPT-4的訓練運行獲得了前所未有的穩定。

OpenAI聯合創辦人兼總裁格雷格·布羅克曼(Greg Brockman)表示,OpenAI預計,未來將由投資十億美元超級計算機的公司開發尖端模型,一些最先進的工具將帶有風險。 OpenAI希望對他們工作的某些部分保密,以給新創公司「一些喘息的空間,以真正關注安全並做好它。」

延伸閱讀:GPT-4「考大學」成績贏過90%考生!34項考試都名列前茅,人類怎麼辦?

侷限性明顯,GPT-4仍然不完全可靠

儘管功能已經非常強大,但 GPT-4仍與早期的 GPT 模型具有相似的侷限性,其中最重要的一點是它仍然不完全可靠,也就是還有可能胡說八道。

OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。該公司表示:「GPT-4仍有許多已知的侷限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。」

總的來說,GPT-4相對於以前的模型(經過多次迭代和改進)已經顯著減輕了幻覺問題。在 OpenAI 的內部對抗性真實性評估中,GPT-4的得分比最新的 GPT-3.5模型高40%。

同時,GPT-4訓練數據還是截止到2021年9月份。這也意味著,GPT-4對於這個時間點以後的資訊,缺乏足夠的了解,也不會從其經驗中學習。

在GPT-4發布之後,OpenAI創辦人阿爾特曼發推文表示:「它仍然是有缺陷的,仍然是有限的,在你花了更多的時間第一次使用它時,它似乎比實際情況更令人印象深刻。」

中國的ChatGPT們要怎麼追?

最令人震驚的在於,按照 demo 視頻裡 OpenAI 工程師們的說法,GPT-4的訓練在去年8月就已經完成,剩下的時間都在進行微調提升,以及最重要的去除危險內容生成的工作。

這也意味著,OpenAI 內部技術,比大家想像中的領先外界更多年。更可怕的是,OpenAI還一口氣開放了API接口和相關論文!這讓中國的ChatGPT們還怎麼追?

英諾天使基金合夥人王晟曾告訴《態℃》欄目,「中國的ChatGPT們即便奮起直追,靜態來講也許兩三年能追上,我認為已經很樂觀了。」

但隨著更強大的GPT-4發布,OpenAI 的技術能力顯然仍在不斷進步,且進展速度遠比我們追的速度還要快。王晟在之前的採訪中判斷,「除非這件事突然遇到了一個瓶頸,整個科技發展方向到頭了,對方不得不停下來,或許我們還有機會追平,或者我們挖掘到一種新的技術路徑有機會追上,不然可能沒有機會了。」

與此同時,在該模型的落地和應用方面,OpenAI也有了最新進展。

新模型將提供給ChatGPT的付費用戶,也將作為API的一部分提供,允許程序員將AI集成到他們的應用程序中。 OpenAI將對750字左右的指令資訊收費3美分,對750字左右的響應資訊收費6美分。

OpenAI還介紹,摩根士丹利正在使用GPT-4來組織數據,而電子支付公司Stripe正在測試GPT-4是否有助於打擊欺詐。其他客戶還包括語言學習公司Duolingo、Khan Academy和冰島政府。 OpenAI合作夥伴微軟週二表示,新版必應搜尋引擎將使用GPT-4。

GPT-4取得的成績令人興奮,但對於還在起跑線上的中國ChatGPT們,還有大量的工作要去探索和研究,想必感受到了巨大的壓力。風浪越大魚越貴,對於這些迅速進入這個新領域的公司來說,也將會擁有巨大的機會。

GPT-4的強大告誡我們,未來唯一限制的因素,就是你的想像力!

本文授權轉載自:網易科技

責任編輯:傅珮晴、錢玉紘

往下滑看下一篇文章
從台流轉型到跨界共創,2025亞洲新媒體高峰會以「RESILIENCE:韌性 · 突圍」驅動產業續航
從台流轉型到跨界共創,2025亞洲新媒體高峰會以「RESILIENCE:韌性 · 突圍」驅動產業續航

全球影視娛樂正處在結構翻轉的臨界點。從串流平台的競合與權力再分配,到生成式AI引爆的創作革命,再到觀眾注意力被碎片化的內容浪潮瓜分,市場規則幾乎在一年之內重寫。

在這樣的動盪中,「如何永續成長」成為所有內容產業的共同焦慮。台灣擁有豐沛的創作能量,卻在規模化與國際化的路上,始終面臨結構性瓶頸。為了回應時代考驗,NMEA(新媒體暨影視音發展協會)以「RESILIENCE:韌性 · 突圍」為題,將於11月24日至25日舉行2025亞洲新媒體高峰會,邀請超過五十位國內外產業領袖對話,從組織、內容、技術與商業模式出發,探討如何讓台灣影視娛樂在不確定中,創造屬於自己的續航動能。

韌性,從衝擊中找到成長的可能

「Resilience」一詞原本源自工程學,指材料在受壓後能回彈的能力。NMEA理事長李芃君指出,當這個詞被用於產業時,它所代表的已不只是「抗壓」,而是「擁抱變化與永續成長」的能力——在巨變中快速重組關鍵資源、甚至藉由創新找到新的突破。

她觀察,全球產業變動的背後,主要受到三股力道的衝擊:地緣政治的風險、科技典範的轉移,以及氣候與疫情等帶來的自然挑戰。這些因素同樣影響著台灣文化內容產業。

以台灣一家全球背光模組大廠為例。近年隨著國際電子品牌紛紛在筆電與平板產品導入OLED顯示技術,傳統背光模組市場面臨挑戰;該企業在察覺趨勢轉向後,選擇主動調整策略,透過併購前沿技術快速推出新產品,切入車用、醫療與AR/VR顯示等新領域。李芃君指出,這樣的轉向即是韌性的展現——在技術更迭的浪潮中重新定位自己,讓企業從被動防守,轉為開創下一波成長曲線。

「這種思維放回影視娛樂也一樣。當市場被新技術和新平台顛覆,產業若仍困於單一市場、單一資金、單一合作關係,就難以應對下一次衝擊。」她強調,建立韌性不能停留在抽象的口號,必須要有具體行動,而關鍵就在「多角化」。

多角化的市場讓故事能走出台灣、觸及不同文化的觀眾;多角化的技術與人才,讓製作不再受限於傳統框架;而多角化的資金與夥伴結構,則能減少對補助與單一委製案的依賴,形成正向循環的產業體質。諸如日本《鬼滅之刃》透過IP延伸創造跨世代效應,或泰國在政府策略支持與國際平台Netflix合作,讓在地內容走向全球,都是多角化的案例。

高峰會四大主軸,挖掘韌性的潛力

「政策當然重要,但最終能否長出韌性,關鍵仍在產業本身的自覺與行動力。」李芃君表示,第七屆亞洲新媒體高峰會以「台流轉型、跨界共創、影視創新、商模躍進」四大主軸為核心,期望讓韌性不再停留於口號,而能轉化為具體實踐。不只是思考「如何生存」,更要推動產業主動探索「如何成長」。

在「台流轉型」議題中,論壇將從亞洲娛樂的整體格局出發,思考台灣內容如何在國際市場中建立辨識度與合作機制。面對串流平台競爭與區域內容崛起,產業要重新定義「台流」的價值,從單點創作走向跨國布局。

「跨界共創」則從電競、音樂、體育到AI應用,剖析影視娛樂如何走向一個多層次的體驗場域。透過多個實際案例,探討不同產業之間的協作經驗,助攻內容突破原有框架,創造新的商業能量。

「影視創新」主軸聚焦於新技術與內容形式的融合。如:短劇風潮、現象級作品及AI生成式內容等,正改變影視產業的創作邏輯。論壇將聚焦技術如何成為創意夥伴,推動人才與內容的再進化。

最後,「商模躍進」則回應內容永續與變現挑戰。當觀眾行為與平台策略不斷重組,內容不再只是作品,也是可延伸、可轉化的商業資產。論壇將引導產業思考,如何讓內容價值在不同階段持續發酵,打造可長可久的生態循環。

李芃君強調,高峰會的價值,在於讓這些不同維度的討論彼此交會;唯有當創作、技術與資本願意對話,產業的韌性才能真正落地。「我們希望產業能從危機思維轉向成長思維,在對話與合作中,激盪出新的想像與行動。」

韌性,新媒體暨影視音產業必備的DNA

自2017年成立以來,NMEA持續扮演政策倡議與產業整合的推動者。每一屆高峰會也都對應時代命題,映照產業進化軌跡。從2023年「EMPOWERING」的全面賦能、2024年「CONSOLIDATION」的整合共榮,到今年的「RESILIENCE」發揮韌性、尋求突圍,李芃君形容,這是一條從能力啟動、資源整合到體質調整的路徑,引領台灣影視娛樂邁向國際舞台。

NMEA
NMEA理監事集結產業代表,共思壯大台灣內容產業之道。
圖/ NMEA

她指出,高峰會結束後,NMEA也將以工作坊與共創計畫延續對話熱度,讓產業交流落地為實際行動。協會也積極拓展跨域合作,從企業交流、IP授權推動到媒體合作,串聯更多產業能量。

值得注意的是,自2022年起,高峰會同步啟動線上直播,三年累計已吸引超過20萬名觀眾參與,單屆觀看更突破8.1萬人次。李芃君認為,這不僅是數據表現,更代表台灣影視產業逐漸建立國際話語權。當產業以開放與創新的態度前行,才能在全球文化浪潮中,站上屬於台灣的舞台。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓