GPT-4超強的「PR90」成績嚇到人類!但OpenAI警告:還是有兩大缺陷
GPT-4超強的「PR90」成績嚇到人類!但OpenAI警告:還是有兩大缺陷

今天凌晨,OpenAI公佈了其大型語言模型的最新版本——GPT-4。該公司表示,GPT-4在許多專業測試中表現出超過絕大多數人類的水平。

具體而言,GPT-4實現了以下幾個方面的飛躍式提升:更聰明,答題水平越來越好;支持圖像輸入,擁有強大的識圖能力,但目前只限內部測試;更長的上下文,文字輸入限制提升至2.5萬字;回答準確性顯著提高;更安全,有害資訊更少。

對於普通人而言,如何理解GPT-4到底有多強多聰明?

據OpenAI透露,GPT-4通過了所有基礎考試而且是高分通過。例如,GPT-4在模擬律師資格考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數學考試中排名前11%左右。相比之下,曾經令人震撼的GPT-3.5 ,真實得分在倒數10%左右,GPT-4的強大已經可想而知。

ChatGPT4
圖/ 微軟

有網友評論,「如果真跟報告說的那樣就太可怕了,我感覺能力已經遠超我了。」也有人笑稱,「我躺好了!我生在了適合我的時代!」

最多的聲音則是對未來工作不保的擔憂,「還有哪個行業可以不被替代?」「消除任何幻想,AI時代橫掃全球,先思考下GPT-4不能做但你能做的。」

比以前的版本「更大」,或許也更燒錢

OpenAI稱,GPT-4比以前的版本「更大」,這意味著其已經在更多的數據上進行了訓練,並且在模型文件中有更多的權重,這使得它的運行成本更高。

同時,OpenAI並未公佈這個模型的參數量有多少。

OpenAI表示,它使用的是微Azure訓練模型,微軟已經向這家新創公司投資了數十億美元。 OpenAI沒有公佈具體模型大小的細節,也沒有公佈用來訓練模型的硬件,理由是「競爭情況」。

目前,此領域的許多研究人員認為,人工智能領域的許多最新進展,都來自於在數千台超級計算機上運行越來越大的模型,這些模型的訓練過程可能耗資數千萬美元。

為了不斷提高GPT-4性能,OpenAI還為其研發大搞「基建」。

在過去的兩年裡,OpenAI重建了整個深度學習堆棧,並與Azure一起為其工作負載從頭開始設計了一台超級計算機。一年前,OpenAI 在訓練GPT-3.5時第一次嘗試運行了該超算系統,之後他們又陸續發現並修復了一些錯誤,改進了其理論基礎。這些改進的結果是 GPT-4的訓練運行獲得了前所未有的穩定。

OpenAI聯合創辦人兼總裁格雷格·布羅克曼(Greg Brockman)表示,OpenAI預計,未來將由投資十億美元超級計算機的公司開發尖端模型,一些最先進的工具將帶有風險。 OpenAI希望對他們工作的某些部分保密,以給新創公司「一些喘息的空間,以真正關注安全並做好它。」

延伸閱讀:GPT-4「考大學」成績贏過90%考生!34項考試都名列前茅,人類怎麼辦?

侷限性明顯,GPT-4仍然不完全可靠

儘管功能已經非常強大,但 GPT-4仍與早期的 GPT 模型具有相似的侷限性,其中最重要的一點是它仍然不完全可靠,也就是還有可能胡說八道。

OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。該公司表示:「GPT-4仍有許多已知的侷限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。」

總的來說,GPT-4相對於以前的模型(經過多次迭代和改進)已經顯著減輕了幻覺問題。在 OpenAI 的內部對抗性真實性評估中,GPT-4的得分比最新的 GPT-3.5模型高40%。

同時,GPT-4訓練數據還是截止到2021年9月份。這也意味著,GPT-4對於這個時間點以後的資訊,缺乏足夠的了解,也不會從其經驗中學習。

在GPT-4發布之後,OpenAI創辦人阿爾特曼發推文表示:「它仍然是有缺陷的,仍然是有限的,在你花了更多的時間第一次使用它時,它似乎比實際情況更令人印象深刻。」

中國的ChatGPT們要怎麼追?

最令人震驚的在於,按照 demo 視頻裡 OpenAI 工程師們的說法,GPT-4的訓練在去年8月就已經完成,剩下的時間都在進行微調提升,以及最重要的去除危險內容生成的工作。

這也意味著,OpenAI 內部技術,比大家想像中的領先外界更多年。更可怕的是,OpenAI還一口氣開放了API接口和相關論文!這讓中國的ChatGPT們還怎麼追?

英諾天使基金合夥人王晟曾告訴《態℃》欄目,「中國的ChatGPT們即便奮起直追,靜態來講也許兩三年能追上,我認為已經很樂觀了。」

但隨著更強大的GPT-4發布,OpenAI 的技術能力顯然仍在不斷進步,且進展速度遠比我們追的速度還要快。王晟在之前的採訪中判斷,「除非這件事突然遇到了一個瓶頸,整個科技發展方向到頭了,對方不得不停下來,或許我們還有機會追平,或者我們挖掘到一種新的技術路徑有機會追上,不然可能沒有機會了。」

與此同時,在該模型的落地和應用方面,OpenAI也有了最新進展。

新模型將提供給ChatGPT的付費用戶,也將作為API的一部分提供,允許程序員將AI集成到他們的應用程序中。 OpenAI將對750字左右的指令資訊收費3美分,對750字左右的響應資訊收費6美分。

OpenAI還介紹,摩根士丹利正在使用GPT-4來組織數據,而電子支付公司Stripe正在測試GPT-4是否有助於打擊欺詐。其他客戶還包括語言學習公司Duolingo、Khan Academy和冰島政府。 OpenAI合作夥伴微軟週二表示,新版必應搜尋引擎將使用GPT-4。

GPT-4取得的成績令人興奮,但對於還在起跑線上的中國ChatGPT們,還有大量的工作要去探索和研究,想必感受到了巨大的壓力。風浪越大魚越貴,對於這些迅速進入這個新領域的公司來說,也將會擁有巨大的機會。

GPT-4的強大告誡我們,未來唯一限制的因素,就是你的想像力!

本文授權轉載自:網易科技

責任編輯:傅珮晴、錢玉紘

往下滑看下一篇文章
2025台灣設計展在彰化!直擊「圓未來之行」必看十大亮點:3+1大展區,跨入時空轉換通道,共創未來新可能!
2025台灣設計展在彰化!直擊「圓未來之行」必看十大亮點:3+1大展區,跨入時空轉換通道,共創未來新可能!

亮點一:回溯城市源頭起點,航海語彙彷若時光倒流

「圓未來之行」共分為室內三大展區與一戶外展區,以「與城市一同成長」做為策展主軸,梳理出:「源─緣─圓─合」x時光「過去─現在─未來」串接時代軸線,將彰化的「交通、建設與生活」呈現於展區中。「源」記憶之源展區入口處,是彰化航運貿易的起點,設計語彙透過水波、帆船、引領觀展者漫步前進,從最微觀的早期建材文物看到城市發展的歷史,如:清領時期至日治時期的多樣建築元素與素材,包含:戎克船、壓艙石、福州杉、枕木、酒甕,回望彰化的源頭,憶起移居而來的風光繁榮。

亮點二:光雕沙盤演譯交通建設願景,點亮未來發展藍圖

「緣」的轉譯之間,以「連結」為核心主題。居民與城市透過交通路網緊密相繫,象徵彰化從人與地的互動中,編織出發展的脈動。〈脈動彰化〉展項以光雕技術投影於立體沙盤模型上,生動演繹「一軸一環雙樞紐四引擎」的整體建設願景。
隨著各交通樞紐依序點亮,縣域交通網絡的節奏逐步展開,城市與鄉鎮間的連結脈絡清晰浮現,展現彰化邁向均衡發展、共榮未來的宏觀藍圖。

1014_2.jpg
〈脈動彰化〉以光雕技術生動演繹「一軸一環雙樞紐四引擎」的整體建設願景。
圖/ 彰化縣政府

亮點三:模型x互動表述社群共融,實踐宜居生活的想像

以等比縮小建築模型結合互動展示,呈現伸港基地新時代青年住宅與社會住宅的「租售共融」模式,觀展者可透過互動深入瞭解青宅社宅共居的設計意圖與社會影響,感受彰化如何回應居住正義與社會福祉的生活需求,看見宜居城市的生活模樣。

1014_3.jpg
〈宜居共築所〉展示伸港基地「青宅+社宅共居」的創新政策。
圖/ 彰化縣政府

亮點四:鹿江綠建築校園AR互動,亮相生態x教育x文化的交織成果

教育是宜居生活的一大環節。「鹿江綠建築校園」透過立體模型結合互動呈現:未來綠學園─教育x永續x建築示範,將綠建築結合AR增強影像互動,觀展者用手機對準模型,即可看到校園的環境永續設計特點,讓綠建築不僅是獲獎的優秀成果,更是一個精心設計的教育實踐。

1014_4.jpg
本次作為【圓未來之行】展區的鹿江國際中小學,即是榮獲公共工程金質獎的綠建築場域,民眾可透過掃描模型上的標示點探索其中的永續設計。
圖/ 彰化縣政府

亮點五:你看不見的城市隱形治理設計,一地多用校園複合蓄洪池

展區中,將「全國首創校園複合蓄洪場─地下停車場兼蓄洪池」,透過立體模型結合電控薄膜,呈現蓄洪場域與生活場域的結合。看資源如何整合應用,超越既定印象,創造一地多用,融合教育、社區、防洪機能的複合設計新模範,表達城市韌性設計的新可能。

1014_5.jpg
〈全齡照護網〉展示一站式長照大樓,民眾走至定位即可揭露對應設施的照護服務。
圖/ 彰化縣政府

亮點六:回應健康共融的生活型態,窺見一站式長照大樓、共融公園等

健康共融的生活型態,城市是如何回應的呢?展區中也將呈現城市「全齡共享」的生活設計典範,讓不同的年齡層,都能被承接、照護與支持,展出:因應共融需求而設計的一站式長照大樓,內含不老健身房、托嬰與育兒親子館、長照創新等多項措施,只要踩在地上互動點位,便會亮起相應服務的大樓樓層,完整了解一站式長照大樓的服務項目。此外,也設計了「反應力x不老健身房」、「全民運動」等互動感應投影遊戲,以及未來「共融式遊戲場」投票選擇,表達未來城市規劃意向,提供參與城市共融的連結與共造,傳遞永續、人本兼容並蓄的溫柔回應。

亮點七:探索時間如何轉譯新生?走進老屋再造活化空間

展區概念中,回應300年的城市建設新舊共生,「時光新生所」打造出「老屋點燈造型故事屋」,精選五組代表案例,從老屋前身到改造過程,以及此刻的成果,看見老屋與社區、青年與夢想、創業與創新,透過建築再造表達當代生活的新生命與城市活力。

1014_6.jpg
〈時光新生所〉以翻牌形式呈現老屋整修前後的使用對比。
圖/ 彰化縣政府

亮點八:情境式體驗未來車廂,城市藍圖引導對未來的渴望期盼

當過去、現在被梳理完整後。未來會是什麼呢?「未來城市展區」則以縫合、綻放、圓滿、快捷幸福未來為題,透過「情境式劇場」,讓觀展者置身未來車廂中。搭乘未來號看著窗外,播放著目前規劃的未來藍圖,當旅程來到終點,未來就是始於現在的行動。邀請你共同參與種種希望與可能性。

1014_7.jpg
【圓未來之行】展區內的未來車廂,在車廂兩側呈現城市未來規劃遠景,帶給每位觀展者沉浸式體驗快捷幸福未來。
圖/ 彰化縣政府

亮點九:建築AI互動選擇,未來共創基地展區實驗計畫

彰化縣長王惠美表示,「未來城市的藍圖,必須由民眾共同描繪,唯有大家的想法與創意,才能讓城市更貼近生活、貼近人心。」因此,「未來城市共創基地」設計共創互動環節,以大尺度的城市規劃角度出發,邀請觀展者共同打造屬於彰化的未來城。
以彰交特定區為城市共創背景,觀展者能透過平板互動,依需求、喜好選定主題類型與建築,如:該區域希望如何發展?公園綠地(共融公園、生態濕地)、產業經濟(百貨商場、研發大樓)、休閒育樂(美術館、圖書館等),民眾意見將影響城市發展指數,並由 AI 生成建築於畫面上,最終於大顯示螢幕上看到共創未來城市的樣貌。
透過互動體驗,民眾得以反思發展過程中經濟建設與生活環境的平衡取捨,展項最終會將互動成果整理成報告做為縣府施政參考,此區域的未來,將是共創而生的實驗基地。

1014_8.jpg
〈未來城市共創基地〉可透過平板互動生成多種建築,邀請民眾一同建設未來的理想城市。
圖/ 彰化縣政府

亮點十:戶外串聯生態作品區,看行動如何實踐永續?

最終,來到更宏觀的探討彰化未來城市的環境,傳遞三大核心:未來想像、智慧永續循環、綠色療癒,將其展現於生態設計作品中的〈魚的肚子是我們的生活〉、〈往事河光.未來亭〉、〈漂泊之所〉,分別呈現自然環境保護,由在地師生共創孕生作品、以太陽能系統呈現未來資源的自給自足,及將彰化歷史重要的戎克船體轉化休憩裝置。回扣彰化的起點主軸:生態環境與幸福宜居生活,完成一趟精彩的「圓未來之行」體驗。

1014_9.jpg
【圓未來之行】戶外展區中的展品:〈魚的肚子是我們的生活〉,呼籲大眾綠色環保、永續循環的重要性。
圖/ 彰化縣政府

採訪・撰文/楊喻婷
【彰化縣政府廣告】

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓