GPT-4超強的「PR90」成績嚇到人類!但OpenAI警告:還是有兩大缺陷
GPT-4超強的「PR90」成績嚇到人類!但OpenAI警告:還是有兩大缺陷

今天凌晨,OpenAI公佈了其大型語言模型的最新版本——GPT-4。該公司表示,GPT-4在許多專業測試中表現出超過絕大多數人類的水平。

具體而言,GPT-4實現了以下幾個方面的飛躍式提升:更聰明,答題水平越來越好;支持圖像輸入,擁有強大的識圖能力,但目前只限內部測試;更長的上下文,文字輸入限制提升至2.5萬字;回答準確性顯著提高;更安全,有害資訊更少。

對於普通人而言,如何理解GPT-4到底有多強多聰明?

據OpenAI透露,GPT-4通過了所有基礎考試而且是高分通過。例如,GPT-4在模擬律師資格考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數學考試中排名前11%左右。相比之下,曾經令人震撼的GPT-3.5 ,真實得分在倒數10%左右,GPT-4的強大已經可想而知。

ChatGPT4
圖/ 微軟

有網友評論,「如果真跟報告說的那樣就太可怕了,我感覺能力已經遠超我了。」也有人笑稱,「我躺好了!我生在了適合我的時代!」

最多的聲音則是對未來工作不保的擔憂,「還有哪個行業可以不被替代?」「消除任何幻想,AI時代橫掃全球,先思考下GPT-4不能做但你能做的。」

比以前的版本「更大」,或許也更燒錢

OpenAI稱,GPT-4比以前的版本「更大」,這意味著其已經在更多的數據上進行了訓練,並且在模型文件中有更多的權重,這使得它的運行成本更高。

同時,OpenAI並未公佈這個模型的參數量有多少。

OpenAI表示,它使用的是微Azure訓練模型,微軟已經向這家新創公司投資了數十億美元。 OpenAI沒有公佈具體模型大小的細節,也沒有公佈用來訓練模型的硬件,理由是「競爭情況」。

目前,此領域的許多研究人員認為,人工智能領域的許多最新進展,都來自於在數千台超級計算機上運行越來越大的模型,這些模型的訓練過程可能耗資數千萬美元。

為了不斷提高GPT-4性能,OpenAI還為其研發大搞「基建」。

在過去的兩年裡,OpenAI重建了整個深度學習堆棧,並與Azure一起為其工作負載從頭開始設計了一台超級計算機。一年前,OpenAI 在訓練GPT-3.5時第一次嘗試運行了該超算系統,之後他們又陸續發現並修復了一些錯誤,改進了其理論基礎。這些改進的結果是 GPT-4的訓練運行獲得了前所未有的穩定。

OpenAI聯合創辦人兼總裁格雷格·布羅克曼(Greg Brockman)表示,OpenAI預計,未來將由投資十億美元超級計算機的公司開發尖端模型,一些最先進的工具將帶有風險。 OpenAI希望對他們工作的某些部分保密,以給新創公司「一些喘息的空間,以真正關注安全並做好它。」

延伸閱讀:GPT-4「考大學」成績贏過90%考生!34項考試都名列前茅,人類怎麼辦?

侷限性明顯,GPT-4仍然不完全可靠

儘管功能已經非常強大,但 GPT-4仍與早期的 GPT 模型具有相似的侷限性,其中最重要的一點是它仍然不完全可靠,也就是還有可能胡說八道。

OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。該公司表示:「GPT-4仍有許多已知的侷限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。」

總的來說,GPT-4相對於以前的模型(經過多次迭代和改進)已經顯著減輕了幻覺問題。在 OpenAI 的內部對抗性真實性評估中,GPT-4的得分比最新的 GPT-3.5模型高40%。

同時,GPT-4訓練數據還是截止到2021年9月份。這也意味著,GPT-4對於這個時間點以後的資訊,缺乏足夠的了解,也不會從其經驗中學習。

在GPT-4發布之後,OpenAI創辦人阿爾特曼發推文表示:「它仍然是有缺陷的,仍然是有限的,在你花了更多的時間第一次使用它時,它似乎比實際情況更令人印象深刻。」

中國的ChatGPT們要怎麼追?

最令人震驚的在於,按照 demo 視頻裡 OpenAI 工程師們的說法,GPT-4的訓練在去年8月就已經完成,剩下的時間都在進行微調提升,以及最重要的去除危險內容生成的工作。

這也意味著,OpenAI 內部技術,比大家想像中的領先外界更多年。更可怕的是,OpenAI還一口氣開放了API接口和相關論文!這讓中國的ChatGPT們還怎麼追?

英諾天使基金合夥人王晟曾告訴《態℃》欄目,「中國的ChatGPT們即便奮起直追,靜態來講也許兩三年能追上,我認為已經很樂觀了。」

但隨著更強大的GPT-4發布,OpenAI 的技術能力顯然仍在不斷進步,且進展速度遠比我們追的速度還要快。王晟在之前的採訪中判斷,「除非這件事突然遇到了一個瓶頸,整個科技發展方向到頭了,對方不得不停下來,或許我們還有機會追平,或者我們挖掘到一種新的技術路徑有機會追上,不然可能沒有機會了。」

與此同時,在該模型的落地和應用方面,OpenAI也有了最新進展。

新模型將提供給ChatGPT的付費用戶,也將作為API的一部分提供,允許程序員將AI集成到他們的應用程序中。 OpenAI將對750字左右的指令資訊收費3美分,對750字左右的響應資訊收費6美分。

OpenAI還介紹,摩根士丹利正在使用GPT-4來組織數據,而電子支付公司Stripe正在測試GPT-4是否有助於打擊欺詐。其他客戶還包括語言學習公司Duolingo、Khan Academy和冰島政府。 OpenAI合作夥伴微軟週二表示,新版必應搜尋引擎將使用GPT-4。

GPT-4取得的成績令人興奮,但對於還在起跑線上的中國ChatGPT們,還有大量的工作要去探索和研究,想必感受到了巨大的壓力。風浪越大魚越貴,對於這些迅速進入這個新領域的公司來說,也將會擁有巨大的機會。

GPT-4的強大告誡我們,未來唯一限制的因素,就是你的想像力!

本文授權轉載自:網易科技

責任編輯:傅珮晴、錢玉紘

往下滑看下一篇文章
商用地產成熱門焦點,方睿科技攜手希睿創新置業以數據科技助開發商搶佔先機
商用地產成熱門焦點,方睿科技攜手希睿創新置業以數據科技助開發商搶佔先機

台灣住宅市場過去10年屢創新高,不動產開發商習慣以戶型規劃、坪數配置、生活機能及家庭型態等邏輯銷售商品。然而,隨著住宅不動產買氣降溫、營建成本持續攀升、政策影響加劇,不動產開發商開始將焦點轉向長期被忽略的商用地產市場。

商用地產市場崛起,不動產開發商須掌握全新市場邏輯

商用地產的客戶是企業或商辦投資人,決策依據遠比住宅複雜,包括產業特性、營運流程、設備承載、動線規劃、能源效率、甚至法規合規等細節,如果不動產開發商沒有在一開始釐清目標客群的產業需求、法規規範、實際坪數與空間規劃,很容易陷入規劃誤區,甚至在完工後才發現市場不買單,甚至造成數十億以上的高額成本浪費。

為協助不動產開發商與商用地產投資人解決上述挑戰,方睿科技除推出商用地產智慧平台,整合大樓、投資、區域、交通與政策等多元數據資料、生成全維度分析報告,協助不動產開發商與投資人做出精準決策,更以集團經營的方式,於今(2025)年9月成立希睿創新置業,由其提供含括規劃、執行與銷售的一站式代銷服務,幫助不動產開發商快速切入商用地產市場。

方睿科技執行長吳健宇指出:「有別於住宅不動產是以感性行銷方式影響買家,商用地產客戶則是倚賴數據進行理性決策,如產業趨勢、聚落發展、租金區間、企業規模、產業上下游動態、大樓的設備承載與機電裝置等,而不是感覺或經驗法則,而這也是方睿科技努力的方向。」

方睿科技
方睿科技執行長吳健宇、希睿創新置業總經理蔡焦緯
圖/ 數位時代

「多維數據分析不僅是開拓商用地產市場的關鍵,也讓希睿成為不動產開發商最可靠的合作夥伴。」擁有豐富不動產經驗的希睿創新置業總經理蔡焦緯如是總結。

三大優勢加持,希睿成不動產開發商耕耘商用地產市場的最佳夥伴

過去不動產開發商在銷售住商混合建案時,常遇到商業空間長期閒置的困境,原因在於傳統代銷只熟悉住宅邏輯,希睿正是要來填補商用地產代銷市場長期缺口。

希睿之所以能快速成為商用地產市場的領跑者,以罕見的市場競爭力成為不動產開發商與企業客戶的最佳夥伴,與其擁有「專業團隊」、「數據科技」與「企業潛在客戶名單」三大優勢,以及跟方睿科技進行深度合作有關:

在專業團隊方面,希睿的團隊成員擁有超過20年的不動產經驗,以及近10年的數據驅動數位行銷實務經驗,可以理性數據分析協助不動產開發商規畫設計不動產,以及精準溝通目標客群,更好媒合企業客戶與投資人。

在數據科技領域,方睿科技的商用地產智慧平台整合「重點區域分析」、「大樓資料」、「區域資料」與「圖像資料」等多維度資訊,無論是協助不動產開發商規劃商用地產,還是幫助企業客戶與投資人尋找合適標的,都能提供最適切且全方位的支援。

蔡焦緯表示:「透過平台,我們甚至能告訴不動產開發商某區段的商用地產租金或售價的未來成長幅度,加快決策與動工,搶先掌握市場商機,更重要的是,當市場環境、政治決策快速變動,我們都能即時更新分析,而不是拿著一年前的產業報告來賭四年後的市場,讓效益發揮最大價值。」

方睿科技
希睿創新置業總經理蔡焦緯
圖/ 數位時代

在潛在客戶名單方面,希睿會透過產業動能分析模型追蹤企業年增員工數、資本額變化以及產業重大訊息動態等等,預判企業於商用空間的需求,深度解析市場,獲取各個區段的商用地產潛在客戶名單,在協助不動產開發商完成規劃設計後提供銷售支援,真正做到從規劃到成交的一站式服務。

商用地產決策不僅會影響企業營運績效,更左右城市未來發展格局。希睿將以專業團隊、產業動能分析與完整買方追蹤系統,提供從規劃、企劃到銷售的一站式服務,幫助不動產開發商在前期階段就搶先掌握商用市場機遇,同時促進企業、不動產開發商與城市的共好發展;此外,也會將第一手的市場訊息回饋給方睿科技、持續優化商用地產智慧平台,希睿將致力提供最具科技力的代銷服務,打造生態體系共贏的市場新標準。

方睿科技
左起,希睿創新置業協理楊彥宏、副總經理黃士芳、總經理蔡焦緯
圖/ 數位時代

方睿科技:https://www.funraise.com.tw/

希睿創新置業:https://www.facebook.com/ONERAISE

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓