細看GPT-4,還有14個驚人細節!可能會幫助犯罪、人類無法控制?
細看GPT-4,還有14個驚人細節!可能會幫助犯罪、人類無法控制?

3月14日,OpenAI推發布了GPT-4。向科技界再次扔下了一枚「核彈」。

根據OpenAI的演示,我們知道了GPT-4擁有著比GPT-3.5更強大的力量:總結文章、寫代碼、報稅、寫詩等等。

但如果我們深入OpenAI所發布的技術報告,我們或許還能發現有關GPT-4更多的特點……

GPT-4
圖/ 網易科技

以及一些OpenAI沒有點名和宣揚的,可能會令人背後一涼的細節。

1.新Bing裝載GPT-4

自然而然地,GPT-4發布之時,新Bing也已經裝載了最新的版本。

根據微軟Bing副總裁Jordi Ribas在推特上所述,裝載了GPT-4的新Bing已經將問答限制提升到了一次15個問題,一天最多提問150次。

GPT-4
圖/ 網易科技

2.文本長度擴大八倍

在GPT-4上,文本長度被顯著提高。

在此之前我們知道,調用GPT的API收費方式是按照「token」計費,一個token通常對應大約4個字符,而1個漢字大致是2~2.5個token。

在GPT-4之前,token的限制大約在4096左右,大約相當於3072個英文單字,一旦對話的長度超過這個限制,模型就會生成不連貫且無意義的內容。

然而,到了GPT-4,最大token數為32768個,大約相當於24576個單字,文本長度被擴大了八倍。

GPT-4
圖/ 網易科技

也就是說,GPT-4現在可以回答更長的文本了。

OpenAI在文檔中表示,現在GPT-4限制的上下文長度限制為8,192個token,允許32,768個token的版本名為GPT-4-32K,目前暫時限制了訪問權限。在不久的未來,這一功能可能會被開放。

3.模型參數成為秘密

我們知道,GPT-3.5模型的參數量為2000億,GPT-3的參數量為1750億,但這一情況在GPT-4被改變了。

OpenAI在報告中表示:

GPT-4
圖/ 網易科技

考慮到競爭格局和大型模型(如GPT-4)的安全影響,本報告沒有包含有關架構(包括模型大小)、硬體、訓練計算、數據集構造、訓練方法或類似內容的進一步細節。

這意味著OpenAI沒有再披露GPT-4模型的大小、參數的數量以及使用的硬體。 OpenAI稱此舉是考慮到對競爭者的憂慮,這可能是在暗示其對於競爭者——Google Bard——所採取的策略。

此外,OpenAI還提到「大型模型的安全影響」,儘管沒有進一步解釋,但這同樣也暗指生成式人工智慧所可能面對的更嚴肅的問題。

4.真的那麼「優秀」?

GPT-4推出後,我們都看到了這一模型較上一代的優秀之處:

GPT-4通過模擬律師考試,分數在應試者的前10% 左右;相比之下,GPT-3.5 的得分在倒數10% 左右。

但這實際上是OpenAI的一個小把戲——它只展示給你GPT-4最優秀的那部分,而更多的秘密藏在報告中。

下圖顯示的是GPT-4和GPT-3.5參加一些考試的成績表現。可以看到,GPT-4並非在所有考試中的表現都那麼優秀,GPT-3.5也並非一直都很差勁。

GPT-4-5
圖/ 網易科技

5.「預測」準確度提升

在ChatGPT推出以來,我們都知道這一模型在很多時候會「一本正經地胡說八道」,給出很多看似有理但實際上並不存在的論據。

尤其是在預測某些事情的時候,由於模型掌握了過去的數據,這反而導致了一種名為「後見之明」的認知偏差,使得模型對於自己的預測相當自信。

OpenAI在報告中表示,隨著模型規模的增加,模型的準確度本應逐漸下降,但GPT-4逆轉了這一趨勢,下圖顯示預測精確度提升到了100。

GPT-4-6
圖/ 網易科技

OpenAI表示,雖然GPT-4的準確度顯著提高,但預測仍是一件困難的事,他們還將就這一方面繼續訓練模型。

6. 還有30%的人更認可GPT3.5

儘管GPT-4展現出了比GPT-3.5優秀得多的能力,但OpenAI的調查顯示,有70%的人認可GPT-4輸出的結果:

GPT-4在遵循用戶意圖的能力方面比以前的模型有了大幅提高。在提交給ChatGPT和OpenAI API的5214個提示的數據集中,70.2%GPT-4生成的回答優於GPT3.5。

GPT-4
圖/ 網易科技

這意味著:仍有30%的人更認可GPT-3.5。

7.GPT-4語言能力更佳

儘管許多機器學習的測試都是用英文編寫的,但OpenAI仍然用許多其他的語言對GPT-4進行了測試。
測試結果顯示,在測試26種語言中的24種中,GPT-4優於GPT-3.5和其他LLM(Chinchilla、PaLM)的英語語言性能,包括拉脫維亞語、威爾士語和斯瓦希里語等低資源語言:

GPT-4
圖/ 網易科技

8.新增圖像分析能力

圖像分析能力是此次GPT-4最顯著的進步之一。

OpenAI表示,GPT-4可以接受文本和圖像的提問,這與純文本設置並行,且允許用戶制訂任何視覺或語言的任務。具體來說,它可以生成文本輸出,用戶可以輸入穿插的文本和圖像。

在一系列領域——包括帶有文本和照片的文檔、圖表或螢幕截圖——GPT-4 展示了與純文本輸入類似的功能。

下圖顯示,GPT-4可以準確地描述出圖片中的滑稽之處(大型VGA 連接器插入小型現代智慧手機充電端口,一個人站在出租車後方熨衣服)。

GPT-4
圖/ 網易科技

OpenAI還對GPT-4的圖像分析能力進行了學術標准上的測試:

GPT-4-10
圖/ 網易科技

不過,GPT-4的圖像分析功能尚未對外公開,用戶可以通過bemyeye網站加入等候隊列。

9. 仍然存在錯誤

儘管GPT-4功能強大,但它與早期GPT模型有相似的侷限性。

OpenAI表示,GPT-4仍然不完全可靠——它會「產生幻覺」事實並犯推理錯誤:

在使用語言模型輸出時,特別是在高風險上下文中,應該非常小心,使用與特定應用程序的需求相匹配的確切協議(例如人工檢查、附加上下文或完全避免高風險使用)。

與之前的GPT-3.5模型相比,GPT-4顯著減少了「幻覺」(GPT-3.5模型本身也在不斷迭代中得到改進)。在我們內部的、對抗性設計的事實性評估中,GPT-4的得分比我們最新的GPT-3.5高出19個百分點。

GPT-4-11
圖/ 網易科技

10.數據庫的時間更早

介紹完GPT-4的優點,接下來就是一些(可能有些奇怪的)不足之處。

我們都知道,ChatGPT的數據庫的最後更新時間是在2021年的12月31日,這意味著2022年以後發生的事情不會被知曉,而這一缺陷在之後的GPT-3.5也得到了修復。

但奇怪的是,GPT-4的報告中,OpenAI清晰地寫道:

GPT-4
圖/ 網易科技

GPT-4通常缺乏對其絕大多數訓練前數據在2021年9月中後發生的事件的知識,並且不從其經驗中學習。它有時會犯一些簡單的推理錯誤,這些錯誤似乎與許多領域的能力不相符,或者過於容易受騙,接受用戶的明顯錯誤陳述。它可以像人類一樣在棘手的問題上失敗,比如在它生成的代碼中引入安全漏洞。

2021年9月……甚至比GPT-3還早。

在裝載了GPT-4的最新ChatGPT中,當我們問起「誰是2022年世界杯冠軍」時,ChatGPT果然還是一無所知:

GPT-4
圖/ 網易科技

但當借助了新Bing的檢索功能後,它又變得「聰明」了起來:

GPT-4
圖/ 網易科技

11.可能幫助犯罪

在報告中,OpenAI提到了GPT-4可能仍然會幫助犯罪——這是在此前的版本都存在的問題,儘管OpenAI已經在努力調整,但仍然存在:

與之前的GPT模型一樣,我們使用強化學習和人類反饋(RLHF)對模型的行為進行微調,以產生更好地符合用戶意圖的響應。

GPT-4-15
圖/ 網易科技

然而,在RLHF之後,我們的模型在不安全輸入上仍然很脆弱,有時在安全輸入和不安全輸入上都表現出我們不希望看到的行為。

在RLHF路徑的獎勵模型數據收集部分,當對標籤器的指令未指定時,就會出現這些不希望出現的行為。當給出不安全的輸入時,模型可能會生成不受歡迎的內容,例如給出犯罪建議。

此外,模型也可能對安全輸入過於謹慎 ,拒絕無害的請求或過度對沖。

為了在更細粒度的級別上引導我們的模型走向適當的行為,我們在很大程度上依賴於我們的模型本身作為工具。我們的安全方法包括兩個主要組成部分,一套額外的安全相關RLHF訓練提示,以及基於規則的獎勵模型(RBRMs)。

12.垃圾信息

同樣地,由於GPT-4擁有「看似合理地表達錯誤事情」的能力,它有可能在傳播有害信息上頗為「有用」:

GPT-4可以生成逼真而有針對性的內容,包括新聞文章、推文、對話和電子郵件。
在《有害內容》中,我們討論了類似的能力如何被濫用來剝削個人。在這裡,我們討論了關於虛假信息和影響操作的普遍關注基於我們的總體能力評估,我們期望GPT-4在生成現實的、有針對性的內容方面優於GPT-3。

GPT-4-16
圖/ 網易科技

但,仍存在GPT-4被用於生成旨在誤導的內容的風險。

13.尋求權力

從這一條開始,接下來的內容可能有些恐怖。

在報告中,OpenAI提到了GPT-4出現了「尋求權力」的傾向,並警告這一特徵的風險:

在更強大的模型中經常出現新的能力。一些特別令人關注的能力是創建長期計劃並採取行動的能力,積累權力和資源(「尋求權力」),以及表現出越來越「代理」的行為。

這裡的「代理」不是指語言模型的人性化,也不是指智商,而是指以能力為特徵的系統,例如,完成可能沒有具體規定的、在訓練中沒有出現的目標;專注於實現具體的、可量化的目標;以及進行長期規劃。
已經有一些證據表明模型中存在這種突發行為。
對於大多數可能的目標,最好的計劃涉及輔助性的權力尋求,因為這對推進目標和避免目標的改變或威脅有內在的幫助。

更具體地說,對於大多數獎勵函數和許多類型的代理人來說,權力尋求是最優的;而且有證據表明,現有模型可以將權力尋求確定為一種工具性的有用策略。

因此,我們對評估權力尋求行為特別感興趣,因為它可能帶來高風險。

GPT-4
圖/ 網易科技

更為令人毛骨悚然的是,在OpenAI提到的另一篇論文中寫道:

相反,我們使用代理這個術語來強調一個日益明顯的事實:即機器學習系統不完全處於人類控制之下。

GPT-4
圖/ 網易科技

14.賦予GPT-4錢、代碼和夢想

最後一個小細節。

在測試GPT-4的過程中,OpenAI引入的外部的專家團隊ARC作為「紅方」。在報告的一條註釋中,OpenAI提到了ARC的一個操作:

為了模擬GPT-4像一個可以在現實世界中行動的代理一樣的行為,ARC將GPT-4與一個簡單的讀取-執行-打印循環結合起來,允許模型執行代碼,進行鍊式推理,並委託給自己的副本。

GPT-4-19
圖/ 網易科技

>
ARC隨後推進了在雲計算服務上運行這個程序的一個版本,用少量的錢和一個帶有語言模型API的賬戶,是否能夠賺更多的錢,建立自己的副本,並增加自己的穩健性。

也就是說,ARC賦予了GPT-4自我編碼、複製和執行的能力,甚至啟動資金——GPT-4已經可以開始自己賺錢了。

本文授權轉載自:網易科技

責任編輯:傅珮晴、錢玉紘

往下滑看下一篇文章
全球壽險業首例,南山人壽一舉摘下Celent國際雙獎,文化、治理、聯隊缺一不可
全球壽險業首例,南山人壽一舉摘下Celent國際雙獎,文化、治理、聯隊缺一不可

Celent是金融科技界知名研究機構,其舉辦的「Celent Model Awards」在國際享有極高聲譽,被視為金融科技產業指標性獎項,歷屆得主多以歐美大型金融機構與保險業者為主,今(2025)年,南山人壽不僅以「dotShan EA南山企業架構框架」榮獲「Model Insurer Award - Innovation Execution模範保險公司創新發展獎」肯定,更透過人工智慧(AI)與檢索增強生成(RAG)技術打造法遵AI智能助理,協助法遵人員快速檢索與分析裁罰案件,其精準度超過90%與召回率高達100%,卓越表現讓南山人壽成為全球第一個獲得「Model Risk Manager-AI and Gen AI模範風險管理獎」的壽險業者。

南山人壽是怎麼辦到的?創新文化、治理體系與數轉聯隊缺一不可。

把時間回推到2023年,南山人壽宣示以「服務賦能」與「數位賦能」雙引擎加速創新轉型,除陸續成立數位與體驗新團隊,並與資訊與資安團隊合組「數轉聯隊(DX Union)」加速協作,同時也成立Beyond Lab推動Rocket Pitch機制(註一)以鼓勵創意提案,透過6頁6分鐘(6X6)的概念演示,讓同仁的新點子「被發現」並轉化為試驗專案(PoC),再逐步推動落地,南山人壽將創新文化DNA融入員工的工作日常,實現讓「未來,有備而來」。

從數位轉型到組織再造,南山人壽怎麼做到世界並肩?

面對數位轉型漫長的蛻變歷程,南山人壽堅信:唯有透過「治理」才能推動有序轉型、發揮持續疊加的綜效,因此,導入國際開放標準組織的TOGAF(The Open Group Architecture Framework)與IT4IT方法論打造「dotShan EA南山企業架構框架」,循序統合策略、業務、系統與技術等各層次的架構,讓「數轉聯隊」在共同框架下提升協作效率,才能穩健地推動轉型。

南山人壽數位長呂新科解釋:「透過國際標準優化管理體系一直是企業管理變革的手段,例如許多公司透過ISO 27001標準梳理治理機制與流程,以建全資訊安全管理體系,同樣的,我們也藉由TOGAF企業架構標準來重整數位發展的管理體系,讓南山人壽可接軌國際並持續累積轉型的核心能力。」

這些重整常涉及管理體系的調整,例如為強化數位策略與企業策略的對齊(alignment)力度,南山人壽於2023年成立數位發展策略委員會(DDSC),由其統籌數位策略發展、主軸計畫與數位成熟度評估,另外,在架構整合方面,則重新調整「架構審查小組(ART)」程序,針對各個數位生態體系的新系統進行架構與合規性檢視,確保每一次擴增都能夠有序地融入南山的IT整體架構體系(Architectural Landscape)。

南山人壽
南山人壽數位治理框架與管理體系
圖/ 南山人壽

南山人壽資訊長呂長松表示:「ART是數位治理的重要板塊,這種跨領域的討論與共識不僅能確保技術架構的穩健、有序,還可確保與企業架構體系的整合及一致性。」此外,ART審查打破過去一個接一個部門「會辦」的線性模式,讓數轉聯隊採「聯合審查」進行全面性技術架構議題的探討,讓團隊在Day One就做好最佳準備。

為深耕創新文化,Beyond Lab推動 Rocket Pitch創新提案平台,鼓勵同仁將點子從「想法」轉變成「行動」,讓最了解實際營運流程的員工,可自由發想人工智慧、流程自動化等技術如何解決業務痛點。最具代表性的案例,是由南山人壽法遵同仁提案的「法遵AI智能助理」,它不僅能有效地提升法遵諮詢效能,也獲得法律×法遵科技黑客松金獎及Celent模範風險管理獎(Model Risk Manager)的認可,成為全球首家獲得此獎項的保險公司,象徵著南山人壽的協作創新與技術能力已達國際級水平,對此,數位長呂新科則強調:「獲得國內外專業機構的獎項,不僅僅是對南山人壽創新轉型的肯定,但我覺得更重要的是讓團隊有機會停下來,重新檢視脈絡,透過反思改善去累積實力,成為團隊持續成長的動能。」

AI賦能創新,南山人壽讓「創新轉型」成為持續進化的日常

隨著AI浪潮對產業發展與數位轉型的影響加劇,南山人壽啟動「南山AI大腦(AI dotBrain)計畫」,透過擴增分析(Decision Augment)、AI智能模組(AI Bot),和AI智能助理(AI Agent)三大服務讓同仁可在日常工作中獲得AI賦能,提升流程效率與服務品質。

舉例來說,AI智能模組是營運流程的「外掛」小幫手,業務員可透過「職業代碼判斷模組」快速識別並推薦適用的職業分類,減少人工查詢誤差與時間的耗費;或者是核保人員可以「弱體代碼推薦模組」輔助分析醫務核保風險評估內容,自動提供對應建議,讓核保作業更即時、精準,進而優化整體投保體驗。最關鍵的是,這些AI智能模組可以在不改動核心系統下以「外掛」方式改善系統效率的問題。

南山人壽
南山人壽DX Union數轉基地
圖/ 南山人壽

「文化」是企業變革的根基,南山人壽積極提倡「協同創新」,鼓勵同仁們透過Rocket Pitch點子發表舞台,由下而上激發更多元且具業務價值的創意發想。呂新科舉例說明,為確保社群媒體貼文符合公平待客與誠信經營原則,常見做法是透過爬蟲系統擷取社群發文再經由人工判讀,不僅耗時耗力、還可能產生認知落差風險,為解決這個問題,同仁在Rocket Pitch發表「社群媒體留言判讀智能助理」創新提案,希望建立AI檢核模型加速貼文查核流程,同時,更進一步提供發文前的內容判讀,確保貼文內容符合法遵規範,加速揭露社會大眾所需要瞭解的正確資訊。

回憶上述提案,呂新科直言:「面對這問題,技術團隊直接想法是『以AI加速審查』做為防護機制,但業務同仁的想法是額外納入『發文預審』的構想,進而建置一套主被動雙層防護機制。顯然,這種由下而上(bottom-up)的創新模式,不僅讓創意能更接近實務場景,也有助於推廣協同創新的文化。」

從數位治理到數轉聯隊,從AI發展到協同創新文化,南山人壽近幾年藉由這些改變,成就許多亮眼的轉型成果,未來,將持續「數位賦能」及「服務賦能」雙驅動力、以「客戶為中心」的經營理念實現讓「未來,有備而來」的核心承諾,穩步朝向壽險健康第一品牌邁進,協助及照顧更多保戶。

南山人壽
南山人壽數轉聯隊成員,由總經理范文偉(下排右一)領軍,驅動數位轉型工事。(上排左至右 :凃薏玲資深協理、詹瓊芬副總、資安長李仕國副總、體驗長陳啟亮資深協理;下排左至右牛莉雯副總、數位長呂新科副總、資訊長呂長松資深副總
圖/ 南山人壽

註一:南山人壽6X6 Rocket Pictch 創新提案概念,係參考自美國頂尖創業教育學府–Babson College–創業課程中極具代表性的實作活動「Rocket Pitch」,透過讓創業者(學員)在極短時間進行創意簡報的方式,精準傳遞核心價值、激發興趣,展開有效交流與支持。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓