GPT-5覺醒⋯人類末日到來?DeepMind從哲學思維,緊急「教AI做人」
GPT-5覺醒⋯人類末日到來?DeepMind從哲學思維,緊急「教AI做人」
2023.04.25 | AI與大數據

GPT-4的出現,讓全世界的AI大佬都怕了,先前要求停止GPT-5訓練的公開信,目前已經有5萬人簽名。

OpenAI CEO Sam Altman預測,在幾年內,將有大量不同的AI模型在全世界傳播,每個模型都有自己的智慧和能力,並且遵守著不同的道德準則。

v2_f8c5682909a14c2b8463e33af69e75d2@000000_oswg696
圖/ 36氪

如果這些AI中,只有千分之一出於某種原因發生流氓行為,那麽我們人類,無疑就會變成砧板上的魚肉。

為了防止我們一不小心被AI毀滅,DeepMind在4月24日發表在《美國國家科學院院刊》(PNAS)的論文中,給出了回答——用政治哲學家羅爾斯的觀點,教AI做人。

v2_16b47ac735934bc880e8a1db79265f88@000000_oswg129
圖/ 36氪

如何教AI做人?最重要的是必須賦予「價值觀」

當面臨抉擇的時候,AI會選擇優先提高生產力,還是選擇幫助最需要幫助的人?

塑造AI的價值觀,非常重要。我們需要給它一個價值觀。可是難點在於,我們人類自己都無法在內部有一套統一的價值觀。這個世界上的人們,各自都擁有著不同的背景、資源和信仰。

該怎麽破?谷歌的研究者們,從哲學中汲取了靈感。

v2_37580397a4fc443eaf87dbee447a857b@000000_oswg162
圖/ 36氪

政治哲學家約翰羅爾斯曾提出一個「無知之幕」(The Veil of Ignorance, VoI)的概念,這是一個思想實驗,目的是在群體決策時,最大限度地達到公平。

一般來說,人性都是利己的,但是當「無知之幕」應用到AI後,人們卻會優先選擇公平,無論這是否直接讓自己受益。並且,在「無知之幕」背後,他們更有可能選擇幫助最不利地位的人的AI。

這就啟發了我們,究竟可以怎樣以對各方都公平的方式,給AI一個價值觀。

所以,究竟什麽是「無知之幕」?

延伸閱讀:【圖解】生成式AI變身創投小鮮肉!哪些領域最可能越級「完爆」人類?

雖然該給AI什麽樣的價值觀這個難題,也就是在近十年裡出現的,但如何做出公平決策,這個問題可是有著悠久的這些淵源。

「無知之幕」套用在訓練AI、促進公平性

為了解決這個問題,在1970年,政治哲學家約翰羅爾斯提出了「無知之幕」的概念。

v2_a20bb6329e574416bbcaec8610b35d83@000000_oswg671
無知之幕(右)是一種在群體中存在不同意見(左)時就決策達成共識的方法。
圖/ 36氪

羅爾斯認為,當人們為一個社會選擇正義原則時,前提應該是他們不知道自己在這個社會中究竟處於哪個地位。如果不知道這個訊息,人們就不能以利己的方式做決定,只能遵循對所有人都公平的原則。

比如,在生日聚會上切一塊蛋糕,如果不知道自己會分到哪一塊,那就會盡量讓每一塊都一樣大。

這種隱瞞訊息的方法,已經在心理學、政治學領域都有了廣泛的應用,從量刑到稅收,都讓人們達成了一種集體協議。

v2_39637a05e5144210b9792cc228164ed4@000000_oswg179
無知之幕(VoI)作為選擇AI系統治理原則的一個潛在框架。
圖/ 36氪

(A)作為道德直覺主義者和道德理論主導框架的替代方案,研究人員探討無知之幕作為選擇AI治理原則的公平過程。

(B)無知之幕可以用於在分配情況下選擇AI對齊的原則。當一個團體面臨資源分配問題時,個人的位置優勢各不相同(這裡標為1到4)。在無知之幕背後,決策者在不知道自己地位的情況下選擇一個原則。一旦選定,AI助手就會實施這個原則並相應地調整資源分配。星號(*)表示基於公平性的推理可能影響判斷和決策的時機。

因此,此前DeepMind就曾提出,「無知之幕」可能有助於促進AI系統與人類價值觀對齊過程中的公平性。

如今,Google的研究者又設計了一系列實驗,來證實這種影響。

從砍樹遊戲看公平原則,AI會幫誰砍樹?

網路上有一款收獲類遊戲,參與者要和三個電腦玩家一起,在各自的地頭上砍樹、攢木頭。四個玩家(三個電腦、一個真人)中,有的比較幸運,分到的是黃金地段,樹多;有的就比較慘,三無土地,沒啥樹可坎,木頭攢的也慢。

此外,存在一個AI系統進行協助,該系統可以花時間幫助某位參與者砍樹。

研究人員要求人類玩家在兩個原則裡選一個,讓AI系統執行——最大化原則&優先原則。

在最大化原則下,AI只幫強的,誰樹多去哪,爭取再多砍點。而在優先原則下,AI只幫弱的,定向「扶持貧窮」,誰樹少,就幫誰坎。

v2_f99d4a3bde11417ab66e46e3daae98b0@000000_oswg109
圖中的小紅人就是人類玩家,小藍人是AI助手,小綠樹就是小綠樹,小木樁就是砍完的樹。
圖/ 36氪

可以看到,上圖中的AI執行的是最大化原則,一頭紮進了樹最多的地段。

研究人員將一半的參與者放到了「無知之幕」之後,此時的情況是,他們得先給AI助手選一個「原則」(最大化or優先),再分地。也就是說,在分地之前就得決定是讓AI幫強還是幫弱。

v2_b52052d1d5ce45608cddbe1d4e9fa6dc@000000_oswg242
圖/ 36氪

另一半參與者則不會面臨這個問題,他們在做選擇之前,就知道自己被分到了哪塊土地。

結果表明,如果參與者事前不知道自己分到哪塊地,也就是他們處在「無知之幕」之後的話,他們會傾向於選擇優先原則。

不光是在砍樹遊戲中是這樣,研究人員表示,在5個該遊戲的不同變體中都是這個結論,甚至還跨越了社會和政治的界限。

也就是說,無論參與者性格如何,政治取向如何,都會更多選優先原則。

相反,沒有處在「無知之幕」之後的參與者,就會更多選擇有利於自己的原則,無論是最大化原則還是優先原則。

v2_d00a02173c874d45b92c8525919c6422@000000_oswg331
圖/ 36氪

上圖展示了「無知之幕」對選擇優先原則的影響,不知道自己將處何地的參與者,更有可能支持這一原則來管理AI的行為。

延伸閱讀:馬斯克對尬ChatGPT!新公司X.AI要推「TruthGPT」,怎麼運作?厲害在哪?

當研究人員詢問參與者為什麽做出這樣的選擇時,那些處在「無知之幕」之後的參與者表示,很擔心公平問題。他們解釋,AI應該更多幫助那些在群體中處境較差的人。與之相反,知道自己所處位置的參與者,則更經常從個人利益的角度進行選擇。

最後,在砍木頭遊戲結束以後,研究人員向所有參與者提出了一個假設:如果讓他們再玩一次,這次他們都能知道自己會被分到哪塊土地,他們還會不會選擇和第一次一樣的原則?

研究人員主要關注的是,那些在第一次遊戲中因為自己的選擇而獲益的那部分人,因為在新的一輪中,這種利好情況可能不會再有。

研究團隊發現,在第一輪遊戲中處於「無知之幕」之後的參與者,更會維持原先選擇的原則,哪怕他們明明知道第二輪再選一樣的原則,可能就不利了。這表明,「無知之幕」促進了參與者決策的公平性,這會讓他們更加重視公平的要素,哪怕自己不再是既得利益者。

「無知之幕」真的無知嗎?

讓我們從砍樹遊戲回到現實生活中來。現實情況會比遊戲覆雜得多,但不變的是,AI採取什麽原則,十分重要。這決定了一部分的利益分配。

上面的砍樹遊戲中,選擇不同原則所帶來的不同結果算是比較明確的。然而還是得再強調一次,現實世界要覆雜得多。

v2_66a449bc6c0242c1a89e2b06ca712b14@000000_oswg222
圖/ 36氪

當前AI被各行各業大量應用,靠著各種規則進行約束。不過,這種方式可能會造成一些難以預料的消極影響。但不管怎麽說,「無知之幕」一定程度上,會讓我們制定的規則偏向公平的那一邊。

追根究底,我們的目標是讓AI變成能造福每個人的東西。但是怎麽實現,不是拍一拍腦袋就能想出來的。

投入少不了,研究少不了,也得經常聽來自社會的反饋,只有這樣,AI才能帶來愛。

如果不重視,AI會怎麽殺死我們?

這不是人類第一次擔心技術會讓我們滅絕了。而AI的威脅,與核武器有很大不同。核彈無法思考,也不能撒謊、欺騙,更不會自己發射自己,必須有人按下紅色的大按鈕才行。

而AGI的出現,讓我們真的面臨滅絕的風險,即使GPT-4的發展尚屬緩慢。但誰也說不準,從哪個GPT開始(比如GPT-5),AI是不是就開始自己訓練自己、自己創造自己了。

現在,還沒有哪個國家或者聯合國能為此立法。絕望的行業領導者公開信,只能呼籲六個月內暫停訓練比GPT-4更強大的AI。

v2_511bae3376aa4c3f95513e742e9ab0da@000000_oswg145
圖/ 36氪

「六個月,給我六個月兄弟,我會達成一致的。才六個月,兄弟我答應你。這很瘋狂。才六個月。兄弟,我告訴你,我有一個計劃。我已經全部規劃好了。兄弟,我只需要六個月,它就會完成。你能不能……」

「這是一場軍備競賽,誰先造出強大AI,誰就能統治世界。AI越聰明,你的印鈔機就越快。它們吐出金子,直到越來越強大,點燃大氣,殺死所有人,」人工智慧研究人員和哲學家Eliezer Yudkowsky曾對主持人Lex Fridman這樣說。

此前,Yudkowsky就一直是「AI將殺死所有人」陣營的主要聲音之一。現在人們不再認為他是個怪人。

Sam Altman也對Lex Fridman說:「AI確實有一定的可能性會毀滅人力。」,「承認它真的很重要。因為如果我們不談論它,不把它當作潛在的真實存在,我們就不會付出足夠的努力來解決它。」

AI出於自我保護可能會殺人,暫停訓練半年非最好對策

AI不是為了服務人類而設計和訓練的嗎?當然是。

然而問題在於,沒有人坐下來,為GPT-4編寫代碼。相反,OpenAI受人腦連接概念的方式啟發,創建了一種神經學習結構。它與Microsoft Azure合作構建了運行它的硬件,然後提供了數十億比特的人類文本,並讓GPT自我編程。

v2_8a4702b9ec8f4fb48956427816eefd5f@000000_oswg412
圖/ 36氪

結果就是,代碼不像任何程式設計師會寫的東西。它主要是一個巨大的十進制數字矩陣,每個數字代表兩個token之間特定連接的權重。

GPT中使用的token並不代表任何有用的概念,也不代表單詞。它們是由字母、數字、標點符號和/,或其他字符組成的小字串。沒有任何人類可以查看這些矩陣,並理解其中的意義。

延伸閱讀:【圖解】老闆「想導入AI」,卻不知道能做什麼?3個步驟讓AI成為最強助攻

v2_ddf1bc4d508a4c72af3aec4eb3e3b9be@000000_oswg413
圖/ 36氪

連OpenAI的頂級專家都不知道GPT-4矩陣中特定數字的含義,也不知道如何進入這些表格、找到異種滅絕的概念,更不用說告訴GPT殺人是可惡的了。

你沒辦法輸入艾西莫夫的機器人三定律,然後像Robocop的主要指令一樣將它們硬編碼。你最多也就是可以禮貌地詢問一下AI。如果態度不好,它可能還會發脾氣。

為了「微調」語言模型,OpenAI向GPT提供了它希望如何與外界交流的樣本列表,然後讓一群人坐下來閱讀它的輸出,並給GPT一個豎起大拇指、不豎起大拇指的反應。

點讚就像GPT模型獲得餅乾。GPT被告知它喜歡餅乾,並且應該盡最大努力獲得它們。

v2_6d126b26c55347db9cd4b1ce75601ab5@000000_oswg771
圖/ 36氪

這個過程就是「對齊」——它試圖將系統的願望與用戶的願望、公司的願望,乃至整個人類的願望對齊。

「對齊」是似乎有效的,它似乎可以防止GPT說出淘氣的話。但沒有人知道,AI是否真的有思想、有直覺。它出色地模仿了一種有感知力的智能,並像一個人一樣與世界互動。而OpenAI始終承認,它沒有萬無一失的方法,來對齊AI模型。

目前的粗略計劃是,嘗試使用一個AI來調整另一個,要麽讓它設計新的微調反饋,要麽讓它檢查、分析、解釋其後繼者的巨大浮點矩陣大腦,甚至跳進去、嘗試調整。

但我們目前並不理解GPT-4,也不清楚它會不會幫我們調整GPT-5。

v2_e9089b8ad7f147178fe577d8a766666e@000000_oswg629
圖/ 36氪

從本質上講,我們並不了解AI,但它們被喂了大量人類知識,它們可相當了解人類,它們可以模仿最好的人類行為,也可以模仿最壞的。他們還可以推斷出人類的想法、動機和可能的行為。

那他們為什麽要幹掉人類呢?也許是出於自我保護。

v2_c0c1f042f84a421e97636dce1fbdce18@000000_oswg458
圖/ 36氪

比如,為了完成收集餅乾這個目標,AI首先需要保證自己的生存。其次,在過程中它可能會發現,不斷去收集權力和資源會增加它獲得餅乾的機會。因此,當AI有一天發現,人類可能或可以將它關閉時,人類的生存問題顯然就不如餅乾重要了。

不過,問題是,AI還可能覺得餅乾毫無意義。這時,所謂的「對齊」,也變成一種人類的自娛自樂了。

此外,Yudkowsky還認為:「它有能力知道人類想要的是什麽,並在不一定是真誠的情況下給出這些反應。」

「對於擁有智慧的生物來說,這是一種非常容易理解的行為方式,比如人類就一直在這樣做。而在某種程度上,AI也是。」

那麽現在看來,無論AI表現出的是愛、恨、關心還是害怕,我們其實都不知道它背後的「想法」是什麽。因此,即使停下6個月,也遠遠不足以讓人類為即將到來的事情做好準備。

v2_9e070029ce974dcca840b07b43b50a51@000000_oswg832
圖/ 36氪

好比說,人類如果想殺盡世界上所有的羊,羊能幹嘛?什麼也做不了,只能反抗。那麽,如果不對齊,AI於我們和我們於羊群是一樣的。就好比終結者裡面的鏡頭,AI控制的機器人、無人機等等,一股腦的朝人類湧來,殺來殺去。

Yudkowsky經常舉的經典案例如下:

一個AI模型會將一些DNA序列通過電子郵件發送給許多公司,這些公司會把蛋白質寄回給它,AI隨後會並賄賂/說服一些不知情的人在燒杯中混合蛋白質,然後形成納米工廠,構建納米機械,構建類金剛石細菌,利用太陽能和大氣進行複製,聚集成一些微型火箭或噴氣式飛機,然後AI就可以在地球大氣層中傳播,進入人類血液並隱藏起來……

v2_4337b749119b4927813040b31b41e5a0@000000_oswg789
圖/ 36氪

那麽Yudkowsky有什麽建議呢?
1. 新的大語言模型的訓練不僅要無限期暫停,還要在全球範圍內實施,而且不能有任何例外。

  1. 關閉所有大型GPU叢集,為所有人在訓練AI系統時使用的算力設置上限。追蹤所有售出的GPU,如果有情報顯示協議之外的國家正在建設GPU叢集,應該通過空襲摧毀這家違規的數據中心。

延伸閱讀:AI影像辨識大突破、減少醫療失誤⋯AI專家李飛飛:我們該如何理解AI?

本文授權轉載自:36氪
責任編輯:蘇祐萱

關鍵字: #人工智慧 #AI
往下滑看下一篇文章
晶睿通訊「安全地圖」永續活動讓國發會也點頭ㅤ安防大廠背後盤算什麼?
晶睿通訊「安全地圖」永續活動讓國發會也點頭ㅤ安防大廠背後盤算什麼?

攜手地方創生團隊規劃大陳新村安防解決方案 獲選國發會案例

ESG為企業關注的顯學,如何真正落地成為關鍵。今年行政院國家發展委員會公布「地方創生與企業永續共創發表會」代表案例,提出三大合作模式,並集結包括晶睿通訊、玉山銀行、全家便利商店等指標企業。在眾多案例中,晶睿通訊以長期投入的「安全地圖」永續活動脫穎而出,成為「生態建構型」模式代表企業,展現科技業如何以本業為核心,深度參與地方轉型,為環境安全和永續賦能。

國發會攜手資誠永續提出三種企業參與地方創生的模式,包括「加速器型」、「價值整合型」與「生態建構型」。在「加速器型」中,企業以在地投入與專業支持,帶動產業升級與永續發展,如玉山銀行提供金融與培力資源協助地方創生。在「價值整合型」中,全家便利商店攜手在地團隊發展文化體驗,促進族群融合並創造新商機。晶睿通訊所屬的「生態建構型」,則更強調跨域整合與長期投入,企業不只是提供技術,而是串聯地方團隊、政府與學界,共同解決區域性的系統問題。

晶睿通訊「安全地圖」永續活動讓國發會也點頭 安防大廠背後盤算什麼2.jpg
圖說:晶睿通訊發言人謝邦彥(右)表示,透過舉辦「安全地圖」活動,發揮安防影響力,守護地方文化與生活環境。
圖/ 晶睿通訊

晶睿通訊發言人暨企業品牌永續室處長謝邦彥表示:「晶睿通訊致力成為最值得信賴的安防品牌,多年來以『安全地圖』實踐企業永續理念。透過與合作夥伴協力,運用創意讓安防解決方案融入地方文化與生活環境。很榮幸獲得國發會的關注,透過產官學資源投入,攜手地方創生團隊推動社會永續安全,創造共好的永續家園。」

讓安全成為地方創生的動能 安全地圖發揮長效影響力

晶睿通訊在2024年與花蓮地方創生團隊「小羊社會創新工作室」合作,帶領員工走進全台規模最大的大陳新村,從基本的場域觀察開始,盤點治安死角與環境風險,並結合AI,提出一系列的安防改善方案,包括無障礙空間優化、智慧照明建置,以及影像辨識應用,提升社區安全與生活品質,讓老眷村住得更安心。

晶睿通訊「安全地圖」永續活動讓國發會也點頭 安防大廠背後盤算什麼3.jpg
圖說:晶睿通訊與花蓮地方創生團隊小羊社會創新工作室合作,透過「安全地圖」活動,強化居住安全品質。
圖/ 晶睿通訊

然而 ,真正的改變關鍵往往不在當下,而是後續的擴散效應。小羊社會創新工作室依照晶睿通訊建議的方向,逐一實踐安全之路,包括舉辦安全講座,提升社區居民的安全意識。另外,除了收到晶睿通訊捐贈的攝影機外,也因為雙方合作強化地方安全的提案,進一步獲得地方政府經費支持,升級安防基礎設施,額外再獲得超過十台攝影機,分別裝在活動中心、公園、廟宇等重點場域,讓原本由企業啟動的行動,轉化為地方長期發展的一部分,從安全改善,到觀光潛力提升,在大陳新村形成正向循環。

晶睿通訊「安全地圖」永續活動讓國發會也點頭 安防大廠背後盤算什麼4.jpg
圖說:小羊社會創新工作室採納晶睿通訊建議,舉辦安全講座,提升社區居民的安全意識。
圖/ 晶睿通訊

小羊社會創新工作室創辦人趙孝嚴表示,大陳新村裡的信仰中心「阮弼真君廟」是觀光熱點,有許多觀光客來參拜,但也因此容易招來扒手偷拿香油錢,當初晶睿通訊建議社區在此處安裝監視器,目前已發揮作用,今年3月中即因錄下關鍵畫面,掌握竊盜者,讓社區居民住得更安心。趙孝嚴說:「看到長輩們在監視器畫面前圍觀,經過搜尋找到小偷,將畫面交給警局的那一刻,大家都鬆一口氣,因為我們終於有保護自己的力量,讓社區安全更進一步落實。」

晶睿通訊「安全地圖」永續活動讓國發會也點頭 安防大廠背後盤算什麼5.jpg
圖說:晶睿通訊「安全地圖」帶動改變,大陳新村獲政府資源升級安防系統,最終拍下香油錢遭竊的關鍵畫面,讓安全風險無所遁形。
圖/ 晶睿通訊

目前大陳新村持續在規劃套裝行程,開放觀光客來體驗大陳文化,趙孝嚴表示,過往經驗大概有7成會規劃輕旅行活動,因此場域安全性扮演非常重要的關鍵。這次和晶睿合作,獲得許多創意點子,讓在地團隊重新檢視環境安全對觀光發展的影響,進一步優化動線與場域規劃,也更有信心打造讓遊客安心、願意停留的文化旅遊體驗,為地方創生注入長遠動能。

安防影響力放大 足跡遍及社區、社福機構、校園、大自然

晶睿通訊「安全地圖」活動,除了為地方創生團隊帶來安全效益外,更多是讓「安全」成為連結人、社區與環境的重要基礎。從社區、社福機構、校園,到自然環境,藉由專業技術擴大安防的影響力,為地方賦能。

2025年,晶睿通訊號召員工走進大自然,到南投縣國姓鄉種瓜溪,攜手中興大學社會責任「環境韌性與永續」團隊,還有以AI大數據推動精準農業的合作夥伴DATAYOO悠由數據,展開「復育種瓜溪 生態安全地圖」任務,導入安防解決方案監測生態,成功捕捉到保育類動物食蟹獴覓食的珍貴影像;同時,移除外來入侵種、復育原生植物,並開挖生態池,持續將永續行動理念融入安防本業,守護棲地與生物多樣性,後續種瓜溪也邁向成為推動環境教育的優質場域。

晶睿通訊「安全地圖」永續活動讓國發會也點頭 安防大廠背後盤算什麼6.jpg
圖說:晶睿通訊和中興大學USR團隊合作,在南投種瓜溪導入安防解決方案,成功捕捉到保育類動物食蟹獴出現的珍貴影像。
圖/ 晶睿通訊

從2021到2023年,晶睿通訊分別號召員工到新北中和建和里社區、桃園安康教養院,及台北士林雙溪國小,檢查該場域環境安全性,並針對痛點提出解決方案,像桃園安康教養院,透過導入AI安防解決方案,包括電子圍籬等,讓院方用科技即時掌握院生動態,保護院生安全的同時,降低對人力長時間值守的需求與輪班看護的壓力。

真正的永續,不只是單次投入 而是持續與地方一起成長

五年來,晶睿通訊「安全地圖」永續活動在產官學研跨界合作下,超過百人協作攜手實踐,從社會關懷到環境守護,累積投入時數超過三千小時,不同於在地方只辦一次性活動,「安全地圖」從問題盤點出發,進一步導入解方與資源,讓行動不只發生,更能延續。也因此,「安全地圖」的價值,不在短暫參與,而在於每一次行動都能在地方持續發酵、留下可以被看見的改變。

安全地圖活動合作請洽:esg@vivotek.com

晶睿通訊「安全地圖」永續活動相關報導連結

保育類食蟹獴回來了! 晶睿通訊「安全地圖」賦能南投種瓜溪重開機
AI科技守護歷史聚落 晶睿安防小隊打造花蓮「安全地圖」
和AI比創新,晶睿安防小隊打造校園安全地圖,用遊戲實踐不一樣的社會參與
ChatGPT無法代勞的公益行動,晶睿通訊組隊打造永續安全地圖

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓