【觀點】宛如無盡圖書館宇宙!解析大型語言模型LLM的前世、今生與來世
【觀點】宛如無盡圖書館宇宙!解析大型語言模型LLM的前世、今生與來世

從ChatGPT 開始的大型語言模型風潮,將人工智慧帶入一個新情境,由於語言模型的文字接龍特性,也將人工智慧的討論帶回文字語言甚至文學的世界中。1726 年的《格列佛遊記》裡有台拉格多城的書寫機器,是在眾多排列木塊的紙面寫上當地語言所有字母,40個鐵製把手靠人力轉動後,字詞排列配置便會改變,若文字隨機排列出現具意義詞句,一旁負責抄寫的人便進行紀錄。義大利小說家卡爾維諾(Italo Calvino)在 1967 年也提過寫作機器的概念,他認為寫作就是如何把一個文字放在另一個文字後的事,語言創作便是元素組合的操作,與大型語言模型的原理驚人地近似。

然後是阿根廷小說家波赫士(Jorge Luis Borges),魔幻寫實的祖師爺,9月底在 arXiv 這個論文預印平台上有篇新文章《波赫士與AI》(Borges and AI),第一作者伯托(Leon Bottou )是臉書的機器學習專家,他也是 DjVu 圖像壓縮技術的主要發明者。這篇論文透過波赫士短篇小說的世界觀,試圖指出大型語言模型的本質,以及它對人工智慧發展的真正意義是什麼。

想像一下,一個語言模型背後的訓練資料包括世上所有虛構小說、日常對話與我們說不出口概念的所有語言形狀,這個無窮排列組合的文字機器便是波赫士 1940 年代想的版本。
語言與技術在源頭上是同件事,技術史學家凱文.凱利(Kevin Kelly)在《科技想要什麼》書中談到語言在人類進步史上的意義,語言出現在製造工具與用火之後,帶來的躍進影響卻比工具大。語言讓人類清楚知道自己在想什麼,從此有意識的創造成為可能,透過複雜訊息的傳遞交流,發明與創新開始有了深思熟慮的目的,然後不斷迭代演進,例如地圖與鐘表的出現帶給我們對空間時間的抽象思維能力,這種抽象思維能力又轉化為語言去探索更抽象的技術概念。

這篇論文舉波赫士的小說《巴別塔圖書館》為例,小說構想一個龐大圖書館宇宙,由相鄰六邊形房間組成,書籍擺放是隨機的,內容也毫無意義,僅由25個字符任意排列而成,出生於圖書館的管理員們相信這裡包含每本已被寫過的書、將來會被寫出的書、各種翻譯或錯誤版本與包含所有書籍的目錄書。但這裡的任何有用資訊都會被埋沒在無用資訊中,對讀者完全無意義,許多管理員陷入絕望相繼自殺,另些管理員形成邪教藉占卜尋找書籍或開始毀壞他們認為無意義的書。

論文認為我們面對的大型語言模型就像這圖書館,具資訊與知識,但缺乏洞察與真相。波赫士的另篇小說《博聞強記的富內斯》談類似的事,富內斯可看見聽見世上一切,具眼花撩亂的偉大記憶力,但他很快陷入資訊超飽和的經驗主義地獄,因為沒有忘卻差異的抽象化能力,最後自然界的每件事物在他面前都斷裂為碎片,無法構成整體,語言單元變成無數發聲運動構成的無意義瀑流。

論文也提到另一篇小說《小徑分岔的花園》,有個一心寫龐大複雜小說與建造一個所有人都會迷路迷宮的雲南總督,他被刺殺後,德國漢學家發現那未完成的書與離奇消失的迷宮其實是同件事。因迷宮分岔指的是時間意義而非空間意義。在傳統小說中,若角色做出某個選擇便會抹煞其他可能性,但在這小說迷宮,事件的所有可能性會同時發生,每個發展都會進一步擴散更多可能性或再次匯聚,始終在迷宮花園裡循環。圖書館與花園描述的都是永遠分岔下去的無窮世界,讀者的詮釋將決定後續的多層敘事發展。

library
波赫士的《巴別塔圖書館》描述一個龐大的圖書館宇宙,其中有意義的書籍被埋在無用的資訊裡,如同大型語言模型擁有大量資訊和知識,但卻缺乏深刻理解和真實見證。
圖/ shutterstuck

多重故事線超展開,不斷試誤生成出口

論文認為,在大型語言模型中,使用者的詮釋輸入與模型訓練,以及衍生的人機互動將為對話帶來結構與意義性,這種提示工程或訓練微調 (fine-tuning),可藉增加限制來引導未來的敘事發展空間,就像減去故事線或刪除花園歧路,可擁抱圖書館的巨量可能性,但同時降低資訊幻覺 (artificial hallucination)。大型語言模型與小說迷宮的另一差異是,小說的敘事者與主角無法試誤所有的故事分支可能性,但大型語言模型可不斷進行多重故事線探索,這是早在洞穴時代,書寫與印刷術被發明前的人類說故事能力;蘇格拉底曾擔心文字書寫會扼殺我們的記憶與創造,某種意義上是對的,但大型語言模型解決了這件事,我們可在花園中不斷試誤,直到這文字實驗讓路徑突變而產生迷宮出口為止。

這篇論文指出大型語言模型作為一種創造力工具的可能性,若與現有的創造力研究對話,顯然是合理的期待。以創意發生歷程眾多模型中的生成探索模型 (geneplore model) 為例,創意發生是先產生想法再迅速探索,進而再回饋引發新想法與新探索不斷迭代;這種先產生的想法是種「前發明結構」 (preinventive structures),是心理上的認知狀態,連文字都不是,也非真實存在世上的實體狀態,須持續餵養才能將初始狀態擴展成型,這與設計思考中問題解答共演化 (problem solution co-evolution) 的概念也很接近,大型語言模型若能藉對話以文字具象大腦認知狀態中的前發明結構,對這共演化進程的成形與發想效率,顯然會有幫助。

AI像烘焙、造花園,語言是創造力核心

若從創造力的物質化歷程來看,創意在具體成形前都會以文字語言或製造行為達成一定程度的物質化,這是設計師或發明家與社會的溝通探索過程,如此才能出現創意的預設用途 (affordance),賦予物品意義及用途的文化規範。實務上創意的原型製作測試都是這物質化歷程的一環,那麼,文字語言顯然是物質的前身,大型語言模型也許可藉文字脈絡將這物質化歷程推演至更前期而創造更好的創意生成銜接。

此外,從創造力的社會歷程來看,沒有任何創造是自孤立狀態完成的,即使過程中沒有與他人意見交換,創造者也必然受社會環境的啟蒙影響,這是創造力開發中強調腦力激盪與觀點取替 (perspective-taking) 的原因;大型語言模型是人工智慧,也是虛擬協作者,因此,人與語言模型的對話或迷宮花園的截枝取徑過程,其實也是個人與他者思維的碰撞過程,今日我們談專業生成內容 (PGC) 到使用者生成內容 (UGC) 到 AI 生成內容 (AIGC) 的內容協作進化,毋寧也是一種創造力社會歷程中的多元取徑進化。

ai
大型語言模型可被看作是虛擬協作者,與人類之間的對話和討論也是一種思想碰撞。
圖/ shutterstuck

在大型語言模型出現前,1998 年有本《電腦如何思考》,作者奚力思(Daniel Hillis)對通用型人工智慧提出預測,他認為創造人工智慧的過程比較不像建構一台機器,而像烘烤蛋糕或培植花園,我們不是製造人工智慧,而是營造一種讓智慧能顯露的適當環境,語言顯然是這座花園的可能性之一 (波赫士的花園巧合)。這論點呼應了技術史研究的看法,技術發展正變得愈來愈獨立,人不是技術的主人,只是技術的父母,技術是由其自身創造的,或說技術是自己的函數,像凱文.凱利發明的字「技術體」(technium),技術自成系統,透過自組織與正回饋而有突變進化。

在語言這座培植花園裡,日本設計師太刀川英輔的新書《進化思考》也指出這種語言與設計 (或說創新) 間的相似性,語言與演化一樣重複著變異選擇過程,並透過與環境交互作用進行分化優化,如果透過人為方式讓偶然的語言錯誤更頻繁發生,也許能提高創造性發生的機率。大型語言模型這自動機器顯然可操作這樣的突變實驗,我們都可想像智慧爆發的動力學概念,當資訊量超過臨界值,智慧便會指數成長,出現湧現能力,最終或可在某些機緣偶然 (serendipity) 下拓展認知邊界,跨進「未知的未知」(unknown unknown),在波赫士的宇宙裡,便能自未曾想過 (或原本不存在) 的小徑分岔走出花園,但過去我們無法進行這樣的創新實驗。

ai
在大型語言模型出現之前,奚力思(Daniel Hillis)提出了獨特觀點,認為創造人工智慧不同於建構一台機器,而是創建一個讓智慧顯露的環境。
圖/ shutterstuck

從哲學角度看,為何人類需要創造 ? 與動物的差異是,發揮創造性是人類展現能動性 (human agency) 的本質,我們面對環境不只是外部影響的被動接收者,而是主動參與者,然後才能在芸芸創意世界中找到自身位置。今日的人工智慧重新塑造了這樣的傳統認知,它既是影響我們的外部環境,也同時是我們用來展現能動性的工具。1967 年波赫士在哈佛大學諾頓講座談「隱喻」時,引用美國詩人康明斯(E.E.Cummings)的詩,與今日的大型語言模型有微妙近似,詩句說「因此我的生命 (就像是那太陽與月亮),也就模仿著一些從未發生過的事項」。

諾貝爾獎得主,也是人工智慧之父赫伯.賽門(Herbert Simon)的回憶錄提到,他對《巴別塔圖書館》與《小徑分岔的花園》等迷宮概念很著迷,曾於 1970 年到布宜諾斯艾利斯拜訪波赫士。在這場數小時訪談中,賽門問波赫士是否先有一個抽象概念,然後才用故事來示例這個思想;波赫士說不是,故事源頭是他曾在一座小圖書館待了9年,薪水低且同事難相處,他覺得整個人生都埋葬在這圖書館裡了,當時他讀了些排列組合理論,希望發明一個以無窮無盡圖書館為代表的宇宙,有歷史上所有曾被寫過的書,這激出了他內心最深處最本質的喜悅。

終於,現在我們有這座圖書館了。

責任編輯:蘇柔瑋

往下滑看下一篇文章
資本市場迎來新氣象!簡立峰:從「臺灣人的亞洲」轉向「世界的亞洲」,主動招募國際互補性新創
資本市場迎來新氣象!簡立峰:從「臺灣人的亞洲」轉向「世界的亞洲」,主動招募國際互補性新創

金融監督管理委員會聯手臺灣證券交易所、證券櫃檯買賣中心共同推動「亞洲創新籌資平臺」,象徵臺灣資本市場邁向新局面。此平臺鎖定重點產業、法規鬆綁及強化推動策略等重點項目,面對此布局,擁有產業導師、獨立董事及投資者等多元角色的簡立峰,分享他的觀點與建議。

簡立峰開門見山直言,現在是臺灣資本市場加速前進的「好時機」。從量化角度來看,臺灣上市櫃公司總市值規模達94.9兆元,國家別排名全球第8名;特別是資通訊與半導體產業,目前已有四家企業(台積電、鴻海、台達電、聯發科)進入世界市值500大。受惠科技群山加持的優勢,讓打造「亞洲NASDAQ」的願景有厚實的底氣。

此外,簡立峰相當肯定本次針對創新版的制度優化,提供更鬆綁、具有創意的做法,大幅提高了國際團隊來臺上市的便利性。不過,除了擴大投資規模與流通性,簡立峰也提出三個策略觀點,鼓勵亞洲創新籌資平臺多家善用制度優勢,設定更宏大的發展目標。

觀點一:深化內部資本市場創新動能,鼓勵「小金雞」早期上市

這幾年臺灣的新創趨勢,簡立峰指出一個現象:現今成功的上市櫃案例,多半是大型集團的「小金雞」(子公司或孫公司),但集團通常傾向在小金雞獲利穩定並能確保控股後,才會在市場上釋出少數股份(25%)允許其上市。此情況容易造成臺灣的資本市場動能不足,甚至讓國際以為臺灣缺乏新創的誤解。

對此,簡立峰認為創新板的價值,即是鼓勵小金雞能提早登板的腳步,一來展現創新能量、翻轉產業典範;二來邁向資本市場不只是需要募資,更重要是上市後的經營策略,知道自身優勢所在,將營運方向隨時調整更貼近資本市場的需求。

因應簡立峰的觀察,本次創新板的新制,即是讓本國公司的股票集保期間從二年縮短為一年,並免除三年的承銷商保薦。此舉有助於降低集團小金雞提早進入市場的法規門檻,讓企業能更快速、更早實現「面對市場」的目標。

觀點二:強化產業聚落思維,主動招募國際上與臺灣互補的新創

亞洲創新籌資平臺成立的重要訴求之一,便是要成為亞洲NASDAQ。簡立峰直言,「如果是以此為願景,那它就不應該只是『臺灣人的亞洲』,而是成為『世界的亞洲』,也就是主動吸引更多國家的創新企業來臺上市,那麼招商策略必須從被動等待,轉為主動積極洽談。」

至於招商的目標該如何鎖定?簡立峰認為臺灣資本市場最重要的價值,在於其聚落現象,因此建議可瞄準能與臺灣產業有高度互補的區域國家或技術領域。讓臺灣的供應鏈業者與他們成為戰略夥伴關係,共同分享這些國外企業來臺上市後所創造的利潤。

如果是區域國家,簡立峰拿「以色列」為例,該國新創擁有強大的創意和軟硬整合能力,但缺乏生產製造基地,若考慮來臺灣上市或募資,將有利於他們與臺灣的製造商建立關係,增加其信賴度,並容易找到供應商。至於前瞻技術方面,簡立峰認為矽光子、3D封裝/先進封裝、AI資料中心冷卻等,與臺灣半導體產業有緊密合作關係,可借助資本市場吸引這些企業來臺投資、上市,不僅是實體的產業聚落,更有助於形成虛擬的資本市場聚落。

簡立峰的論述,也呼應亞洲創新籌資平臺鎖定的重點產業,涵蓋半導體、人工智慧、智慧製造、數位雲端、機器人、次世代通訊等前瞻新經濟領域。另外國際企業來臺上市的門檻,證交所也優化了既有制度,針對主要營運地或股東結構均未涉及陸港澳地區之外國企業,調整臺籍董事席次過半規範,僅須設置臺籍獨立董事至少二席。

觀點三:吸引國際分析師、產業媒體,成為亞洲NASDAQ絕佳觀測站

最後,簡立峰認為一個能持續有活水挹注的國際籌資平臺,成功上市是手段,但真正關鍵的目的,是能持續獲得投資並取得市場關注的聲譽。要獲得聲量,具體的執行策略是提高國際能見度,吸引國際級分析師的關注。

簡立峰以當時Appier在日本上市為例,他提到上市對Appier的最大益處並非來自本益比,而是被國際金融機構的分析師看到,並獲得他們的分析與報導。「這些報導對於B2B企業來說,是最紮實的行銷加分,能極大化取得業界客戶的信賴。」

簡立峰認為亞洲創新籌資平臺的下一步,可主動規劃一些登板的亮點案例,形成「標竿」進而產生群聚效應。對此,證交所回應未來將以多元行銷策略,配套措施包括加強外國公司資訊揭露,提高法人說明會的召開頻率,藉此提升企業國際知名度,為國際分析師提供更充足的資訊來源,助力更多指標的企業打響全球名氣。

國家發展委員會副主任委員詹方冠在亞洲創新籌資平臺啟動典禮上提到,臺灣經濟發展已從勞動密集、資本密集階段,進入到創新驅動的全新里程。最後簡立峰肯定表示,「亞洲創新籌資平臺的成立後,期待它的角色能槓桿資本市場的力量,讓『臺灣人的產業』轉變為『臺灣人主導的產業』,仰賴國際企業壯大臺灣的人才庫,同時也為臺灣創造新的經濟發展動能。」

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓