【觀點】宛如無盡圖書館宇宙!解析大型語言模型LLM的前世、今生與來世
【觀點】宛如無盡圖書館宇宙!解析大型語言模型LLM的前世、今生與來世

從ChatGPT 開始的大型語言模型風潮,將人工智慧帶入一個新情境,由於語言模型的文字接龍特性,也將人工智慧的討論帶回文字語言甚至文學的世界中。1726 年的《格列佛遊記》裡有台拉格多城的書寫機器,是在眾多排列木塊的紙面寫上當地語言所有字母,40個鐵製把手靠人力轉動後,字詞排列配置便會改變,若文字隨機排列出現具意義詞句,一旁負責抄寫的人便進行紀錄。義大利小說家卡爾維諾(Italo Calvino)在 1967 年也提過寫作機器的概念,他認為寫作就是如何把一個文字放在另一個文字後的事,語言創作便是元素組合的操作,與大型語言模型的原理驚人地近似。

然後是阿根廷小說家波赫士(Jorge Luis Borges),魔幻寫實的祖師爺,9月底在 arXiv 這個論文預印平台上有篇新文章《波赫士與AI》(Borges and AI),第一作者伯托(Leon Bottou )是臉書的機器學習專家,他也是 DjVu 圖像壓縮技術的主要發明者。這篇論文透過波赫士短篇小說的世界觀,試圖指出大型語言模型的本質,以及它對人工智慧發展的真正意義是什麼。

想像一下,一個語言模型背後的訓練資料包括世上所有虛構小說、日常對話與我們說不出口概念的所有語言形狀,這個無窮排列組合的文字機器便是波赫士 1940 年代想的版本。
語言與技術在源頭上是同件事,技術史學家凱文.凱利(Kevin Kelly)在《科技想要什麼》書中談到語言在人類進步史上的意義,語言出現在製造工具與用火之後,帶來的躍進影響卻比工具大。語言讓人類清楚知道自己在想什麼,從此有意識的創造成為可能,透過複雜訊息的傳遞交流,發明與創新開始有了深思熟慮的目的,然後不斷迭代演進,例如地圖與鐘表的出現帶給我們對空間時間的抽象思維能力,這種抽象思維能力又轉化為語言去探索更抽象的技術概念。

這篇論文舉波赫士的小說《巴別塔圖書館》為例,小說構想一個龐大圖書館宇宙,由相鄰六邊形房間組成,書籍擺放是隨機的,內容也毫無意義,僅由25個字符任意排列而成,出生於圖書館的管理員們相信這裡包含每本已被寫過的書、將來會被寫出的書、各種翻譯或錯誤版本與包含所有書籍的目錄書。但這裡的任何有用資訊都會被埋沒在無用資訊中,對讀者完全無意義,許多管理員陷入絕望相繼自殺,另些管理員形成邪教藉占卜尋找書籍或開始毀壞他們認為無意義的書。

論文認為我們面對的大型語言模型就像這圖書館,具資訊與知識,但缺乏洞察與真相。波赫士的另篇小說《博聞強記的富內斯》談類似的事,富內斯可看見聽見世上一切,具眼花撩亂的偉大記憶力,但他很快陷入資訊超飽和的經驗主義地獄,因為沒有忘卻差異的抽象化能力,最後自然界的每件事物在他面前都斷裂為碎片,無法構成整體,語言單元變成無數發聲運動構成的無意義瀑流。

論文也提到另一篇小說《小徑分岔的花園》,有個一心寫龐大複雜小說與建造一個所有人都會迷路迷宮的雲南總督,他被刺殺後,德國漢學家發現那未完成的書與離奇消失的迷宮其實是同件事。因迷宮分岔指的是時間意義而非空間意義。在傳統小說中,若角色做出某個選擇便會抹煞其他可能性,但在這小說迷宮,事件的所有可能性會同時發生,每個發展都會進一步擴散更多可能性或再次匯聚,始終在迷宮花園裡循環。圖書館與花園描述的都是永遠分岔下去的無窮世界,讀者的詮釋將決定後續的多層敘事發展。

library
波赫士的《巴別塔圖書館》描述一個龐大的圖書館宇宙,其中有意義的書籍被埋在無用的資訊裡,如同大型語言模型擁有大量資訊和知識,但卻缺乏深刻理解和真實見證。
圖/ shutterstuck

多重故事線超展開,不斷試誤生成出口

論文認為,在大型語言模型中,使用者的詮釋輸入與模型訓練,以及衍生的人機互動將為對話帶來結構與意義性,這種提示工程或訓練微調 (fine-tuning),可藉增加限制來引導未來的敘事發展空間,就像減去故事線或刪除花園歧路,可擁抱圖書館的巨量可能性,但同時降低資訊幻覺 (artificial hallucination)。大型語言模型與小說迷宮的另一差異是,小說的敘事者與主角無法試誤所有的故事分支可能性,但大型語言模型可不斷進行多重故事線探索,這是早在洞穴時代,書寫與印刷術被發明前的人類說故事能力;蘇格拉底曾擔心文字書寫會扼殺我們的記憶與創造,某種意義上是對的,但大型語言模型解決了這件事,我們可在花園中不斷試誤,直到這文字實驗讓路徑突變而產生迷宮出口為止。

這篇論文指出大型語言模型作為一種創造力工具的可能性,若與現有的創造力研究對話,顯然是合理的期待。以創意發生歷程眾多模型中的生成探索模型 (geneplore model) 為例,創意發生是先產生想法再迅速探索,進而再回饋引發新想法與新探索不斷迭代;這種先產生的想法是種「前發明結構」 (preinventive structures),是心理上的認知狀態,連文字都不是,也非真實存在世上的實體狀態,須持續餵養才能將初始狀態擴展成型,這與設計思考中問題解答共演化 (problem solution co-evolution) 的概念也很接近,大型語言模型若能藉對話以文字具象大腦認知狀態中的前發明結構,對這共演化進程的成形與發想效率,顯然會有幫助。

AI像烘焙、造花園,語言是創造力核心

若從創造力的物質化歷程來看,創意在具體成形前都會以文字語言或製造行為達成一定程度的物質化,這是設計師或發明家與社會的溝通探索過程,如此才能出現創意的預設用途 (affordance),賦予物品意義及用途的文化規範。實務上創意的原型製作測試都是這物質化歷程的一環,那麼,文字語言顯然是物質的前身,大型語言模型也許可藉文字脈絡將這物質化歷程推演至更前期而創造更好的創意生成銜接。

此外,從創造力的社會歷程來看,沒有任何創造是自孤立狀態完成的,即使過程中沒有與他人意見交換,創造者也必然受社會環境的啟蒙影響,這是創造力開發中強調腦力激盪與觀點取替 (perspective-taking) 的原因;大型語言模型是人工智慧,也是虛擬協作者,因此,人與語言模型的對話或迷宮花園的截枝取徑過程,其實也是個人與他者思維的碰撞過程,今日我們談專業生成內容 (PGC) 到使用者生成內容 (UGC) 到 AI 生成內容 (AIGC) 的內容協作進化,毋寧也是一種創造力社會歷程中的多元取徑進化。

ai
大型語言模型可被看作是虛擬協作者,與人類之間的對話和討論也是一種思想碰撞。
圖/ shutterstuck

在大型語言模型出現前,1998 年有本《電腦如何思考》,作者奚力思(Daniel Hillis)對通用型人工智慧提出預測,他認為創造人工智慧的過程比較不像建構一台機器,而像烘烤蛋糕或培植花園,我們不是製造人工智慧,而是營造一種讓智慧能顯露的適當環境,語言顯然是這座花園的可能性之一 (波赫士的花園巧合)。這論點呼應了技術史研究的看法,技術發展正變得愈來愈獨立,人不是技術的主人,只是技術的父母,技術是由其自身創造的,或說技術是自己的函數,像凱文.凱利發明的字「技術體」(technium),技術自成系統,透過自組織與正回饋而有突變進化。

在語言這座培植花園裡,日本設計師太刀川英輔的新書《進化思考》也指出這種語言與設計 (或說創新) 間的相似性,語言與演化一樣重複著變異選擇過程,並透過與環境交互作用進行分化優化,如果透過人為方式讓偶然的語言錯誤更頻繁發生,也許能提高創造性發生的機率。大型語言模型這自動機器顯然可操作這樣的突變實驗,我們都可想像智慧爆發的動力學概念,當資訊量超過臨界值,智慧便會指數成長,出現湧現能力,最終或可在某些機緣偶然 (serendipity) 下拓展認知邊界,跨進「未知的未知」(unknown unknown),在波赫士的宇宙裡,便能自未曾想過 (或原本不存在) 的小徑分岔走出花園,但過去我們無法進行這樣的創新實驗。

ai
在大型語言模型出現之前,奚力思(Daniel Hillis)提出了獨特觀點,認為創造人工智慧不同於建構一台機器,而是創建一個讓智慧顯露的環境。
圖/ shutterstuck

從哲學角度看,為何人類需要創造 ? 與動物的差異是,發揮創造性是人類展現能動性 (human agency) 的本質,我們面對環境不只是外部影響的被動接收者,而是主動參與者,然後才能在芸芸創意世界中找到自身位置。今日的人工智慧重新塑造了這樣的傳統認知,它既是影響我們的外部環境,也同時是我們用來展現能動性的工具。1967 年波赫士在哈佛大學諾頓講座談「隱喻」時,引用美國詩人康明斯(E.E.Cummings)的詩,與今日的大型語言模型有微妙近似,詩句說「因此我的生命 (就像是那太陽與月亮),也就模仿著一些從未發生過的事項」。

諾貝爾獎得主,也是人工智慧之父赫伯.賽門(Herbert Simon)的回憶錄提到,他對《巴別塔圖書館》與《小徑分岔的花園》等迷宮概念很著迷,曾於 1970 年到布宜諾斯艾利斯拜訪波赫士。在這場數小時訪談中,賽門問波赫士是否先有一個抽象概念,然後才用故事來示例這個思想;波赫士說不是,故事源頭是他曾在一座小圖書館待了9年,薪水低且同事難相處,他覺得整個人生都埋葬在這圖書館裡了,當時他讀了些排列組合理論,希望發明一個以無窮無盡圖書館為代表的宇宙,有歷史上所有曾被寫過的書,這激出了他內心最深處最本質的喜悅。

終於,現在我們有這座圖書館了。

責任編輯:蘇柔瑋

往下滑看下一篇文章
買賣屋不再狂刷篩選條件!永慶「AI特助」用AI打造房產科技的個人化時代
買賣屋不再狂刷篩選條件!永慶「AI特助」用AI打造房產科技的個人化時代

人的一生中平均只買一到兩次房,不過面對買房的人生大事,卻最缺乏經驗,幾乎每次都是「買房菜鳥」。從動念開始,到真正擁有一個屬於自己的家,過程中充滿資訊落差與溝通門檻,考驗的不只是預算,還有決策能力。

「永慶認為,房仲最重要的三大價值,在於能否提供消費者安全、公平、效率的購售屋體驗。」永慶房屋總經理吳良治指出,消費者痛點在哪,服務就該做到哪。

永慶房屋
永慶房屋總經理 吳良治
圖/ 數位時代

所謂「安全」,不只是屋況與產權無虞,更包括房價是否合理、是否能杜絕投機與詐騙;「公平」則攸關資訊是否公開透明,買賣雙方對行情、屋況的掌握是否一致;而「效率」則是解決資訊爆炸與流程繁瑣的問題,讓交易更順暢——這三大價值,就是永慶服務設計的起點。

當傳統找房模式逐漸無法滿足使用者對安全、即時、便利與個人化的需求時,科技便成為破題關鍵。永慶房屋以「房產科技領航者」自居,從數位化、行動化一路推進至智慧化、人性化,最終定義出「個人化」的新世代房產服務,不只改變買賣流程,也重塑人與房產科技的關係,為業界開啟下一階段房產科技轉型藍圖。

永慶打造AI特助,開啟個人化買賣屋體驗

「安全、公平、效率。這三大價值講起來簡單,要落實並不容易,需要長期深耕。」永慶房屋業管部協理陳賜傑指出,買房過程從動機產生、資訊蒐集、實地看屋到談價與成交,每個階段都有不同的痛點,也正是永慶投入科技應用的核心動力。

他舉例,消費者可先透過「買屋力找房」掌握預算落點,或以「地圖/捷運找房」,針對區域快速聚焦潛力物件。同時搭配「誠實安心認證」,快速掌握房屋是否為短期交易、凶宅、輻射屋的屋況,也分享永慶提供的不限屋齡漏水保固保障。

進入看屋階段,永慶也推出「VR美裝」、「AI煥裝」等功能,讓線上賞屋一事更具象、更符合人性,不僅彷彿身歷其境走入房屋欣賞格局、更可以透過生成式AI,搶先欣賞房屋未來裝潢模樣。談價時,更有領先政府2-3個月揭露的「誠實房價報告書」。在交易過程和售後,永慶還有六大安心保障,讓消費者全程安心。

當消費者向永慶房屋經紀人員洽談服務時,永慶獨創的「i特助」將提供強大的「人機協作」服務。陳賜傑說明,i特助以LINE群組為載體,加入買家、家屬、永慶業務與AI機器人,從找房、比價、導覽到與家人討論,都能在平台上完成,讓「個人化」成為貫穿整體買賣流程的智慧服務,實現「一站整合資訊+多人參與決策+專人即時支援」的目標。

至於最新推出的「永慶AI特助」,顛覆傳統的篩選找房模式,直接向永慶AI發問找房,讓找房更容易!消費者可以用口語的方式,向AI特助進行提問,如問社區、問特色、問行情。AI特助系統即時整合龐大資料,自動比對條件推薦潛力物件、分享房屋特色、摘要重點。「目前市場上應該只有我們做到!」他直言。

永慶房屋
永慶房屋業管部協理 陳賜傑
圖/ 數位時代

永慶一步步用科技解決消費者痛點,成房產科技發展史

永慶房屋
永慶房產科技演進史
圖/ 永慶房屋

圍繞著消費者需求,永慶房屋早已踏上科技轉型的旅程,一步步演進至今。永慶房產集團資訊部協理呂學堯回顧,從2000年永慶將紙本住宅資訊數位化開始,率先「e化」做出「永慶房仲網」,不只讓找房效率提升,也同步建置投機客資料庫,累積了9,000多筆投機客資料,為交易把關。隨後,因應智慧型手機普及,永慶再推出「永慶快搜APP」,實現隨時隨地找房的行動化革新。

進入2016年,大數據成為科技趨勢,永慶也積極應用大數據,推出「猜你喜歡」等智慧推薦應用,提升消費者與經紀人員的決策效率。為實踐「人性化」體驗,永慶聚焦網上看照片選物件的模式,查看屋況不夠直覺具象等問題,透過VR美裝、實境找房、AI煥裝,讓消費者即使遠距賞屋,也能輕鬆掌握空間格局、生活環境、模擬裝潢,全面掌握物件潛力。

邁入AI時代後,「個人化」成為永慶聚焦的目標。過去消費者需自行查找彙整,現在則是「不用找,只要問」,AI即可即時整理、摘要、推薦,甚至挖掘原本未被注意的潛力物件。

永慶房屋
永慶房產集團資訊部協理 呂學堯
圖/ 數位時代

當被問及是否擔心技術被業界複製,呂學堯直言:「這些技術表面上大家都能做,但能不能做深、做在對的地方,才是關鍵。」永慶之所以能持續走在產業前端,背後仰賴四項核心能力:

其一、孫慶餘董事長對科技的堅持和遠見,從ADSL到iPad,永慶房屋總是率先導入科技。其二、永慶長期大量投資在房產科技開發。其三、集團內部擁有超過300人的數位與資訊團隊,自主研發不假外求。其四、技術與業務高度同步,能即時回應現場需求,提出真正可用的解方。

呂學堯分享,永慶房屋不斷升級的便利科技,再加上完整的誠實服務,獲得許多消費者的指名服務,如今已是雙北地區門店數量最多的房仲品牌。面對科技的飛速發展,永慶也不斷蓄積自己的科技創新能量,即使永慶數位與資訊團隊已有超過300人的規模,我們仍持續招募更多數位與資通訊領域的人才,為購售屋服務探索更多創意、落地更多應用。

人機協作新時代,誠實房仲角色更深化

陳賜傑表示,當AI能代勞繁瑣的行政作業,經紀人員就能將心力放在真正有價值的溝通與判斷上。他也強調,AI與人是協作關係,房仲其實很難被取代,因為無論如何都得走進實體流程。「進到現場就知道,這個行業有很多『眉角』,許多細節需要觀察與互動才能掌握,AI是看不出來的。」

他舉例,一位台商先生偏好安靜社區,太太則重視生活機能與市中心便利。實際上房子是買給留在台灣的太太住,應以她的需求為主。如何引導雙方表達意見、理解彼此的需求,並促成共識,就是經紀人員的專業所在。「AI可以幫你找到房子,但房仲才能幫你找到一個家。」

最後,在一切都能被自動化的時代,什麼才是無法被取代的?誠實,也許正是這個時代最稀缺的技術。先誠實,再成交——這是永慶房產集團董事長孫慶餘提出的六字箴言,也是品牌最核心的堅持。未來,永慶房屋將持續以「誠實+科技」為基底,讓房產科技回歸人性,讓房仲專業發揮更深價值。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓