[AI洞見]AI真的能了解人類語言嗎?
[AI洞見]AI真的能了解人類語言嗎?

2017年除了虛擬貨幣以外,科技業最熱門的話題應該就是AI。對於一般大眾而言,AI就好像是味精一樣,是種「謎」一樣的白粉末,甚麼東西只要撒在一點AI就可以揚味。故此,大家對於AI的想像也催化了Pepper和Sophia這種仿人類的產品。

而這種幻想在某種程度上已經造就過度的異想,甚至恐慌。許多人在看到Sophia這類實體機器人或是Alexa這類語音助理做出「仿人類的行為」,便開始相信這些機器擁有相當於人類的智慧,但事實上,光是能重複同樣的行為,並不代表機器代表有同樣的認知能力。

今天,先以自然語言為例,讓我們來討論一下目前的聊天機器人和對話式AI(Conversational AI)是否能了解人類的自然語言?

自然語言與對話AI短介

敝人過去曾發表過兩篇關於AI的相關文章,一篇是AI產業的部分歷史,另一篇則是針對AI觀念上做一些闢謠。在此關於整體AI的觀念就不冗述,讓我們將重點放在對話型AI上。

由於AI與其說是個產業領域,不如說是社會大眾對於系統功能一種非常模糊的期許,因此其實所謂AI產業的相關技術包山包海,從非常簡單的規則式系統,到資料搜尋彙整,到機器學習都有。事實上,做AI真的是隔行如隔山。

而自然語言身為AI的分支,其實自己就很複雜了。自然語言技術從詞性(Morphology)、句法(Syntax)、語義(Semantics)、主題(Topic)、對話(Dialog)、論述(Discourse)等不同層面,其實涉及的技術層面非常的廣。

而對話式AI,嚴格上來說是自然語言的應用面。要讓一台機器能夠了解人類的語言並且與其對話,通常至少會牽涉到至少上述三個以上的自然語言領域。

對話AI系統基本架構

大家在學習語言的時候應該都記得學習文法時的痛苦。由於語言還是有相當的規則性,最早的自然語言技術和對話AI幾乎都是以規則式系統(Rule-based Systems)或是文法式分析器(Grammar-based Parser)的概念去設計的。

然而,人類在使用語言的時候常常會用一些俚語、縮寫,也常常會犯些文法上的錯誤,因此完全使用規則式的理念去設計出的系統,常常在現實產業環境中會碰上瓶頸。

因此過去二十年來,有越來越多的對話系統在某種部分會採用機器學習的統計學方法去設計系統,這樣才能夠有效處理更多的雜音和錯誤。

也因為如此,句法(Syntax)技術在過去十年在對話AI中的使用頻率逐漸下降,而新的技術多半將語義(Semantics)跟句法混合,並且結合機器學習和規則式系統來設計。

舉例說明,十年以前的對話和自然語言系統,都還相當注重名詞、動詞等的辨識,其後才是針對句中詞彙的語義進行分析(比如說大象有四隻腳、阿姨是父親或母親的姊妹之類的)。前者仰賴規則式系統,後者除了規則還需要知識庫。

但是今天的對話系統,因為大家發現分析句法並沒有甚麼太明顯的幫助,現在都是直接用機器學習去對句子進行分類,然後再用規則去擷取詞彙。而用機器學習對句子做分類和辨識,現在都粗略地稱為「意向辨識」(Intent Classification)。

舉例說明,如果你的對話系統是客服系統,你可能會有很多像是「我的聯絡資料是09xx-xxx-xxx」之類的資料,而這類意向語句可能會被分類為「提供連絡電話」,而這意向語句中的「09xx-xxx-xxx」則可能被標記為知識欄位。而經過機器學習訓練出統計模型後,這對話系統每當碰到類似的語句就可以很快地辨別出使用者在提供聯絡電話,並且從中萃取出電話號碼,之後再執行相關的對話模型。

所以,現代很多的對話系統的基本架構就是:

AI語言.jpg
圖/ 蕭瑟寡人

其實相當簡單,接下來讓我們討論一下對話模型是什麼?

對話模型(Dialog Model)是什麼?

你可以想像如果你今天打客服申訴電話,流程大致上是:

「您好,請問我該如何協助您?」
我買的XXX壞掉了。
「請問是碰到甚麼樣的問題呢?」
XXX連不上網路。
「那我請我們工程師跟您聯絡,方便提供一下您的聯絡電話嗎?」
我的連絡電話是09xx-xxx-xxx
「好,那我會請我們下一位工程師打電話幫您除錯,真的很抱歉!您有甚麼其他問題需要解答的嗎?」

而用來管理這整個流程的模型就統稱為對話模型。

以上面的對話為例,一開始系統還沒有載入任何對話模型,但是發現使用者說「產品有問題」,此意向就開啟了類似「問題回報」的對話模型。而以上對話模型很簡單,回報問題就是紀錄問題,並且索取使用者的聯絡方式。而當系統問到「您有甚麼其他問題需要解答的嗎?」時,基本上已經結束了先前的對話模型,並且在尋找新的意向。

其實現在對話系統中所使用的對話模型都沒有很複雜,基本上可分為幾大類:

  1. 查詢對話模型(Query Dialog),其實Siri大部分的功能都是查詢對話。基本上就是將幾個不同的資料來源(如維基百科、Google)的資訊整合成答案,然後提供給使用者。比如說「現在幾點?」、「離我最近的日式餐廳在哪裡?」都是查詢對話。

  2. 圖形導向對話模型(Graph-based Dialog),圖形一詞是數學上圖論中的圖,這種對話模型其實粗略而言就是資訊科學中的FA(Finite Automata)。這類對話基本上就是一大樹狀圖,而每個路徑都只有有限的互動選項。比如說我們電話上常常碰到的那種「國語請選一、For English Please dial 2」那類基本上就是這類對話模型。

  3. 表單導向對話模型(Form-based Dialog),顧名思義,就是目的將一表單填完的對話。上面提到的對話模型案例其實可以算是表單對話模型,基本上就是將問卷從頭到尾做完、儲存資料後就自動退出。

  4. 計畫導向對話模型(Plan-based Dialog),其實這類對話模型算是表單和圖形對話模型的一個改進版。計畫導向對話模型中的計畫通常都有一些邏輯性的規則,比如說我需要使用者的電話、我需要使用者的姓名、使用者需要完成轉帳之類的,而這些規則不一定需要照順序來,甚至可以將多個意向合一(比如說將「我的名字叫做王大明,電話是09xx-xxx-xxx」自動拆成「提供姓名」、「提供連絡電話」兩個意向,並滿足計畫的兩個規則)。這種對話模型雖然比較彈性,但是工程上的複雜度卻高出許多。

目前來講不管是Siri、Google Assistant、Alexa還是Cortana,大部分的對話模型還是採用前三者,偶而會碰上最後一種。原因並不是技術上做不出更複雜更有彈性的對話模型,而是因為工程成本太高,不符合商業效益。市面上很多只會報一些最新消息的那種超級陽春聊天機器人就更不用說了。

所以基本上而言,許多語音助理和聊天機器人背後的對話系統基本上就是不斷地在尋找意向來開啟對話模型。一旦開啟對話模型,使用者可以透過特定的語句開關(如很多系統會使用「從頭開始」作為開關)終結對話模型,不然就是會繼續跟這對話模型互動,直到對話完成為止。

自然語言和對話AI的技術仍卡在幾個環節

其實沒有技術背景的朋友我相信看懂了以上的解釋,應該也可以看出目前自然語言科技和對話系統的諸多限制。這些其實不能光說是工程上的技術限制而已,而是我們對於人類語言、人類心理學乃至腦神經科學的認知仍然相當有限,並不是再丟一些經費做研發馬上就能夠在幾年內突飛猛進。

而整體而言,自然語言和對話AI的技術仍卡在幾個環節,這都需要幾十年的科學研究和科技發展才能夠看到新一代的技術出爐。

最根本的問題就是不同知識領域的歧異性。光是了解金融、醫療領域的術語和對話方式就已經夠折騰人的了。目前為止,我們還沒有辦法去有效地將不同領域的知識和語言模型化、標準化,因此目前任何跨領域的對話系統都是不實用的。


更有趣的是,不管是在認知心理學還是教育心理學,我們都還沒有辦法去完整地形容人類的分類能力和學習能力。

而另一個很重要的環節就是我們所有的科學和工程上的研究都是將資訊和資料作為模型的基礎。

但事實上人類的認知和語言應用深深地受到情感(Affect)影響,而目前對於情感對人類認知能力的影響的研究也不過是最近十幾、二十年的事情。連科學都還沒走到,工程上當然更不可能有一可靠的解決方案。

短結

身為一位在AI相關產業從業人士,其實很多現在產業新聞中提到甚麼「AI讀心術可了解人類在想什麼」或是「機器人獲得沙國公民」從產業人士的角度看來,都是一些很莫名其妙的江湖玩藝。

其實很多很多AI上的技術都只是用統計學和一些規則去將重複性高的工作標準化罷了,事實上根本和取代人類的智慧有一大段距離,甚至八竿子打不著關係。

而敝人以為,AI最後發展會趨緩,因為很多技術的商用價值不夠高,在高失業率低薪資的壓力下,AI技術和低階人力工作會達到一個平衡點,AI不可能會無止盡地發展。

而科學上的AI研究,多數都是沒有甚麼商業價值的,有待過學術界的朋友都知道這部分的進步需要很長很長的一段時間。大家在講的甚麼強AI,基本上在幾十年甚至百年內都還是天方夜譚 。

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場。)

關鍵字: #人工智慧 #Pepper
往下滑看下一篇文章
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?

AI 與數據正快速落地至各行各業,從製造、金融、電信、醫療到零售,應用速度不斷加快。但在每年交易規模至少新台幣 1900 億元的商用地產領域,卻長期受到數據破碎且不透明的限制,只能仰賴人力蒐集資訊,再憑直覺和經驗去解讀資訊、做出決策,使 AI 潛在價值難以真正發揮。為回應產業轉型的核心痛點,方睿科技首度舉辦「商用地產生態系年會 2026 Raise Day」,以開放式平台為核心,串聯專業地產服務商、空間相關企業服務商、產業專業人士等多元角色,勾勒出 B2B 企業服務生態系的全貌,希望能透過科技促進數據流動,為商用地產企業協作模式開啟新的可能性。

方睿科技
方睿科技首度舉辦 2026 Raise Day,以開放式平台為核心串聯多元角色,推動商用地產邁向產業共好的新階段。
圖/ 數位時代

方睿科技雙軌策略,讓 AI 成為商用地產的決策引擎

方睿科技創辦人暨執行長吳健宇指出,在 AI 時代,人應該專注於「最有價值」的工作;然而在商用地產業中,專業人士卻有約 70% 的時間耗費在資料蒐集與整理上,真正用於判斷與決策的時間僅約 10%。方睿科技希望翻轉這樣的時間分配,讓人力從低價值的資料處理中解放,將更多心力投入在判斷、溝通與決策等創造價值的商業活動。

方睿科技
方睿科技創辦人暨執行長 吳健宇
圖/ 數位時代

為此,方睿科技提出兩條實踐路徑。第一條是建構出具備完整性、易用性與進化性的商用地產智慧平台,運用 AI 技術,將過去產業中破碎、非結構化的資料,重塑為可被運算、可驗證的標準化數據,並結合圖表與互動式介面,讓使用者能夠快速得到完整市場資訊,實現「用戶即專家」的目標。

第二條則是推動生態系聯盟,將不動產視為企業服務的核心載體,串聯設計、家具、搬遷、清潔等多元服務夥伴,使空間不再只是靜態標的,而是承載案例、服務與數據回饋的生態系節點。透過生態系夥伴累積的實務資料與服務紀錄,平台得以發展「資料即推薦」模式,推動商用地產從單點交易,邁向可擴張的 B2B 服務網絡。

獨創「資料飛輪」機制,實現用戶即專家目標

在 AI 模型日益普及的當下,真正的競爭關鍵已不在模型本身,而是能否有效率地收集資料、提高資料品質,並將其與實際決策流程緊密結合。為此,方睿科技獨家設計出一個由「資料收集、資料精煉、專家把關、決策反饋」組成的資料飛輪,回應商用地產長期面臨的資料破碎與決策效率低落問題,成為方睿科技實踐願景的第一條路徑。

方睿科技技術長郭彥良進一步說明,資料飛輪機制的運作架構。首先在資料收集階段,必須系統性蒐集公開資料、內部檔案與報告,並透過 AI 協作將圖片等非結構化資訊轉換為可用的結構化數據。接著進入資料精煉,透過資料清洗與實體對齊,將原始資訊從單純的可閱讀升級為可比較、可推論的決策依據。第三步專家把關,則引入不動產專家進行校正與產業判讀,補上模型難以理解的規則與慣例,確保關鍵數據的正確性。最後的決策反饋階段,藉由收集使用者提問與行為,檢視現有資料是否足夠精準,再回到專家校正與補齊流程,使整個系統能隨使用頻率提升而持續進化。

在資料飛輪的運作基礎上,方睿科技正積極研發商用地產智慧平台 PickPeak。郭彥良表示,PickPeak 並非單純的物件搜尋工具,而是結合深度資料與 AI 的決策輔助平台。使用者可透過自然語言互動,提出人數、預算、區位、產業屬性等多重條件,再由系統動態生成可比較、可驗證的選址方案,真正將 AI 從「回答問題的工具」,轉化為「陪伴決策的數位專家」。

方睿科技
方睿科技技術長 郭彥良
圖/ 數位時代

創新 Data to win 模式,讓 AI 深入商用地產各階段決策流程

不過,單靠數據整合與 AI 應用仍不足以支撐產業全面升級,因此,方睿科技提出的第二條路就是,推動產業生態系聯盟,整合商用地產市場上不同角色的數據,讓 AI 能夠真正成為商用地產決策時的智慧引擎。

方睿科技不動產知識創新中心總監曾凡綱指出,目前在企業、房東或物業主與各類服務供應商之間,缺乏有效的整合機制,導致企業在選址與空間規劃過程中,難以快速找到真正合適的服務與解決方案,形成明顯的產業斷點。

為解決這些斷點,方睿科技提出「Data to win」模式,以資料取代傳統「Pay to win(付費買廣告)」思維,讓真正具備經驗與實績的服務夥伴,在適當的決策節點被看見。

曾凡綱說明,在廣告投放效益越來越低的情況下,企業服務商面臨的問題已不只是「如何曝光」,而是「如何在對的地方被看見」,這將是未來的市場勝出指標;而 Data to win 正好可以協助企業服務商建立此能力,方睿科技將生態系夥伴所擁有的案例、服務紀錄與產業知識等資料,經過去識別化與結構化處理後,再嵌入企業決策流程中,讓推薦不再來自廣告投放,而是真實、可被驗證的使用經驗,透過這樣的機制,不僅提升企業決策的準確度,也能同步放大生態系夥伴在合作中的實質價值。

舉例來說,方睿科技整合辦公傢俱夥伴 Backbone 班朋實業長期累積的辦公室規劃案例與平面圖資料,讓企業在選址階段,就能同步評估空間規劃方案,加速決策流程。又如,整合出行服務夥伴 USPACE 悠勢科技的服務資料,並呈現在地圖上,協助企業評估辦公據點的交通便利性,優化員工日常通勤與出行體驗。此外,平台也可整合大樓的 ESG 認證、公共設施與服務層資訊,協助企業快速篩選符合需求的辦公大樓,提升進駐媒合效率。

方睿科技
方睿科技不動產知識創新中心總監 曾凡綱
圖/ 數位時代

「Raise Day 只是這場變革的起點。」吳健宇強調,方睿科技已經透過投資與合夥模式,將布局延伸至專業地產服務與空間經營領域,至今旗下已有商用不動產仲介、顧問與估價等專業服務的宇豐睿星,以及聚焦商用地產代銷市場的希睿創新置業。透過直接參與第一線實務運作,方睿得以更深入理解產業真實痛點,讓科技不只是工具,而能真正回應實際決策與服務需求。

此外,方睿科技未來也將持續擴大「商用地產 x 企業服務生態系」聯盟,目前包括 Backbone、USPACE、IKEA For Business、潔客幫等企業服務夥伴已率先加入;接下來,方睿科技將邀請更多擁有關鍵數據與專業能力的企業服務商加入,讓數據在安全、可控的前提下流動,進一步釋放商用地產在選址、營運與企業服務等全生命週期中的結構性價值,為產業轉型啟動下一個關鍵階段。

方睿科技
右起方睿科技共同創辦人暨營運長陳致瑋、USPACE悠勢科技共同創辦人暨執行長宋捷仁 、Backbone班朋實業創辦人暨執行長廖家葳,透過企業服務生態系合作共同為產業啟動下一個關鍵階段。
圖/ 數位時代

方睿科技官網: https://www.funraise.com.tw

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓