[AI洞見]AI真的能了解人類語言嗎?
[AI洞見]AI真的能了解人類語言嗎?

2017年除了虛擬貨幣以外,科技業最熱門的話題應該就是AI。對於一般大眾而言,AI就好像是味精一樣,是種「謎」一樣的白粉末,甚麼東西只要撒在一點AI就可以揚味。故此,大家對於AI的想像也催化了Pepper和Sophia這種仿人類的產品。

而這種幻想在某種程度上已經造就過度的異想,甚至恐慌。許多人在看到Sophia這類實體機器人或是Alexa這類語音助理做出「仿人類的行為」,便開始相信這些機器擁有相當於人類的智慧,但事實上,光是能重複同樣的行為,並不代表機器代表有同樣的認知能力。

今天,先以自然語言為例,讓我們來討論一下目前的聊天機器人和對話式AI(Conversational AI)是否能了解人類的自然語言?

自然語言與對話AI短介

敝人過去曾發表過兩篇關於AI的相關文章,一篇是AI產業的部分歷史,另一篇則是針對AI觀念上做一些闢謠。在此關於整體AI的觀念就不冗述,讓我們將重點放在對話型AI上。

由於AI與其說是個產業領域,不如說是社會大眾對於系統功能一種非常模糊的期許,因此其實所謂AI產業的相關技術包山包海,從非常簡單的規則式系統,到資料搜尋彙整,到機器學習都有。事實上,做AI真的是隔行如隔山。

而自然語言身為AI的分支,其實自己就很複雜了。自然語言技術從詞性(Morphology)、句法(Syntax)、語義(Semantics)、主題(Topic)、對話(Dialog)、論述(Discourse)等不同層面,其實涉及的技術層面非常的廣。

而對話式AI,嚴格上來說是自然語言的應用面。要讓一台機器能夠了解人類的語言並且與其對話,通常至少會牽涉到至少上述三個以上的自然語言領域。

對話AI系統基本架構

大家在學習語言的時候應該都記得學習文法時的痛苦。由於語言還是有相當的規則性,最早的自然語言技術和對話AI幾乎都是以規則式系統(Rule-based Systems)或是文法式分析器(Grammar-based Parser)的概念去設計的。

然而,人類在使用語言的時候常常會用一些俚語、縮寫,也常常會犯些文法上的錯誤,因此完全使用規則式的理念去設計出的系統,常常在現實產業環境中會碰上瓶頸。

因此過去二十年來,有越來越多的對話系統在某種部分會採用機器學習的統計學方法去設計系統,這樣才能夠有效處理更多的雜音和錯誤。

也因為如此,句法(Syntax)技術在過去十年在對話AI中的使用頻率逐漸下降,而新的技術多半將語義(Semantics)跟句法混合,並且結合機器學習和規則式系統來設計。

舉例說明,十年以前的對話和自然語言系統,都還相當注重名詞、動詞等的辨識,其後才是針對句中詞彙的語義進行分析(比如說大象有四隻腳、阿姨是父親或母親的姊妹之類的)。前者仰賴規則式系統,後者除了規則還需要知識庫。

但是今天的對話系統,因為大家發現分析句法並沒有甚麼太明顯的幫助,現在都是直接用機器學習去對句子進行分類,然後再用規則去擷取詞彙。而用機器學習對句子做分類和辨識,現在都粗略地稱為「意向辨識」(Intent Classification)。

舉例說明,如果你的對話系統是客服系統,你可能會有很多像是「我的聯絡資料是09xx-xxx-xxx」之類的資料,而這類意向語句可能會被分類為「提供連絡電話」,而這意向語句中的「09xx-xxx-xxx」則可能被標記為知識欄位。而經過機器學習訓練出統計模型後,這對話系統每當碰到類似的語句就可以很快地辨別出使用者在提供聯絡電話,並且從中萃取出電話號碼,之後再執行相關的對話模型。

所以,現代很多的對話系統的基本架構就是:

AI語言.jpg
圖/ 蕭瑟寡人

其實相當簡單,接下來讓我們討論一下對話模型是什麼?

對話模型(Dialog Model)是什麼?

你可以想像如果你今天打客服申訴電話,流程大致上是:

「您好,請問我該如何協助您?」
我買的XXX壞掉了。
「請問是碰到甚麼樣的問題呢?」
XXX連不上網路。
「那我請我們工程師跟您聯絡,方便提供一下您的聯絡電話嗎?」
我的連絡電話是09xx-xxx-xxx
「好,那我會請我們下一位工程師打電話幫您除錯,真的很抱歉!您有甚麼其他問題需要解答的嗎?」

而用來管理這整個流程的模型就統稱為對話模型。

以上面的對話為例,一開始系統還沒有載入任何對話模型,但是發現使用者說「產品有問題」,此意向就開啟了類似「問題回報」的對話模型。而以上對話模型很簡單,回報問題就是紀錄問題,並且索取使用者的聯絡方式。而當系統問到「您有甚麼其他問題需要解答的嗎?」時,基本上已經結束了先前的對話模型,並且在尋找新的意向。

其實現在對話系統中所使用的對話模型都沒有很複雜,基本上可分為幾大類:

  1. 查詢對話模型(Query Dialog),其實Siri大部分的功能都是查詢對話。基本上就是將幾個不同的資料來源(如維基百科、Google)的資訊整合成答案,然後提供給使用者。比如說「現在幾點?」、「離我最近的日式餐廳在哪裡?」都是查詢對話。

  2. 圖形導向對話模型(Graph-based Dialog),圖形一詞是數學上圖論中的圖,這種對話模型其實粗略而言就是資訊科學中的FA(Finite Automata)。這類對話基本上就是一大樹狀圖,而每個路徑都只有有限的互動選項。比如說我們電話上常常碰到的那種「國語請選一、For English Please dial 2」那類基本上就是這類對話模型。

  3. 表單導向對話模型(Form-based Dialog),顧名思義,就是目的將一表單填完的對話。上面提到的對話模型案例其實可以算是表單對話模型,基本上就是將問卷從頭到尾做完、儲存資料後就自動退出。

  4. 計畫導向對話模型(Plan-based Dialog),其實這類對話模型算是表單和圖形對話模型的一個改進版。計畫導向對話模型中的計畫通常都有一些邏輯性的規則,比如說我需要使用者的電話、我需要使用者的姓名、使用者需要完成轉帳之類的,而這些規則不一定需要照順序來,甚至可以將多個意向合一(比如說將「我的名字叫做王大明,電話是09xx-xxx-xxx」自動拆成「提供姓名」、「提供連絡電話」兩個意向,並滿足計畫的兩個規則)。這種對話模型雖然比較彈性,但是工程上的複雜度卻高出許多。

目前來講不管是Siri、Google Assistant、Alexa還是Cortana,大部分的對話模型還是採用前三者,偶而會碰上最後一種。原因並不是技術上做不出更複雜更有彈性的對話模型,而是因為工程成本太高,不符合商業效益。市面上很多只會報一些最新消息的那種超級陽春聊天機器人就更不用說了。

所以基本上而言,許多語音助理和聊天機器人背後的對話系統基本上就是不斷地在尋找意向來開啟對話模型。一旦開啟對話模型,使用者可以透過特定的語句開關(如很多系統會使用「從頭開始」作為開關)終結對話模型,不然就是會繼續跟這對話模型互動,直到對話完成為止。

自然語言和對話AI的技術仍卡在幾個環節

其實沒有技術背景的朋友我相信看懂了以上的解釋,應該也可以看出目前自然語言科技和對話系統的諸多限制。這些其實不能光說是工程上的技術限制而已,而是我們對於人類語言、人類心理學乃至腦神經科學的認知仍然相當有限,並不是再丟一些經費做研發馬上就能夠在幾年內突飛猛進。

而整體而言,自然語言和對話AI的技術仍卡在幾個環節,這都需要幾十年的科學研究和科技發展才能夠看到新一代的技術出爐。

最根本的問題就是不同知識領域的歧異性。光是了解金融、醫療領域的術語和對話方式就已經夠折騰人的了。目前為止,我們還沒有辦法去有效地將不同領域的知識和語言模型化、標準化,因此目前任何跨領域的對話系統都是不實用的。


更有趣的是,不管是在認知心理學還是教育心理學,我們都還沒有辦法去完整地形容人類的分類能力和學習能力。

而另一個很重要的環節就是我們所有的科學和工程上的研究都是將資訊和資料作為模型的基礎。

但事實上人類的認知和語言應用深深地受到情感(Affect)影響,而目前對於情感對人類認知能力的影響的研究也不過是最近十幾、二十年的事情。連科學都還沒走到,工程上當然更不可能有一可靠的解決方案。

短結

身為一位在AI相關產業從業人士,其實很多現在產業新聞中提到甚麼「AI讀心術可了解人類在想什麼」或是「機器人獲得沙國公民」從產業人士的角度看來,都是一些很莫名其妙的江湖玩藝。

其實很多很多AI上的技術都只是用統計學和一些規則去將重複性高的工作標準化罷了,事實上根本和取代人類的智慧有一大段距離,甚至八竿子打不著關係。

而敝人以為,AI最後發展會趨緩,因為很多技術的商用價值不夠高,在高失業率低薪資的壓力下,AI技術和低階人力工作會達到一個平衡點,AI不可能會無止盡地發展。

而科學上的AI研究,多數都是沒有甚麼商業價值的,有待過學術界的朋友都知道這部分的進步需要很長很長的一段時間。大家在講的甚麼強AI,基本上在幾十年甚至百年內都還是天方夜譚 。

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場。)

關鍵字: #人工智慧 #Pepper
往下滑看下一篇文章
聚焦智慧醫療,汎定科技藉 NVIDIA 新創計畫挹助,加速小心肝 AI 軟體服務開發與全球布局
聚焦智慧醫療,汎定科技藉 NVIDIA 新創計畫挹助,加速小心肝 AI 軟體服務開發與全球布局

汎定科技(FindingsTech)成立於2020年,以力學模擬、人工智慧與數據分析三大核心技術為基礎,迅速在智慧醫療領域打出名號,目前公司的主力產品有二:分別是小心肝 AI(HepatoWell.ai)與 AI Foundry 服務,前者透過 NVIDIA MONAI 為框架的 MRI 影像訓練,開發計算量化脂肪肝程度的 AI 軟體;後者則是因應客戶需求、使用情境提供最佳 AI 架構與解決方案,例如跟豐藝母公司和醫學中心合作開發的 OmniSurgery 手術房 AI 器械盤點平台,用來協助醫院器械供應中心自動偵測與盤點醫療機械設備。

汎定科技之所以會聚焦 AI 醫療影像市場,與創辦人的學經歷背景息息相關。汎定科技總經理許駿鵬表示:「10多年前,我曾在麻省理工學院的電腦科學與人工智慧實驗室擔任科學家,當時的計畫主持人都聚焦在醫療影像跟重症數據分析,在過程中深刻感受到,我們雖然不是第一線醫護人員,但依然可以透過科技實現『曲線救人』。」這段經驗以及教授鼓勵,讓其決定創立汎定科技,目標是以 AI 科學幫助醫療體系更快找到精準答案,無論是物理實驗、醫療輔助判別與撰寫報告都可以即時掌握關鍵發現 (Findings)。

數位時代 X NVIDIA _ FindingsTech
圖/ 數位時代

卓越的創新與技術能量,不僅於參加 NVIDIA Inception 新創計畫後獲得更多 AI 技術資源,更在2024年獲得豐藝集團的投資支持,正式成為集團旗下成員,接下來,汎定科技除持續深化產品服務,也會透過集團資源、以軟硬整合等方式擴展在醫療產業的服務能量。

聚焦脂肪肝 MRI 影像分析,汎定科技小心肝 AI–HepatoWell.ai– 進入臨床試驗階段

研究機構 Fortune Business Insight 預測,全球 AI 醫療影像市場規模將從2025年的392.5億美元快速成長到2032年的5,041.7億美元,年複合成長率高達44%,其中,「解決方案」類型的產品需求最高,其次才是平台型服務,顯示市場最需要的是能夠真正解決臨床痛點的應用。

在眾多 AI 醫療影像市場中,汎定科技會鎖定脂肪肝 MRI 影像分析、推出小心肝 AI(HepatoWell.ai)的原因有三:

首先是 AI 全自動量化計算肝臟脂肪密度。 全球脂肪肝盛行率高。目前的檢測脂肪肝的方式多為質化判斷不夠精準;即便現行的量化分析,也需要人工圈選。HepatoWell.ai 藉由讀取 MRI-PDFF(質子密度脂肪分數)訊號,AI 自動計算全肝臟體積脂肪分數(VLFF),可更精確的計算脂肪肝程度。

其次是整合新藥臨床試驗平台。 過去脂肪肝無藥物可治療,第一線治療方式多以飲食與調整生活習慣為主。因此,國際藥廠紛紛投入新藥臨床試驗。小心肝 AI 能提供標準化 MRI-PDFF 數據,可整合進臨床試驗工具。

最後是帶動產業鏈發展。 全球專注脂肪肝AI醫療影像的業者極少。小心肝 AI 的出現,讓醫療機構、健檢中心、臨床試驗公司、國際醫材設備商乃至國際藥廠有新的合作選擇,有助於形成更完整的產業生態系。

汎定科技總經理許駿鵬表示:「我們自從2023年7月展開前期研究(Pilot Survey),2025年進入臨床試驗、預計將於今年底完成,明(2026)年正式取證、將小心肝 AI 推向全球市場。」值得特別注意的是,醫療產業特性使然,「有技術」不等於「能落地」,研發實力、客戶需求,以及品牌能見度缺一不可,而藉由 NVIDIA Inception 新創計畫的支援,汎定科技不僅強化了產品開發速度,如以 MONAI Core 選擇適切的演算法、MONAI Label 加速影像標註等,也在品牌行銷與市場拓展上獲得關鍵性的極大推力。

數位時代 X NVIDIA _ FindingsTech
圖/ 數位時代

以2025年獲邀參展 COMPUTEX InnoVEX 大會中的 NVIDIA Inception for Startup Pavilion 新創展區為例,汎定科技在展會期間收到超過100個客戶諮詢,會後有逾50家潛在客戶表達興趣,其中10多家已進入洽談階段,對正在推進的臨床試驗與未來市場擴張極具幫助。「我們的計畫是在取證後三年將小心肝 AI 推向20家健診中心,並且積極發展亞洲市場商機,而後再一步一腳印地擴展歐美市場。」關於小心肝 AI 的未來規劃,許駿鵬如是說道。

善用集團與 NVIDIA 技術資源,加速智慧醫療布局

在加入 NVIDIA Inception 新創計畫後,新創團隊可在 NVIDIA Inception 新創計畫網站清楚寫下產品服務等資訊,NVIDIA 全球各個部門便都可以查詢到新創團隊資訊,更有機會取得 NVIDIA 軟體產品的早期試用(Early Access),並能免費下載使用各種 NVIDIA 軟體套件(SDK),以及受邀參加地區活動曝光等。至於新創公司擴展最重要的資金環節,新創團隊則可透過 Inception Capital Connect 與全球 NVIDIA Inception VC Alliance 創投夥伴接觸,加速募資流程。

汎定科技與豐藝集團即是透過 NVIDIA Inception 新創計畫而結識。

豐藝集團策略長陳少翎表示:「汎定科技擁有絕佳的技術實力與發展潛力,瞄準的市場與豐藝集團的布局方向一致,很快就決定投資團隊。目前雖由豐藝集團100%持股,但仍維持汎定科技的獨立營運彈性,鼓勵其以新創速度深耕市場,同時,透過鏈結集團資源等方式深化對智慧醫療產業的佈局。」舉例來說,當豐藝集團與 GE、飛利浦、西門子等全球醫療大廠進行產品藍圖與市場規劃討論時,也會同步介紹汎定科技的產品服務與實務經驗,進而創造更多跨國合作的可能性。

數位時代 X NVIDIA _ FindingsTech
圖/ 數位時代

展望未來,汎定科技除持續推進小心肝 AI 的產品與市場布局、也將與 NVIDIA Inception 新創計畫更緊密連結到全球新創與創投網絡以強化產品的海外布局,也會透過跟集團子公司與客戶合作等方式,更好布局未來市場。

NVIDIAxFindingsTech
圖/ 數位時代

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓