中文Chatbot的現實與突破的契機

2020.06.08 by
王文傑 Peter
王文傑 Peter 查看更多文章

語言科學專家,現任卓騰語言科技創辦人及核心開發工程師。探究人類語言與認知之間的關係,主張自然語言處理需考慮語系的差異,而非直接套用現成的工具。正在執行的夢想是透過打造中文資訊處理的文字和語音基礎建設,促成「具人類思維方式」的機器心智。

中文Chatbot的現實與突破的契機
panuwat phimpha via shutterstock
聊天機器人要真正發揮作用,最重要的是它必須是為中文開發、合乎中文邏輯的AI系統,否則連語句都無法正確理解,後續都是枉然。

自2016年起,App的榮景不再,不論是因為功能市場飽和,或是惰性使然,在使用者不再隨便下載App到手機上的時空背景下,愈來愈多的企業和電商開始將目光投往每個人都有的「聊天軟體」上,並企圖讓使用者加入特定頻道,計畫以「聊天機器人」所收集到的對話內容,利用各種大數據的人工智慧NLU技術理解客戶需求,進而推出客製化的服務來增加產品的曝光率,以及客戶對品牌的黏著度。

推薦閱讀:一個Chatbot催動業績成長10%!UNIQLO台灣兩年的數據摸索心路

但是四年過去,在2020年的今天,前述的願景沒有任何一項成真。

到底是Chatbot,還是Clickbot?

我們最常看到的仍然不是具備「和客戶聊天(chat)」能力的機器人,反而是具備了「引導客戶各種點擊(click)」的機器人。與其叫它Chatbot,不如稱之為Clickbot!

這種透過「點擊」引導使用者在既定的劇本流程中一步一步走下去的操作,在Web 1.0的時代就有了,那個時候的名稱叫「網站地圖」。而網站地圖是一種非常不適合在「文字聊天軟體」中呈現的資訊模樣。有限的選項限制了企業對客戶意圖的剖析和側繪的深度,過多的資訊也常常出現如下圖紅框標示處的現象:需要客戶再往上滑動內容。

王文傑提供

正如商業管理書籍中最常出現的那個例子:「當客戶買電鑽的時候,他需要的不是電鑽,而是牆上的那個洞!」現在的「Clickbot」無法幫助我們瞭解客戶究竟要什麼,反而把所有的產品選項陳列在他面前,然後隨著他每一次的點擊,就帶領他往更深的一層走去,直到完成購買的流程。

這個流程乍看之下很完美,頗有讓人覺得「雖然聊天機器人不能聊天,但至少它能把『導購』這件事情專注地做好」的錯覺。但事實上,請回想上一次你和你的銀行討論信用卡細節、和電信公司溝通門號事宜,或是和網路供應商詢問網路狀況時,你是依照電話裡的指示,一層一層地按著數字滿足你的服務需求,還是在第一層就迫不及待地「按9,由客服人員為您服務」了呢?

你按的是「9」,你的客戶也是。因為你們都不想浪費時間在這不知道幾層的點擊迷宮裡繞圈子。

我們的Chatbot問題出在哪?

那為什麼國外的各種聊天機器人能獲得這麼多成功,而我們卻無法複製在我們的目標市場裡呢?

推薦閱讀:台灣每10人就有1人追蹤!LINE防疫機器人「疾管家」爆紅,幕後推手HTC DeepQ怎麼辦到?

我們見到許多成功的NLU(自然語言理解)範例都是基於英文的技術。直接套用在中文上時,就像是拿起油畫的刮刀,硬是沾了墨汁,不但畫不出油畫味道,連水墨原本的精神也抓不到。這就是為什麼我們需要謹慎地選擇工具、選擇NLU的解決方案!

否則,你拿到的所謂「Chatbot」(聊天機器人)的方案,其實就只是一個在聊天室介面下復活的Web 1.0的僵屍。不但無法幫你瞭解你的客戶在想什麼,更沒辦法提供有效的市場洞見(insight)。

一個良好的Chatbot可以分成兩個層次:主動的市場調查員,與被動的導購店員

主動的市場調查員,應該像你的王牌業務一樣,整天都在外頭跑。散布在各個公開的聊天室、留言板裡成為駐站的觀察員。它要做的事情不再是簡單的「關鍵字觸發」的任務,而是仔細地利用「專為中文開發的NLU」技術,分析是否有潛在客戶的存在。

比如說,在你的市調機器人長駐的聊天室裡,當有人提到「A7的房子,交通會不會不方便?」或是「從A7捷運站到台北要多久?」的時候,如果您是銀行的貸款部門,或是汽車銷售商,就應該要發覺「這可能是一個銷售目標!」。但相對地,如果有人提到的是「我的房子買在A7附近,交通滿方便的」,那麼這就不是你的銷售目標。

你不能用傳統的方法,設定「A7」、「房子」或「交通」做為觸發的關鍵字,否則就會和現在一樣,答非所問之餘還會收到一堆假警報。若是真的朝這些潛在客戶投放廣告,還會讓你的客戶的注意力提早因過度刺激而麻痺。你需要真正能分析「中文句法、中文句型、中文句子結構」的NLU工具,讓您發現:

  1. 這是一個問句
  2. 問句詢問的是「時間」
  3. 名詞包含了「房子」和「交通」

這三個條件的時候,才能觸發你的市調機器人,將這個客戶的資訊記為銷售目標。

乍看之下,許多人會覺得句子裡有「房子」和「交通」,不就是現在的關鍵字的觸發模式嗎?但仔細一看,就會發現這裡其實說的是「名詞」裡,要包含了「房子」和「交通」,而且條件3是在條件1成立的前提下才算數的。能分析中文詞性的NLP/NLU引擎,才能做到這一點。

也就是說,你需要的是一個能透過中文句型分析,確知「這是不是一個問句」的NLU引擎,才能做後續的動作。

相較之下,世面上常見的微軟LUIS語意引擎,宣稱會自動框列句子中的重點,但在遇到這類句子的時候,會解析出如下的結果:

王文傑提供

由此可以清楚的看到之前提到「因為語言不同」而產生的錯誤。在繁體中文常見的語境裡,已經不用「幾分錢」這個單位了。但英文仍有,因此它會把「30分」優先視為「金錢(money)」來理解。此外,下面三個句子是簡單的問句,但若沒有額外做處理的話,這些NLU引擎是無法辨識「這是一個問句」,更別說辨明這個句子想要問什麼了。

這就是為什麼沒有真正NLU引擎的Chatbot聊天機器人,充其量只是一個Clickbot點擊機器人。而Clickbot點擊機器人頂多就只能把使用者重新帶回Web1.0時代的操作感,或是將使用者帶回諸如Facebook或Twitter的社群平台,讓您透過他的「行為模式」進行客戶側繪和分群。一個Clickbot點擊機器人是沒有辦法讓您知道客戶究竟要的是擁有一把電鑽,還是想要在牆上打個洞的。

責任編輯:陳建鈞

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場

每日精選科技圈重要消息