演算法也能比對寫作習慣!愛看論文的他,要拿「快刀」大戰AI抄襲黨
演算法也能比對寫作習慣!愛看論文的他,要拿「快刀」大戰AI抄襲黨

近年每到台灣選舉季,「論文」是吵得最沸沸揚揚的議題之一。

上至總統、下至高雄市長候選人,都能被攪和進來,「現在就連選里長,論文可能都會被翻出來,看有沒有抄襲。」雲書苑教育科技(以下簡稱雲書苑)創辦人暨總經理林政宏說。

雲書苑的產品「快刀」是中文相似度比對系統,主要可以用於學術論文的抄襲比對,所以每次到了選舉,或是誰又爆出論文抄襲的新聞,公司的電話總是響個不停。

因為「喜歡看論文」而誕生的公司

創立於2007年的雲書苑,2010年推出「快刀」,至今有90所大專院校、逾20個公部門曾採用,已比對數十萬篇論文,起因只是林政宏一個奇特的小興趣——看論文。

雲書苑創辦人暨總經理林政宏
你不覺得看論文很爽嗎?比起每天看聳動新聞,權威性期刊論文,都是頂尖專家幫你把知識整理在裡面了。

從量子力學到OpenAI,都是他的涉獵範圍,他還津津有味地分享某一篇貓咪也是共同作者的論文。也只因他本身就是工程師,長期寫程式、開發系統,對於新的技術或演算法有著濃厚的好奇心。

但論文看多了,林政宏常會有「似曾相似」的感覺,「啊!就是抄襲啦,有時候去跟老師反映,他們也都完全不清楚。」

而2007年以前,AI(人工智慧)一詞還不流行,林政宏就在做自然語言處理(Natural Language Processing,縮寫NLP),開始有了應用該技術在論文比對的念頭,最後開發了中文相似度比對系統「快刀」。

簡單來說,快刀先把論文裡的字句進行斷詞,分出名詞、人名、動詞等詞性,再進行解析比對。除了基本的「大量複製貼上」一定能抓出之外,林政宏表示,快刀還可以比對「文風」,抓出每一個人寫作用字遣詞的小習慣。

比對完畢後,快刀會提供審查論文與資料庫內其他論文的相似性數據,「我們的工作是抓出相似性,至於判斷抄襲與否,還是交給學術單位或主管機關。」林政宏表示,像是法條、合理的引用規範(如APA格式),快刀系統都會自行避開,就算是偏質性的論文也能比對。

快刀中文相似比對系統
雲書苑教育科技的主力產品「快刀」,專注在「中文相似度比對」技術,多應用在如論文之類內容的抄襲比對,主要客戶為大專院校與公部門,其中公部門多用來比對各種計畫與出國報告等。
圖/ 快刀中文相似比對系統官網

發展至今,比對論文只是快刀的其中一項應用,許多公部門採購快刀來比對政府機關人員出差報告、計畫書。雖然商業模式上非常適合訂閱制,但考量到學術與公部門的採購流程,目前仍多走標案採購的模式。

在未來,雲書苑也預計將快刀應用在108課綱的學習歷程檔案中(學習歷程檔案是用來記錄高中生3年修課與多元表現,如證照、書面報告、作品等)。

論文抄襲比對,已經到了「仙拚仙」階段

回到論文抄襲的話題,林政宏表示,學生愈來愈聰明了,已經很少人採取大段落的複製貼上,學生們開發出各種奇葩的作弊方法,甚至用上AI與比對系統「仙拚仙」。

「有學生為了降低內文抄襲比例,在論文裡加入了一個縮小文字框,看起來像是小句點,但內含幾百萬字亂碼,藉此稀釋掉整篇論文的抄襲比例。」林政宏說,甚至還有把全部的文字轉成圖片,重新貼回Word上;或是把論文翻譯成俄語,再翻成各種他國語言、再翻回中文,試圖透過多重翻譯重新組裝字句,來混淆比對系統。

但這些讓人莞爾一笑的案例都還算好破解,「現在已經有研究生會用AI產生論文了。」林政宏語重心長地說,雖然目前學生們使用AI產生的論文,讀起來還相當不通順,不過難保技術會持續進步,未來比對系統也將難以分辨。

林政宏_雲書苑教育科技總經理_2020_12_01_蔡仁譯攝-1 (2).jpg
林政宏本身就是工程師,長期寫程式、開發系統,對於新的技術或演算法有著濃厚的好奇心。
圖/ 蔡仁譯攝影
快刀中文相似比對系統-1
創立於2007年的雲書苑,2010年推出「快刀」,至今有90所大專院校、逾20個公部門曾採用,已比對數十萬篇論文。
圖/ 快刀中文相似比對系統官網

所以,林政宏積極地趕上最新的科技發展,至今在團隊內仍負責部分的程式工作,「OpenAI的GPT-3(深度學習產生人類可以理解的自然語言)技術就真的很厲害,我也有嘗試了一下,這一行以後就是AI打AI的時代了。」

關於創業的三個小問題

Q:未來有什麼發展計畫?

A:目前考慮前進日本市場,以及108課綱中的學習歷程檔案。而在中文相似度比對,還有很多可以做的事,舉例來說,能讓AI自動分析新聞、撰寫摘要,並跟搜尋引擎的熱門關鍵字做比對,判別點閱數的高低。

Q:為何選擇布局學習歷程檔案?

A:學習歷程檔案記錄高中三年的報告、作業、作品等,有一部分需要任課老師認可,一個老師要面對多少學生?現在學生又這麼聰明,都在用AI了,老師若要查有沒有抄襲,只能把文章一段一段放上Google,雙方軍火較量一點都不平等。老師們的確需要更快速、有效率的比對工具。

Q:目前營運上遇到哪些困難?

A:現階段的最大困難是人才斷層,從年紀來看,雲書苑已經不是新創公司了,對年輕工程師而言,也許吸引力還有待加強,未來開拓國際市場也需要相關人才。另外,快刀容易變成政治鬥爭的工具,這不是雲書苑的初衷,我們就是提供內容比對結果,讓相關單位自行判斷。

本文出自數位時代320期2021年1月號《100微趨勢》創業QA

責任編輯:郭昱彣、張庭銉

關鍵字: #人工智慧
往下滑看下一篇文章
終於出現「看得懂的保險」!國泰人壽以「保險視圖」引領資訊透明革命
終於出現「看得懂的保險」!國泰人壽以「保險視圖」引領資訊透明革命

在台灣,多數人的第一份保障來得很早,可能來自父母,或是出社會後自行投保。然而,直到今天仍有許多人即使手握數張保單,仍說不清自己到底保了什麼。條款繁複、名詞艱澀,導致投保當下似懂非懂,過一陣子就全忘了。保險資訊的不透明,讓風險管理變成了一場全憑印象、依賴業務員的信任遊戲。

自從國泰人壽推出 App 3.0,以「陪伴」重塑保戶與保險的關係,下一步,更要讓資訊變得透明、易讀、好上手。於是,「保險視圖」誕生了—由國泰人壽戰情室 diLab(Digital Insurance Lab)領軍打造的這個平台,試圖翻轉保單難懂的問題,將散落於規範、條款與系統的資訊重新整理、轉譯與可視化,讓保戶終於能「一圖看懂」保障全貌。

「我們希望做到的不只是查詢工具,而是讓保戶真正理解風險、開始做決定。」diLab 經理林蔚安說,這項專案從發想到上線歷時多年,可說是完成了連同業都不敢想像的艱鉅任務。這場透明革命如何開始?國泰人壽又如何讓這個看似困難的挑戰落地?

資訊透明:讓保險回到能被理解的語言

「保險商品本身就很複雜,很多人買了保險,打開保單還是看不懂。」林蔚安指出,國泰人壽累積 800 萬保戶,團隊在梳理客戶旅程時發現,即使擁有多年的資歷與服務經驗,卻未能讓保戶更清楚自己的保障;大多僅在與業務員討論時略有概念,事後又陷入陌生感。因此,「保險視圖」的構想,就是要讓保戶能在同一平台掌握所有保障與資產資訊。

數位時代
diLab 經理林蔚安與團隊歷時打磨領先業界的保險視圖,幫助保戶一次看懂保障。
圖/ 數位時代

第一步,是處理「看不懂」這件事。diLab 從資料盤點開始,依照生涯階段與保障屬性,將保單內容重新分為「我的健康照護」、「我的保險資產」、與「我的壽險傳承」三大方向,讓保戶以更貼近日常的邏輯理解保障結構,例如「住院時有哪些保障?」。

「調研時發現,國內幾乎沒有成熟案例可參考,國外雖有概念但差異極大。」林蔚安表示,圖表複雜,反而增加理解負擔,因此團隊反覆推敲呈現方式,「要放什麼、怎麼放、放到什麼程度,光這個架構就討論了數個月!」每一個看似微小的改變,背後都是無數次的反覆測試與訪談,「我們帶著不同版本的草稿詢問保戶,在沒有業務員引導下是否看得懂。」最終,團隊定調以金字塔結構建構視圖基礎,從保戶自己的健康保障,到未來可運用的累積資產,最終到照顧家人的壽險傳承。沒有看似花俏的圖表,只希望讓多數保戶好理解的簡單呈現。

但挑戰不只在前端設計,還有保險條款轉譯。傳統保單以商品邏輯分類,與使用者思考「何時會用到」的方式完全不同。為了讓資訊更貼近生活情境,「保險視圖」不再以條款分類,而以場景情境作為基準。例如保戶生病住院時,介面會按照基礎醫療、意外、癌症、重大疾病、長照與壽險等六大結構分層呈現,先呈現核心,再逐層深化,視覺化整體保障全貌,並同步提供現金價值與現金流資訊,形成一套完整的理解脈絡。

風險洞察:AI協助人們看清保障缺口

國泰人壽
視覺化保障達成率,一眼了解保障缺口。
圖/ 國泰人壽
國泰人壽
提供熱門推薦與更加個人化的AI推薦,喚醒補強意識。
圖/ 國泰人壽

當保險資訊透過直覺式的設計變得透明,下一個挑戰就是讓保戶理解「自己目前的保障夠不夠」。

因此「保險視圖」也導入保障目標試算功能,保戶只需回答幾題簡單問題,如:住院希望住單人房或雙人房、對疾病治療的費用承受度等,系統即可推算個人的保障目標。接著,AI 會即時計算保障達成率與缺口比例,將複雜的理賠與條款結構轉換成直覺的百分比。「醫療保障達成率 60%」、「癌症保障達成率 45%」,藉由直觀的數字圖表呈現,讓保戶能一眼看出自己保障的完整程度。

此外,平台不只呈現差距,還會以情境推估可能的支出。例如住院五天、手術一次的費用與實際理賠差異,讓保戶真正感受到風險的具體樣貌。「保戶不再是聽到『癌症住院很貴』這種抽象說法,而是看得到具體數字。」透過以場景為基礎的推算,使保戶終於能對模糊的風險概念有畫面,並對理賠內容有更直觀的理解。

平台也提供「熱門推薦」與「 AI 推薦」兩種建議模式。前者以性別、年齡作為分析基礎,後者則依個人資料與既有保單做更客製化的配置。保戶可在平台初步理解現況後,再與業務員討論,透過數位賦能、與有溫度的人性服務建立互補機制,也讓業務溝通更聚焦、更有效率。

領航轉型:戰情室以創新實踐「以人為本」

保險視圖歷經多次迭代上線,雖仍在推廣階段,但初步成效已浮現。以今年 4 月關稅議題為例,資產型保單查詢需求明顯攀升,保戶登入次數從每週平均 4 萬次提升到 5 萬 6 千次,大幅成長40%。以往查詢保單價值需透過業務員協助或臨櫃辦理,如今登入平台即可取得資訊。

國泰人壽
保險視圖一次呈現保戶的整體保險資產,建立更清晰的財務健康圖像。
圖/ 國泰人壽

此外,視覺化呈現保障缺口後,有保戶回饋「看到達成率 70%,就想補到 100%」,顯示視覺化真正促進了主動管理的行為轉換。

數位時代
diLab 戰情室跨商品、設計與數據協作,以使用者為中心反覆驗證,用心設計保險資訊呈現方式。
圖/ 數位時代

能完成一份視覺化介面不難,但能把 60 多年累積的保險商品結構、條款邏輯與資料系統重新整合再轉譯,背後極度仰賴組織文化。尤其,保險視圖的誕生,從構想到落地,專案歷時 4 年,期間國泰以「區塊化堆疊」的方式逐步發展服務功能,包括資產總覽、健康與壽險視圖、缺口試算與 AI 推薦,每一步都需要長時間協作與反覆推敲。

林蔚安形容:「戰情室就像加速器。」其角色是串聯商品、數據、數位、UI與UX設計、開發工程與行銷等多個團隊,以使用者中心作為共通語言,讓跨部門能在同一個目標下推進。「大家的專業不同,但只要目標一致,就能共同前進!」

數位時代
專案歷時多年,團隊成功以敏捷方式快速迭代,實現保險資訊透明化。
圖/ 數位時代

展望未來,透明化只是起點。林蔚安指出,下一步是讓更多保戶願意使用平台,使行為軌跡形成數據基礎,再透過個人化推播與 App 串接,發展國泰人壽保戶更完整的數位體驗。「這條路很難,但值得做。」他分享,有一次泰國人壽數位團隊來台交流,第一眼看到保險視圖就說:「這真的很不容易。」但也因此,更突顯國泰人壽勇於創新、以人為本的服務精神。同時,保險視圖也不會是終點,卻會是打開未來保險模式的一把關鍵鑰匙。國泰人壽以具體行動落實「Better Together 共創更好」,在每一項細節中重塑保險服務的日常價值。

保險視圖:https://cathaylife.tw/VoeoOdb

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓