演算法也能比對寫作習慣!愛看論文的他,要拿「快刀」大戰AI抄襲黨
演算法也能比對寫作習慣!愛看論文的他,要拿「快刀」大戰AI抄襲黨

近年每到台灣選舉季,「論文」是吵得最沸沸揚揚的議題之一。

上至總統、下至高雄市長候選人,都能被攪和進來,「現在就連選里長,論文可能都會被翻出來,看有沒有抄襲。」雲書苑教育科技(以下簡稱雲書苑)創辦人暨總經理林政宏說。

雲書苑的產品「快刀」是中文相似度比對系統,主要可以用於學術論文的抄襲比對,所以每次到了選舉,或是誰又爆出論文抄襲的新聞,公司的電話總是響個不停。

因為「喜歡看論文」而誕生的公司

創立於2007年的雲書苑,2010年推出「快刀」,至今有90所大專院校、逾20個公部門曾採用,已比對數十萬篇論文,起因只是林政宏一個奇特的小興趣——看論文。

雲書苑創辦人暨總經理林政宏
你不覺得看論文很爽嗎?比起每天看聳動新聞,權威性期刊論文,都是頂尖專家幫你把知識整理在裡面了。

從量子力學到OpenAI,都是他的涉獵範圍,他還津津有味地分享某一篇貓咪也是共同作者的論文。也只因他本身就是工程師,長期寫程式、開發系統,對於新的技術或演算法有著濃厚的好奇心。

但論文看多了,林政宏常會有「似曾相似」的感覺,「啊!就是抄襲啦,有時候去跟老師反映,他們也都完全不清楚。」

而2007年以前,AI(人工智慧)一詞還不流行,林政宏就在做自然語言處理(Natural Language Processing,縮寫NLP),開始有了應用該技術在論文比對的念頭,最後開發了中文相似度比對系統「快刀」。

簡單來說,快刀先把論文裡的字句進行斷詞,分出名詞、人名、動詞等詞性,再進行解析比對。除了基本的「大量複製貼上」一定能抓出之外,林政宏表示,快刀還可以比對「文風」,抓出每一個人寫作用字遣詞的小習慣。

比對完畢後,快刀會提供審查論文與資料庫內其他論文的相似性數據,「我們的工作是抓出相似性,至於判斷抄襲與否,還是交給學術單位或主管機關。」林政宏表示,像是法條、合理的引用規範(如APA格式),快刀系統都會自行避開,就算是偏質性的論文也能比對。

快刀中文相似比對系統
雲書苑教育科技的主力產品「快刀」,專注在「中文相似度比對」技術,多應用在如論文之類內容的抄襲比對,主要客戶為大專院校與公部門,其中公部門多用來比對各種計畫與出國報告等。
圖/ 快刀中文相似比對系統官網

發展至今,比對論文只是快刀的其中一項應用,許多公部門採購快刀來比對政府機關人員出差報告、計畫書。雖然商業模式上非常適合訂閱制,但考量到學術與公部門的採購流程,目前仍多走標案採購的模式。

在未來,雲書苑也預計將快刀應用在108課綱的學習歷程檔案中(學習歷程檔案是用來記錄高中生3年修課與多元表現,如證照、書面報告、作品等)。

論文抄襲比對,已經到了「仙拚仙」階段

回到論文抄襲的話題,林政宏表示,學生愈來愈聰明了,已經很少人採取大段落的複製貼上,學生們開發出各種奇葩的作弊方法,甚至用上AI與比對系統「仙拚仙」。

「有學生為了降低內文抄襲比例,在論文裡加入了一個縮小文字框,看起來像是小句點,但內含幾百萬字亂碼,藉此稀釋掉整篇論文的抄襲比例。」林政宏說,甚至還有把全部的文字轉成圖片,重新貼回Word上;或是把論文翻譯成俄語,再翻成各種他國語言、再翻回中文,試圖透過多重翻譯重新組裝字句,來混淆比對系統。

但這些讓人莞爾一笑的案例都還算好破解,「現在已經有研究生會用AI產生論文了。」林政宏語重心長地說,雖然目前學生們使用AI產生的論文,讀起來還相當不通順,不過難保技術會持續進步,未來比對系統也將難以分辨。

林政宏_雲書苑教育科技總經理_2020_12_01_蔡仁譯攝-1 (2).jpg
林政宏本身就是工程師,長期寫程式、開發系統,對於新的技術或演算法有著濃厚的好奇心。
圖/ 蔡仁譯攝影
快刀中文相似比對系統-1
創立於2007年的雲書苑,2010年推出「快刀」,至今有90所大專院校、逾20個公部門曾採用,已比對數十萬篇論文。
圖/ 快刀中文相似比對系統官網

所以,林政宏積極地趕上最新的科技發展,至今在團隊內仍負責部分的程式工作,「OpenAI的GPT-3(深度學習產生人類可以理解的自然語言)技術就真的很厲害,我也有嘗試了一下,這一行以後就是AI打AI的時代了。」

關於創業的三個小問題

Q:未來有什麼發展計畫?

A:目前考慮前進日本市場,以及108課綱中的學習歷程檔案。而在中文相似度比對,還有很多可以做的事,舉例來說,能讓AI自動分析新聞、撰寫摘要,並跟搜尋引擎的熱門關鍵字做比對,判別點閱數的高低。

Q:為何選擇布局學習歷程檔案?

A:學習歷程檔案記錄高中三年的報告、作業、作品等,有一部分需要任課老師認可,一個老師要面對多少學生?現在學生又這麼聰明,都在用AI了,老師若要查有沒有抄襲,只能把文章一段一段放上Google,雙方軍火較量一點都不平等。老師們的確需要更快速、有效率的比對工具。

Q:目前營運上遇到哪些困難?

A:現階段的最大困難是人才斷層,從年紀來看,雲書苑已經不是新創公司了,對年輕工程師而言,也許吸引力還有待加強,未來開拓國際市場也需要相關人才。另外,快刀容易變成政治鬥爭的工具,這不是雲書苑的初衷,我們就是提供內容比對結果,讓相關單位自行判斷。

本文出自數位時代320期2021年1月號《100微趨勢》創業QA

責任編輯:郭昱彣、張庭銉

關鍵字: #人工智慧
往下滑看下一篇文章
從生成式AI到代理式AI,不可輕忽的五大關鍵趨勢與致勝訣竅
從生成式AI到代理式AI,不可輕忽的五大關鍵趨勢與致勝訣竅

代理式AI將驅動產業創新變革與升級,對此,研究機構Gartner預測,截至2028年底,33%的企業應用軟體將整合代理式AI功能,至少15%的日常工作決策將改由代理式AI負責,以及三分之一的生成式人工智慧互動將改由行動模型與自主代理完成,同時,加速協作型 AI Agent出現與普及。
面對勢不可擋的AI浪潮,Google Cloud搶先布局市場:不僅提供含括AI優化基礎架構、AI模型、可互通的AI代理等高度整合AI雲端技術堆疊,更攜手CloudMile萬里雲等夥伴協助不同產業客戶發揮代理式AI的綜效。

不可輕忽的五大AI趨勢

隨著雲端與人工智慧等創新科技成為企業創新變革的關鍵基石,想要極大化科技綜效、搶先布局未來,不可輕忽五大AI趨勢:

趨勢一:AI Agent蓬勃發展。

生成式AI已從單純的處理提示(Prompt)轉變成具備模組化、自主化與協作化能力的 AI Agent,Google Cloud 更透過年度旗艦活動介紹超過 600 個 AI Agent 與跨產業應用案例。

Google Cloud 台灣總經理陳愷新表示:「因應用途的不同,Google Cloud 推出客戶代理(Customer Agent)、員工代理(Employee Agent)、創意代理(Creative Agent)、資料代理(Data Agent)、程式碼代理(Code Agent)與資安防護代理(Security Agent)六大類 AI Agent,協助企業提升營運效率、員工生產力、資安防護,進而加速產業創新。」

萬里雲 x Google Cloud_Podcast
Google Cloud 台灣總經理 陳愷新
圖/ 數位時代

趨勢二:多模態AI應用普及。

企業開始透過多模態AI整合文字、圖像、音訊與影片等資訊,讓 AI可以模仿人類學習方式,以更精準且自然的方式輸出與互動。

趨勢三:AI驅動輔助搜尋崛起。

透過生成式AI賦能,企業搜尋模式可以跳脫關鍵字,改以多模態輸入與對話提示等方式互動,讓使用者可以快速找到所需資訊並因應權限優化知識搜尋成效。例如,玉山銀行整合 Gemini 模型與內部知識管理系統,短短 3 個月推出「金融業務聊天機器人(金秘書)」,大幅縮短分行人員解決複雜客戶問題的時間,以及減少內部教育訓練負擔。

CloudMile萬里雲創辦人暨董事長劉永信表示:「Enterprise Search 不僅能打破孤島、快速連結Google Workspace、BigQuery、Looker、SAP、Salesforce 等內部系統與資料來源,還可以進一步提高企業內部搜索相關知識的效率。」

趨勢四:AI 輔助顧客體驗優化。

透過AI驅動的全通路個人化行銷,以無縫消費體驗提升零售業營收、效率跟提升客戶忠誠度。例如,CloudMile 萬里雲整合最新 AI 人臉檢測、表情辨識技術、服裝顏色分析與圖像標籤,以及串連 Google Workspace 雲端應用,打造出獨一無二的 AI 旅行推薦體驗服務 AI 魔鏡,消費者只要站在互動裝置前自拍,系統即會依照臉部表情與穿衣風格自動生成個人化旅遊行程與亮點,大幅提升選旅效率與便利性。

趨勢五:以 AI 加強資安防護。

面對AI帶來的嶄新、增強的安全攻擊,如深度偽造(DeepFake)攻擊與攻擊頻率增強等,企業除可以藉由 AI 增強現有安全系統,還可以透過偵測威脅、保護資料、識別潛在風險等方式對抗深度偽造與假訊息等釣魚攻擊。

「AI 與雲端將成為企業營運的關鍵基礎設施、發揮相輔相成的綜效,此外,也有助於企業加速業務創新與發展數位經濟生態圈,進而鞏固企業競爭力。」劉永信認為,透過 Google Agentspace 提供的多代理協作機制,企業不僅可以整合工作流程,還可以進一步優化模組設計與完善安全治理,讓 AI Agent 進入企業日常營運場景,在這個過程中,若進一步結合 A2A 協定(Agent-to-Agent Protocol),AI Agent 將不僅是單一任務執行者,可以相互溝通,型塑嶄新的企業虛擬團隊,讓企業能以更敏捷的人機協作模式回應市場與顧客需求。

3關鍵 X 5指標,助企業加速代理式AI落地與極大化綜效

劉永信表示:「Data Anywhere 是企業發展代理式AI的關鍵基礎,具體實作方式是從資安(Security)、人工智慧(AI)與雲端財務管理(FinOps)三個關鍵面向切入,型塑具備自主強化的『AI 優先』營運模式以優化創新轉型成效。」例如,企業需要一個含括雲端、邊緣、地端的數據同步與治理框架以確保數據即時性、隱私性、合規性與安全性。

萬里雲 x Google Cloud_Podcast
CloudMile 萬里雲集團創辦人暨董事長 劉永信
圖/ 數位時代

除了以 Data Anywhere 為基礎打造的 AI First 營運模式,Google Cloud 建議企業可以從 5 個關鍵指標選擇平台與合作夥伴:第一是平台服務是否含括全面 AI 技術堆疊,讓企業可以因應需求挑選所需的基礎設施、平台、模型與商業應用;第二是提供企業客戶多元選擇,包括選擇自行開發或者是以既有服務進行客製化開發,以及可以彈性選擇平台提供的 AI 模型、第三方 AI 模型與開放原始碼服務等。

第三是確保雲地、新舊系統的互通性,例如,Google Cloud 不僅在 2019 年推出混合雲管理平台 Anthos 服務,更於日前推出 A2A 協定協助企業打通、協作各個 AI 代理,以及推出 Google Agentspace 協助企業集中化管理AI代理與透明化營運成效等。第四是平台是否有支援開放標準與應用程式介面(API)等機制,讓企業客戶可以因應業務發展彈性串聯與擴展應用範疇。第五是確保平台提供的是負責任的AI以及提供與時俱進的安全防護機制,例如 Google Cloud 便積極深化在深度偽造防護(DeepFake Defense)的能量。

展望未來,隨著 AI 的推陳出新與日趨普及,Google Cloud 除會因應市場需求持續優化平台服務,也會攜手 CloudMile 萬里雲針對產業客戶需求提供最佳服務,以產業專屬、軟硬整合的方式發揮智慧化人機協作的綜效,實踐生態圈共贏。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓