【觀點】論文抄襲或造假問題有解?新創瞄準技術搶象牙塔內大商機
【觀點】論文抄襲或造假問題有解?新創瞄準技術搶象牙塔內大商機

台灣政壇正以前所未有的規模,發起全民追論文的運動。先不論爭吵的內容有無依據,但從抄襲的有無、數量,甚至到實驗圖片的造假,的確啟發了一批資料科學家或IT工程師投入。

還記得以前當助教的時候,收到同學的課堂報告,只能先隨機丟幾段到google,排除掉有部分雷同的作業。現在,人工智慧的出現的確能比工人智慧來得更方便。例如,國內的雲書苑公司,發表的「快刀系統」,可以利用AI檢測段落,甚至行文風格,用來比對一般文章、學位論文,在國際上更大的學術市場而言,自然有更多前仆後繼的公司加入。

coding 程式碼 打程式 工程師
圖/ shutterstock

今(2022)年9月,印度新創公司IEM LABS最近發表了一款跨50個語言的抄襲檢查服務,在此之前,這家公司還提供了各式各樣的軟體服務。其在新聞上宣稱的抄襲檢查服務,則來自於因為要生成大量的AI文章,而建立的資料庫。

另一家以色列新創Copyleaks,則是在今年4月份宣布完成了600萬美元的募資,並宣告擁有100種語言的比對功能,客戶涵蓋Stanford大學、BBC,而BBC與Cisco則與之合作來檢測內容侵權的可能性。在商業模式上,這些公司當然不太可能只靠檢查抄襲與否維持或擴張。就像雲書苑的創辦人曾經公開提到,學術論文的產出旺季,多半就是畢業季、寒暑假等。所以無論是IEM LABS或Copyleaks,都是將其作為一個產品,並且擁有其他多個收費服務。

「忘記引用」不再是藉口,Grammarly幫了研究生大忙

與烏克蘭淵源深厚獨角獸公司Grammarly,便是一個非常成功的案例。Grammarly的代表性產品,便是使用語意分析工具,協助使用者在撰寫文章時,確認文法與行文是否有誤;目前,全球已經有50萬網站或者客戶,包含Google Docs、Gmail、LinkedIn或Facebook皆已使用Grammarly的產品,提醒使用者是否需要修改文法或拼字。有了這些大量的橫跨商業與學術的文字資料庫,Grammarly公司開始免費提供Plagiarism Checker(相似度檢測)給學生與學術工作者。甚至在今年9月,宣布新增研究論文引用、排版的工具,涵蓋了APA(常用於科學與心理學)、MLA (常用於人文學科)或Chicago/Turabian(常用於商業、藝術等領域)的風格選項。除了讓莘莘學子與研究人員不要再為引用格式耗費時間,想必也讓「忘記引用」的藉口更難成立。

在自然科學,尤其是生醫領域,則開發出了預防造假的AI服務,但是是用於複雜度更高的圖片比對。美國癌症研究協會(American Association for Cancer Research,AACR)指出,複製圖片是該期刊在2016-2020年間,最主要撤回文章的原因。根據The Register的報導,AACR開始求助於以色列新創公司Proofig的圖片比對服務。AACR從1367篇初步認可的手稿中,利用AI找出了208個需要二次確認的案例,並且聯絡作者。該篇報導提到,208個問題中,大多是無傷大雅的問題,但是仍然有4篇退回。另一家在維也納的新創公司ImageTwin,則因為協助荷蘭微生物學家Elisabeth Bik進行大量科研誠信檢查,也開始浮出檯面。

通通交給AI就好?要落地還得克服這些難題

Proofig或ImageTwin等提供的軟體,檢測的內容包含分子生物學常用的西方墨點法(western blotting),這些單色、形狀相似的條紋,肉眼要分辨的難度很高,但對AI而言,可以幫助科學家更好地進行初步過濾的工作。然而,回到商業模式的問題,仍然有許多不確定性。

首先,AI辨識的精準度仍然不是很高。這有可能是期刊論文的專業圖片資料取得有限、成本也較高(例如付費期刊與開放式期刊的差異),導致模型訓練受到的限制。在實務上,依然需要人工輔助判別。同時,AI目前仍然沒有辦法比對多個期刊之間的圖片

coding_ai-blur-codes-577585.jpg
圖/ Pexels

其次,一些大型期刊出版公司如Frontiers、Wiley、PLOS, Elsevier與Nature都在測試自家的AI檢測計畫。尤其Frontiers公司發布的AIRA(Artificial Intelligence Review Assistant),宣稱在其內部測試中,只有10%的檢測結果需要重新確認;Frontiers並未透露是何種學科的文章。

最後,則是定價與收費問題。儘管查詢圖片的重製、複製與重複使用,是相關期刊的剛需,但費用較抄襲檢查來得高。Proofig的官網定價顯示,個人使用版本,檢查一次一篇論文的120個子圖像,定價為99美元,對於學術或者期刊工作者而言,不太可能以個人的名義頻繁支付。當然,這種B2B的定價,必定需要由業者與期刊出版公司進行談判。

綜上所述,我們可以發現,論文抄襲或者造假的問題並不是只有台灣獨有,甚至頂尖的期刊、出版公司,都正絞盡腦汁地利用科技工具來輔助解決。然而,這些工具的使用,放諸整個AI的商業模式進程,終歸是偏向小眾的應用。儘管如此,如果促成了各國研究單位、教育機構與AI公司攜手發展成新的產業,這些違反學術倫理的案例,也能算是產業推手呢?

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場)

責任編輯:侯品如

關鍵字: #新創 #AI
往下滑看下一篇文章
社群帳號不是門牌!TWNIC籲中小企業註冊.tw域名,拒當「數位無殼蝸牛」
社群帳號不是門牌!TWNIC籲中小企業註冊.tw域名,拒當「數位無殼蝸牛」

在詐騙與帳號仿冒層出不窮的數位環境中,企業的「可信身分」正面臨前所未有的挑戰。根據台灣網路資訊中心(TWNIC)《2024 台灣網路報告》指出,近三個月內有 64.8% 的台灣民眾曾接觸詐騙訊息,其中 3.56% 實際受騙造成財損;警政署「165 打詐儀表板」統計亦顯示,2025 年詐騙財損金額已突破新台幣 706億元,其中多數案件是透過社群媒體與通訊平台進行。這些開放式平台雖然便利了即時互動,但匿名性與訊息傳播的速度,也讓詐騙訊息更容易偽裝成真實資訊,削弱了大眾對整體線上溝通環境的信任。

這樣的風險並不僅限於個人使用者。TWNIC執行長余若凡指出,當企業選擇以社群平台作為主要對外窗口時,也會受到同樣的信任影響。一旦消費者對平台環境產生疑慮,即使企業本身並無不當行為,品牌的可信度仍可能受到波及。若再發生帳號被駭、被仿冒或遭停權的情況,顧客更難以分辨官方與假冒來源,企業多年累積的信任與流量可能在短時間內流失。

中小企業網站現況:有門面卻留不住客人

台灣網商協會秘書長林原也指出,多數中小企業雖已踏入數位轉型,但網站建置往往只是「靜態海報型」,缺乏會員、金流或互動功能。他以形象比喻提到,域名是門牌、虛擬主機是房子、網站內容是軟裝。沒有門牌,就像住在別人的房子,隨時可能被趕走;有了門牌與房子,才有可能好好布置與經營。他強調,若企業長期依賴社群與電商平台,就等於在替平台打工,不僅需承受高額抽成,也受限於演算法與帳號規則,一旦被封鎖或降觸及,就會發現自己什麼都沒有留下。

台灣網商協會秘書長林原
台灣網商協會秘書長林原
圖/ 數位時代

他進一步提醒,企業若僅依賴社群與電商平台,等於長期在替平台打工。平台不僅抽成高,還掌握演算法規則與顧客數據,企業一旦被降觸及或封鎖帳號,就會發現自己其實什麼都沒有留下。這樣的結構,讓許多中小企業在數位時代仍然難以累積自有數據,更無法建立長期品牌資產。「我們常看到企業抱怨平台廣告費高漲、成效卻逐年下降,但卻忽略了最基礎的一件事:沒有自己的域名,等於沒有真正的數位身分。」林原直言,中小企業要邁向數位獨立,第一步就是註冊屬於自己的專屬域名。

拒當數位無殼蝸牛,從.tw開始

為協助中小企業從根本建立「可信身分」,TWNIC作為國家級網路資訊中心,不僅負責 .tw 與 .台灣 頂級域名的管理,也肩負推動台灣整體數位信任生態的責任。TWNIC從三個面向推動相關工作:

  • 政策面 :持續優化域名註冊流程與推廣政策,降低中小企業導入門檻;
  • 教育面 :辦理講座與工作坊,提升企業主對於數位域名資產管理與資安防護的認識;
  • 合作面 :與受理註冊機構及產業夥伴合作,協助企業從註冊、建站到驗證,建立完整的一站式服務。

在具體措施上,TWNIC近期推出「52168.tw」專案,針對 112 年 1 月 1 日後完成登記的公司行號,提供一年期免費域名申請優惠,鼓勵企業註冊專屬域名、打造獨立品牌門面。同時,也推行「綠色域名認證」制度,企業通過註冊人身份驗證後,其 WHOIS 資料將標示「已通過.tw綠色域名認證」,象徵資訊真實、完整且可信,猶如掛上一面值得信賴的門牌。此外,TWNIC亦提供 Registry Lock 與 DNSSEC 等安全機制,協助企業以低成本強化資安防護與品牌保護,逐步建立穩固的數位基礎。

52168活動網站
圖/ 52168活動網站

余若凡強調,唯有當企業擁有唯一、可驗證的數位門牌,台灣整體的數位信任基礎才能真正穩固。特別是在生成式 AI 與跨平台資訊流高度重疊的時代,企業若要在搜尋與推薦機制中被正確辨識,擁有清楚的官方域名將是最基本的條件。域名不僅是連結網站的網址,更是品牌在數位空間中的憑證與信任標識。

同時余若凡也呼籲,中小企業不應將品牌的未來寄託於他人平台,而應主動建立自有域名與網站。這不只是為品牌架起一道防線,更是為台灣的網路生態奠定可信任的基礎,讓每一次點擊都能源於信任。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓