人工智慧如何成為圖形驗證碼的破解利器？|數位時代 BusinessNext

在論壇留言、電商買東西、網銀做交易，認證都是必須而且必要的一環。但是除了密碼以外，你應該也看過一個圖片裡面有一堆歪七扭八的英文數字，或是很多圖片要你指出哪幾張裡面有車子跟招牌，這是所謂的圖形認證（或CAPTCHA, Completely Automated Public Turing test to tell Computer and Humans Apart）。

為什麼最近有很多資訊指出圖形認證的機制不安全？

機器學習與語音辨識破解法

圖形認證並不是完全沒破綻，更正確的說，沒有一個機制絕對安全。圖形認證破解法大致可歸類成三種。

第一類是人工破解。很多地方人力是很便宜的，而將CAPTCHA導到那些人手上直接破解是一個便宜又方便的方法。一個正常人在一個小時是可以連續破解上千個CAPTCHA。第二類是錯誤的使用方法。網站設計者的使用方法錯誤，導致CAPTCHA本身可以被繞過，或是把答案寫在網頁中，這也是最常見的一種錯誤。

第三類就是目前最夯的方法：機器學習。這是可以快速導入的方式之一。雖然網路上有很多教學，但是目前能破解的CAPTCHA有限，基本上是屬於有固定格式的Simple CAPTCHA圖形認證。

舉例來說，下圖中的CAPTCHA有背景干擾，有各式的字形跟數字要辨認，明眼人可以立刻看出來這串字是93D1b9（圖一）。

那機器要怎麼辨識？

要機器辨識是很困難的，因為機器無法從背景的噪音中讀出這些字母，但是基本圖形機器可以看出來，由於每個字體的間格是固定的，因此可以用程式切割圖形字體，切成六個不同的圖（圖二）。

將字體切割後，再把每個字體送到辨識軟體中，機器就可以大概判讀給出答案。

因此現在的CAPTCHA系統也開始變化，除了修正背景噪音處理，也將字體扭曲跟間格再變化，加強辨識難度。

而Google還發展了新的CAPTCHA機制，用多張圖要使用者點選當中有車子、招牌或是建築物的reCAPTCHA。不過，辨識車子跟招牌的方式就真的安全了嗎？也未必！

除了圖形辨識外，一般的CAPTCHA為了要照顧到視力不好的使用者，也有語音辨識。方式是在大量噪音中播放一段文字聲音，再請使用者輸入，因此可以用語音辨識破解。

reCAPTCHA和其他的CAPTCHA系統也曾出現過同樣的問題，而Google的系統已有修復，但是其他的CAPTCHA系統修復後，使用者是否更新，又是另一個問題了。

圖形認證運作機制探秘

圖形認證的意義相當單純，不管用文字或是圖形，目的都是要在15到30秒間判定坐在螢幕前面的是人還是電腦。

現在網站所使用的圖形辨識都大多以文字型態為主，主要以三個方向進行辨識：

1.固定型態的辨識。人腦可以辨識出同一個字的無限量變化，但是電腦做不到這件事情，要教會電腦辨識無限量的變化是有困難度的。

2.分辨區隔。人腦對於辨識區隔是相當厲害的，即使兩個字之間幾乎沒有什麼空格，還是能夠分辨出他是兩個字而不是一個字，但電腦很難做到。

3.整個字的意義。簡單的說，即使今天一個在 CAPTCHA裡你無法分辨n, m, u等字母區別，但是當你看整個字的時，就會知道這個字怎麼拼或代表哪個字。

上面三個問題中任何一個問題對電腦來說都是難題，三者問題合併更是難上加難。就像下面這個圖例（圖三）。

雖然中間兩字母不清晰，但按照經驗，你會覺得中間兩個字母應該是u，再組合回去就有90%以上的機率是rescused。

除了歪七扭八的文字外，CAPTCHA也能加入不同的背景，如圖片或是不同顏色的噪音，將文字堆疊多層等方法，避免被破解。

基本保護沒做好，整個資料還是會被搬走

當然，沒有一個認證的方式絕對安全，圖形認證只是一種方法，但是有效的雙因子或多重密碼驗證加上圖形認證，才是最有效的方法。當然，若最基礎的網站安全都沒有做到的話，以上方法也是無效的。

人的驗證只是其中一環，基本網路以及伺服器保護沒做好，資料就不是一筆筆被偷，而是整個被搬走。

圖形認證只是保護機制的一環，基礎的系統架構安全，以及程式設計的基本安全措施，才是維護跟保護一個系統最重要的環節。基礎很重要，要確保網站上的架構與設備安全性，才能保障使用者的安全。

《數位時代》長期徵稿，針對時事科技議題，需要您的獨特觀點，歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw，文長至少800字，請附上個人100字內簡介，文章若採用將經編輯潤飾，如需改標會與您討論。

（觀點文章呈現多元意見，不代表《數位時代》的立場。）

1973 年，良興從台北光華商場一間 50 坪的電子零件行起家，半個世紀後蛻變為年營收破十億、毛利率 18% 的全通路 3C 品牌。不過，伴隨規模擴張帶來的不只是成長，還有日益加劇的管理摩擦。門市遍布全台、品項高達近萬筆，加上跨部門協作頻繁，行政耗損與知識傳承的缺口，成為這家老字號邁向下一階段的隱形天花板。

良興總經理賴志達回顧，從電子零件跨入電商、從線下擴張到 OMO 全通路、再到會員深度經營，作為 3C 零售業者，良興每一波轉型都走在同業前面。「現在輪到 AI 了。如何做到人機協作、AI 賦能，就是良興第五波轉型的核心命題。」

AI 自動化，從行政細節釋放組織戰力

轉型需要夥伴，而賴志達評估合作夥伴的標準很明確：技術能力是基本，產業知識（Domain Know-how）的深度是關鍵，回饋速度更是最終決定因素。2025 年的未來商務展上，良興選擇攜手 Data-DI，看重的正是其「策略諮詢 + AI 產品 + 落地陪跑」三軌並行的實施能力。

很快的，良興與 Data-DI 合作的第一個專案，就落在最耗費人力、卻最常被忽視的環節：會議記錄。「會議如果沒有產值、沒有效果，對企業很傷！」賴志達說，他每天參加許多會議，但跨單位協作的會議記錄長期依賴人工聆聽與逐字整理，常出現人名誤植、決策遺漏、行動項目無人追蹤，讓會議效果大打折扣。

為了解決會議記錄的痛點，Data-DI 業務副總包威棣指出，在導入工具以前，團隊須先釐清三件事：場景是否具備落地價值、哪些流程節點適合 AI 介入，以及以終為始地掌握客戶真正想要的輸出樣貌。這些看似基本的提問，都決定 AI 能否精準落地。

確認方向後，良興與 Data-DI 成功導入 AI 會議記錄自動化系統，透過模糊比對技術校正語音辨識誤差，並將生成的雙版本報告直接回存至既有資料庫，不僅將行政人員從重複性作業中釋放，也為後續的 AI 應用奠定扎實的系統整合基礎。

賴志達分享，現在他去外部開會也會用這個工具，運用 AI 把錄音轉文字、再整理成簡報，很快就能完成，更令外部夥伴驚艷。「我認為這是很成功的案子！也提醒想做 AI 的老闆們，與其急著搞大架構，不如先從小工具讓公司嘗試 AI，建立理解和認同。」

AI 把資深員工大腦轉化為資產

補完行政效率的缺口後，良興接著切入更深層的營運核心：知識傳承。過去，頂尖銷售經驗長期鎖在少數資深員工身上，新人培訓耗時三個月，員工離職即帶走知識資本。與此同時，網路資訊發達，消費者進店前早已掌握基本規格，3C 通路門市人員要如何發揮更多價值？「我要門市的人不是死背規格，而是面對客人時，能用客人能理解的方式對話。」賴志達說。

為此，Data-DI 協助良興建置 AI 門市教育訓練系統。系統透過六大自動化關卡，串接教材生成、審核上架、AI 銷售對練與成績回報，主管僅需在核心節點審核；員工透過手機語音對練，系統依口吻、專業度、回應力等維度自動評分。賴志達表示，目標是將新人培訓期縮短至一個月，讓數十年累積的銷售智慧轉化為可複製、可傳承的企業資產。

然而，要讓這套系統真正運作，得先解決兩個根本問題：資料從哪裡來？以及訓練如何更準確？

「以前大數據時代，講的是資料要大、全、細、實；現在 AI 要做到的是準（準確）、合（合乎場景）。」包威棣說。良興不同廠商提供的素材品質參差不齊，Data-DI 除了整合內部資料，也補充加入外部市場評測內容以填補空缺，再透過人員審核機制過濾雜訊，搭配 agent 架構的多層步驟與知識限定，確保系統能精準提煉對應品類的訓練素材。

賴志達則看得更遠：「這些教育訓練的內容，也將成為公司未來訓練機器人很好的原料。」

Data-DI 陪跑型顧問，帶領企業 AI 轉型

良興與 Data-DI 合作的兩個專案中，雙方共同克服了長提示詞邏輯混亂、AI 幻覺污染知識庫、逐字稿讀取逾時等技術難題。邁向下一步，賴志達表示，公司各部門很早就建置 Power BI 報表，但數據豐富不等於決策清晰。「數據是土壤，如果沒有梳理，就沒有用了。」因此，他的下一個目標是活化數據資本、推動行銷自動流，以精實的人力持續驅動成長。

包威棣則從顧問視角歸納兩個觀察：AI 導入需要高層認同、由上而下推進，像賴志達這樣持續引領良興走在業界前端的決策者，就是不可或缺的推手；而單點工具的價值，終究要累積成組織體質的轉變才算真正落地。「就像會議記錄改變了會議當責的結構，人員訓練改變了知識傳承的方式。從點狀應用走向企業變革，這種決策思路才是 AI 真正深入落地產生價值的關鍵。」

最後，對於仍在觀望AI應用的企業，他則建議：「未來 AI 導致的落差只會愈來愈大，人會變成超級工作者，企業會變成超級企業。開始做就對了，先做一個三個月的小任務，降低落差、再急起追上。」從痛點切入、小步快跑，讓組織在實作中累積對 AI 的理解與信任，這正是 Data-DI 的陪跑哲學。

有關更多 Data-DI 相關資訊，請查詢網站：https://www.data-di.com/