Gemini 3.0 要來了？神秘Google模型一鍵破解古文帳冊：為何AI能看懂手寫字跡，背後商機無限？|數位時代 BusinessNext

AI現在不只看得懂字面上的意思，還能理解字面意義背後的真實世界規則。

近期，一位歷史學者把一頁1758年的商人日記帳丟進Google的AI Studio，本想測試抄寫能力，卻看見模型主動推理出英制貨幣與重量的換算，將一串模糊的「145」還原為「14磅5盎司」，並精確對齊最終金額。

加拿大勞雷爾大學教授馬克·亨弗里斯（Mark Humphries）在專文中指出，Google AI Studio近期不定期出現的A/B測試，被認為是Gemini 3.0 Pro在推出前的測試版本。綜合他在上述歷史文件上的測試，亨弗里斯認為這款「未知Gemini模型」同時突破了「手寫文本最後一哩的準確度」與「視覺結合推理的隱性符號化」兩個老問題。

前者，是將手寫文字辨識（HTR）提升到專家級準確度，顯著壓低過去最難的「最後10%」錯誤（特別是名字、日期、金額、地名與不規則拼寫）， 實測在排除歧義標點與大小寫後，達到字元錯誤率（CER）約0.56%、詞錯誤率（WER）約1.22%。

後者，則是模型在未被明確要求下，能把視覺辨識與情境推理結合，進行近似「符號推理」的一致性校驗與換算。

這兩點使亨弗里斯推論：當模型不只把字「抄對」，還能連同上下文與世界規則「讀懂、驗算、自我更正」後，原本難用的歷史與實務檔案，將變成可檢索、可審核、可追溯的資料資產。

這意味著，在需要高精度「視覺＋合規推理」的各領域（史料、帳冊、醫療、法務、製造現場），都可能迎來可靠性的質變：從單純的轉錄，進階到基於現實世界規則的上下文理解。

最後一哩的準確度，卡住了AI的價值

手寫文字識別（HTR）是AI最古老的命題之一，從1966年的IBM機器讀字到近年的多模態LLM，進步穩定卻總在「最後10%」前止步。亨弗里斯解釋，對歷史學者而言，真正有用的不是把「大部分」字看對，而是把「名字、日期、金額、地名」這些低機率、不可預測的關鍵信息讀對；沒有這些，文本再優美也無法進入研究與檢索。「最後一哩的準確度，才是生產力的分水嶺。」

亨弗里斯與研究夥伴建了約50份、共1萬字的測試集，涵蓋18至19世紀的各式手寫風格與設備掃描，並以CER/WER評估。此前的里程碑是：Gemini 2.5 Pro在嚴格標準下達到接近人類的區間（CER約4%、WER約11%）；若排除大小寫與標點這類不影響理解的爭議性錯誤，能降至CER約2%、WER約4%。這是系統性迭代的勝利，但離「專家級」仍有距離。

轉捩點：一個日記帳，逼出了推理本能

AI Studio近期被發現偶爾會出現A/B雙輸出供用戶投票，外界猜測這是新款Gemini（或許是Gemini 3）的灰度測試。亨弗里斯以同樣測試流程反覆重試，選取最難的五份手稿：混合語言、拼字錯亂、標點雜亂、大小寫不規則。

結果令人吃驚。在嚴格標準下，模型達到CER約1.7%、WER約6.5%；若剔除高度爭議的大小寫與標點，錯字率進一步降至CER約0.56%、WER約1.22%。這幾乎就是「專家水準」。

更關鍵的是第六份「挑戰項」：1758年奧爾巴尼商人的日記帳。這類帳冊的字跡連人都難以辨識，更別說是模型。其以舊式英貨幣（1英鎊=20先令、1先令=12便士）記載，且帳冊中非十進位、小計與合計交錯、項目收支交織、速記符號與刪線混用。傳統模型常在數字與結構上崩潰，例如把單價與合計混在一起、看不出重量或長度單位，甚至在輸出中重複卡死。

但這次，未知Gemini不但把名字與商品對齊，更在一筆「塔糖（loaf sugar）」的記錄裡，自主判定「145」並非數字序列，而是重量的拆分，進而以價格「每磅1先令4便士（即16便士）」與總額「0鎊19先令1便士（即229便士）」倒推重量：229÷16=14.3125磅，即「14磅5盎司」。

亨弗里斯在文中解讀：「當模型開始自發地對齊上下文，它就跨過了理解的門檻。」

方法論拆解：視覺、語境、規則⋯3重對齊

視覺：從像素到字形的識別

亨弗里斯指出，未知Gemini展現了更穩定的「字形解碼」能力，把多種手寫體的變體、連筆與掃描噪音處理為一致的字符序列。這讓「基礎可讀性」不再是瓶頸，也使後續語境推理建立在乾淨的輸入上。

過去的痛點在於，手寫識別的誤差往往是「連鎖錯誤」：一個字母看錯，整串詞與句意就偏航。穩健的視覺，是所有後續推理的地基。

語境：將「不可預測信息」嵌入情景

名字、日期、金額這些在統計分佈上屬於「低頻且不可預測」的信息，傳統LLM易以高頻詞替代（如把罕見姓氏改成常見姓氏）。未知Gemini的不同在於：它在帳冊情境中，能辨識出「金額＝單價×數量」以及「英貨幣的非十進位結構」，於是把低頻信息錨定在更大的語境網絡裡。

簡單來說，在「任務結構可被識別」的場景裡，模型可以透過上下文的一致性約束生成範圍，以避免機器幻覺。

規則：從隱性記憶抽取「世界規則」

最令人側目的，是模型並未被明確告知英制貨幣與重量的轉換規則，卻能在上下文中調用「每先令12便士、每磅16盎司」等隱性知識，並在兩個非十進位系統間來回換算，使「單價、數量、合計」三者閉環一致。

其關鍵在於「隱性符號化」：在足夠多的結構化樣本中，模型可以自己組裝出可操作的準規則，並以一致性檢查確保資料正確。

功能大躍進：從「抄寫員」到「審計師」？

綜合亨弗里斯的發現，這意味著未來AI不僅能把文本準確轉成可檢索的資料，還能對交易、度量衡、文化語境做出一致性解讀；在更廣的產業場景，例如醫療手寫病歷、物流簽收單、法務契據、製造現場點檢，AI模型可從「看懂」走向「查核」，以確保資料的可信度。

對商業來說，這是一個明確信號： 當模型能從語境生成規則，產品就能從工具躍遷為系統。

對Google而言，未知Gemini在AI Studio的試水，展示了從 「視覺→語境→規則→一致性」 的完整飛輪；對所有以資料為燃料的行業，這是一次重要的可靠性疊代。

延伸閱讀：65歲被28歲管，Mata首席科學家不幹了！一場人事動盪，揭社群巨頭技術路線大分歧
 當輝達還在舞台走秀，Google悄悄亮出底牌了！第七代TPU「Ironwood」如何將AI戰爭升級至下半場？

資料來源：Generative History

Computex 2026 圓滿落幕，除了 AI 與機器人應用之外，服務業數位化也成為展場上的另一項焦點。其中，自助服務設備品牌古吉系統科技展出的多款新品，以「雙機整合」概念吸引不少參觀者目光。無論是雙面自助點餐機、POS 與自助點餐二合一雙系統機，或桌上型 1 托 2 點餐機，皆為台灣首創、自主研發的創新設計，不僅展現古吉深厚的產品研發與系統整合能力，放眼國際市場也具有高度差異化。

古吉系統科技總經理吳三奇表示，古吉長期聚焦於如何用更高效率、更低成本的方式協助業者解決營運痛點，希望透過持續創新，滿足不同場域與業態的需求，進一步推動服務業數位轉型。

從連鎖品牌走向街邊小店，自助設備迎來新一波普及潮

事實上，相較於連鎖餐廳、速食店或手搖飲品牌，自助設備在傳統市場、市集攤販、街邊小吃等中式餐飲場域的普及率一直不高。古吉系統科技總經理吳三奇分析，背後原因主要來自資訊落差、經營習慣與成本考量三大因素。

不過，隨著食藥署修正《食品良好衛生規範準則》，明定餐飲從業人員在調理即食食品時，手部不得接觸現金，這樣的市場現況正逐漸出現改變。關鍵在於，傳統餐飲業者的人力本就有限，「老闆一人負責點餐、備餐兼找零」的作業模式已成常態，即便有意增聘人力，也往往受限於缺工問題而不易實現。

在此背景下，自助點餐機/售票機、自助付款機等自助設備成了最佳解答。吳三奇形容，業者導入自助設備就像多聘請一位櫃檯人員，不僅能協助處理點餐、收款等重複性工作，符合法規要求及降低第一線人力負擔，也能減少找錯錢、收到假鈔，以及尖峰時段來不及應對顧客需求等問題，讓業者能將更多心力投入餐點製作與服務品質提升。

從早餐店到主題樂園，自助設備如何解決不同產業的營運痛點？

而從古吉服務的客戶案例來看，自助設備所解決的問題，不只是作業效率而已，而是涵蓋人流分散、收款管理與消費體驗等不同面向，且應用場景橫跨餐飲業、觀光休閒等各種服務場域。

像連鎖早餐品牌晨間廚房便透過自助設備解決尖峰時段的人流問題。由於早午餐產業的顧客高度集中在特定尖峰時段，且普遍不願久候，因此，點餐與出餐效率往往直接影響門市營運表現。為此，晨間廚房在原有的 POS 與手機點餐系統外，再導入古吉自助點餐機進行分流顧客，不僅提供更多元的點餐選擇，也有效降低櫃檯壓力並提升整體點餐與出餐效率。

而手搖飲品牌茶之魔手則透過自助收款設備改善門市收銀流程，其將自助收款機整合既有 POS 系統，店員只需負責點餐即可，由消費者自行完成付款流程，不僅減少收款、找零所耗費的時間，也能降低錯誤風險，進而快速消化排隊人流。

值得注意的是，自助設備的應用也早已跨出餐飲產業。例如主題樂園遠雄海洋公園便導入自動售票機並整合園區消費系統，遊客在購票的同時，還可取得折價卷，折抵在園區內的消費，不僅降低售票窗口的人力需求，也讓遊客從購票到入園的流程更加順暢。

從店家痛點出發，打造跨產業的一站式解決方案

從餐飲到觀光，不同產業面臨的營運挑戰雖然各不相同，卻都能在古吉的解決方案中找到對應答案，關鍵在於，古吉從市場需求角度出發，建立起涵蓋點餐、收款、叫號、廚房作業及營運管理的一站式解決方案，並透過多元產品組合滿足不同場域需求。

吳三奇進一步說明，古吉系統科技早在 2014 年便投入研發自助點餐系統，長期與第一線店家合作的過程中，發現許多業者面臨相似的經營難題，例如：人力不足、店面空間有限等。因此，古吉的產品開發始終圍繞著「省空間、更有效率、降低成本」三大目標，希望透過科技協助店家減輕人力負擔，同時優化營運流程。

正因如此，古吉系統科技不斷研發新產品，目前市場上多數品牌僅能提供 3 至 5 種機型，古吉卻已發展出 12 至 15 種不同尺寸與安裝形式的設備，讓業者能依照自身業態與空間條件選擇最適合的配置。

這樣的研發思維，也體現在古吉 2026 年推出的多款新產品上。例如：雙面自助點餐機採用兩個螢幕共用一台主機的設計，可同時服務兩位顧客；桌上型 1 托 2 點餐機則讓兩台點餐機共用一台付款設備，在有限空間中提升服務量能；而 POS 與自助點餐二合一雙系統機，則兼具店員服務與顧客自助操作兩種模式，可依現場需求靈活調整，無論是店員點餐、顧客自助結帳，或由顧客自行完成點餐與付款，都能有效提升整體營運效率。

「我們不是為了追求產品數量而開發新產品，而是從店家真正遇到的問題出發。」吳三奇表示，正因為持續思考如何解決店家在人力與空間上的限制，古吉才能持續創新產品，並成為台灣商家導入數量最高的自助點餐機品牌。

展望未來，吳三奇認為，隨著食安規範逐步落實，加上缺工問題短期內難以緩解，自助設備在服務業中的角色也將持續轉變，從過去提升效率的選配工具，逐漸成為維持營運、兼顧合規與優化顧客體驗的基本配備，並進一步推動餐飲業展開新一波數位轉型。

面對市場需求持續升溫，古吉系統科技也將持續投入產品創新，包括導入 AI 應用、縮減設備體積，以及開發更多符合不同場域需求的解決方案。同時，古吉也正積極布局日本、香港、越南等海外市場，希望將台灣自主研發的自助服務技術推向國際，讓更多企業透過科技提升營運效率與服務品質。