Gemini 3.0 要來了?神秘Google模型一鍵破解古文帳冊:為何AI能看懂手寫字跡,背後商機無限?
Gemini 3.0 要來了?神秘Google模型一鍵破解古文帳冊:為何AI能看懂手寫字跡,背後商機無限?

AI現在不只看得懂字面上的意思,還能理解字面意義背後的真實世界規則。

近期,一位歷史學者把一頁1758年的商人日記帳丟進Google的AI Studio,本想測試抄寫能力,卻看見模型主動推理出英制貨幣與重量的換算,將一串模糊的「145」還原為「14磅5盎司」,並精確對齊最終金額。

加拿大勞雷爾大學教授馬克·亨弗里斯(Mark Humphries)在專文中指出,Google AI Studio近期不定期出現的A/B測試,被認為是Gemini 3.0 Pro在推出前的測試版本。綜合他在上述歷史文件上的測試,亨弗里斯認為這款「未知Gemini模型」同時突破了「手寫文本最後一哩的準確度」與「視覺結合推理的隱性符號化」兩個老問題。

前者,是將手寫文字辨識(HTR)提升到專家級準確度,顯著壓低過去最難的「最後10%」錯誤(特別是名字、日期、金額、地名與不規則拼寫), 實測在排除歧義標點與大小寫後,達到字元錯誤率(CER)約0.56%、詞錯誤率(WER)約1.22%

後者,則是模型在未被明確要求下,能把視覺辨識與情境推理結合,進行近似「符號推理」的一致性校驗與換算。

這兩點使亨弗里斯推論: 當模型不只把字「抄對」,還能連同上下文與世界規則「讀懂、驗算、自我更正」後,原本難用的歷史與實務檔案,將變成可檢索、可審核、可追溯的資料資產。

這意味著, 在需要高精度「視覺+合規推理」的各領域(史料、帳冊、醫療、法務、製造現場),都可能迎來可靠性的質變:從單純的轉錄,進階到基於現實世界規則的上下文理解。

最後一哩的準確度,卡住了AI的價值

手寫文字識別(HTR)是AI最古老的命題之一,從1966年的IBM機器讀字到近年的多模態LLM,進步穩定卻總在「最後10%」前止步。亨弗里斯解釋,對歷史學者而言,真正有用的不是把「大部分」字看對,而是把「名字、日期、金額、地名」這些低機率、不可預測的關鍵信息讀對;沒有這些,文本再優美也無法進入研究與檢索。「最後一哩的準確度,才是生產力的分水嶺。」

亨弗里斯與研究夥伴建了約50份、共1萬字的測試集,涵蓋18至19世紀的各式手寫風格與設備掃描,並以CER/WER評估。此前的里程碑是:Gemini 2.5 Pro在嚴格標準下達到接近人類的區間(CER約4%、WER約11%);若排除大小寫與標點這類不影響理解的爭議性錯誤,能降至CER約2%、WER約4%。這是系統性迭代的勝利,但離「專家級」仍有距離。

轉捩點:一個日記帳,逼出了推理本能

AI Studio近期被發現偶爾會出現A/B雙輸出供用戶投票,外界猜測這是新款Gemini(或許是Gemini 3)的灰度測試。亨弗里斯以同樣測試流程反覆重試,選取最難的五份手稿:混合語言、拼字錯亂、標點雜亂、大小寫不規則。

結果令人吃驚。在嚴格標準下,模型達到CER約1.7%、WER約6.5%;若剔除高度爭議的大小寫與標點,錯字率進一步降至CER約0.56%、WER約1.22%。這幾乎就是「專家水準」。

更關鍵的是第六份「挑戰項」:1758年奧爾巴尼商人的日記帳。這類帳冊的字跡連人都難以辨識,更別說是模型。其以舊式英貨幣(1英鎊=20先令、1先令=12便士)記載,且帳冊中非十進位、小計與合計交錯、項目收支交織、速記符號與刪線混用。傳統模型常在數字與結構上崩潰,例如把單價與合計混在一起、看不出重量或長度單位,甚至在輸出中重複卡死。

但這次, 未知Gemini不但把名字與商品對齊,更在一筆「塔糖(loaf sugar)」的記錄裡,自主判定「145」並非數字序列,而是重量的拆分,進而以價格「每磅1先令4便士(即16便士)」與總額「0鎊19先令1便士(即229便士)」倒推重量:229÷16=14.3125磅,即「14磅5盎司」。

亨弗里斯在文中解讀:「當模型開始自發地對齊上下文,它就跨過了理解的門檻。」

方法論拆解:視覺、語境、規則⋯3重對齊

視覺:從像素到字形的識別

亨弗里斯指出,未知Gemini展現了更穩定的「字形解碼」能力,把多種手寫體的變體、連筆與掃描噪音處理為一致的字符序列。這讓「基礎可讀性」不再是瓶頸,也使後續語境推理建立在乾淨的輸入上。

過去的痛點在於,手寫識別的誤差往往是「連鎖錯誤」:一個字母看錯,整串詞與句意就偏航。穩健的視覺,是所有後續推理的地基。

語境:將「不可預測信息」嵌入情景

名字、日期、金額這些在統計分佈上屬於「低頻且不可預測」的信息,傳統LLM易以高頻詞替代(如把罕見姓氏改成常見姓氏)。未知Gemini的不同在於:它在帳冊情境中,能辨識出「金額=單價×數量」以及「英貨幣的非十進位結構」,於是把低頻信息錨定在更大的語境網絡裡。

簡單來說,在「任務結構可被識別」的場景裡,模型可以透過上下文的一致性約束生成範圍,以避免機器幻覺。

規則:從隱性記憶抽取「世界規則」

最令人側目的,是模型並未被明確告知英制貨幣與重量的轉換規則,卻能在上下文中調用「每先令12便士、每磅16盎司」等隱性知識,並在兩個非十進位系統間來回換算,使「單價、數量、合計」三者閉環一致。

其關鍵在於「隱性符號化」:在足夠多的結構化樣本中,模型可以自己組裝出可操作的準規則,並以一致性檢查確保資料正確。

功能大躍進:從「抄寫員」到「審計師」?

綜合亨弗里斯的發現,這意味著未來AI不僅能把文本準確轉成可檢索的資料,還能對交易、度量衡、文化語境做出一致性解讀;在更廣的產業場景,例如醫療手寫病歷、物流簽收單、法務契據、製造現場點檢,AI模型可從「看懂」走向「查核」,以確保資料的可信度。

對商業來說,這是一個明確信號: 當模型能從語境生成規則,產品就能從工具躍遷為系統。

對Google而言,未知Gemini在AI Studio的試水,展示了從 「視覺→語境→規則→一致性」 的完整飛輪;對所有以資料為燃料的行業,這是一次重要的可靠性疊代。

延伸閱讀:65歲被28歲管,Mata首席科學家不幹了!一場人事動盪,揭社群巨頭技術路線大分歧
當輝達還在舞台走秀,Google悄悄亮出底牌了!第七代TPU「Ironwood」如何將AI戰爭升級至下半場?

資料來源:Generative History

關鍵字: #Google #Gemini
往下滑看下一篇文章
從缺工到食安:古吉系統科技如何推動餐飲業數位化的下一波浪潮?
從缺工到食安:古吉系統科技如何推動餐飲業數位化的下一波浪潮?

Computex 2026 圓滿落幕,除了 AI 與機器人應用之外,服務業數位化也成為展場上的另一項焦點。其中,自助服務設備品牌古吉系統科技展出的多款新品,以「雙機整合」概念吸引不少參觀者目光。無論是雙面自助點餐機、POS 與自助點餐二合一雙系統機,或桌上型 1 托 2 點餐機,皆為台灣首創、自主研發的創新設計,不僅展現古吉深厚的產品研發與系統整合能力,放眼國際市場也具有高度差異化。

古吉系統科技總經理吳三奇表示,古吉長期聚焦於如何用更高效率、更低成本的方式協助業者解決營運痛點,希望透過持續創新,滿足不同場域與業態的需求,進一步推動服務業數位轉型。

#3 從缺工到食安:古吉系統如何推動餐飲業數位化的下一波浪潮?
圖/ 數位時代

從連鎖品牌走向街邊小店,自助設備迎來新一波普及潮

事實上,相較於連鎖餐廳、速食店或手搖飲品牌,自助設備在傳統市場、市集攤販、街邊小吃等中式餐飲場域的普及率一直不高。古吉系統科技總經理吳三奇分析,背後原因主要來自資訊落差、經營習慣與成本考量三大因素。

不過,隨著食藥署修正《食品良好衛生規範準則》,明定餐飲從業人員在調理即食食品時,手部不得接觸現金,這樣的市場現況正逐漸出現改變。關鍵在於,傳統餐飲業者的人力本就有限,「老闆一人負責點餐、備餐兼找零」的作業模式已成常態,即便有意增聘人力,也往往受限於缺工問題而不易實現。

在此背景下,自助點餐機/售票機、自助付款機等自助設備成了最佳解答。吳三奇形容,業者導入自助設備就像多聘請一位櫃檯人員,不僅能協助處理點餐、收款等重複性工作,符合法規要求及降低第一線人力負擔,也能減少找錯錢、收到假鈔,以及尖峰時段來不及應對顧客需求等問題,讓業者能將更多心力投入餐點製作與服務品質提升。

從早餐店到主題樂園,自助設備如何解決不同產業的營運痛點?

而從古吉服務的客戶案例來看,自助設備所解決的問題,不只是作業效率而已,而是涵蓋人流分散、收款管理與消費體驗等不同面向,且應用場景橫跨餐飲業、觀光休閒等各種服務場域。

像連鎖早餐品牌晨間廚房便透過自助設備解決尖峰時段的人流問題。由於早午餐產業的顧客高度集中在特定尖峰時段,且普遍不願久候,因此,點餐與出餐效率往往直接影響門市營運表現。為此,晨間廚房在原有的 POS 與手機點餐系統外,再導入古吉自助點餐機進行分流顧客,不僅提供更多元的點餐選擇,也有效降低櫃檯壓力並提升整體點餐與出餐效率。

而手搖飲品牌茶之魔手則透過自助收款設備改善門市收銀流程,其將自助收款機整合既有 POS 系統,店員只需負責點餐即可,由消費者自行完成付款流程,不僅減少收款、找零所耗費的時間,也能降低錯誤風險,進而快速消化排隊人流。

值得注意的是,自助設備的應用也早已跨出餐飲產業。例如主題樂園遠雄海洋公園便導入自動售票機並整合園區消費系統,遊客在購票的同時,還可取得折價卷,折抵在園區內的消費,不僅降低售票窗口的人力需求,也讓遊客從購票到入園的流程更加順暢。

#1 從缺工到食安:古吉系統如何推動餐飲業數位化的下一波浪潮?
圖/ 數位時代

從店家痛點出發,打造跨產業的一站式解決方案

從餐飲到觀光,不同產業面臨的營運挑戰雖然各不相同,卻都能在古吉的解決方案中找到對應答案,關鍵在於,古吉從市場需求角度出發,建立起涵蓋點餐、收款、叫號、廚房作業及營運管理的一站式解決方案,並透過多元產品組合滿足不同場域需求。

吳三奇進一步說明,古吉系統科技早在 2014 年便投入研發自助點餐系統,長期與第一線店家合作的過程中,發現許多業者面臨相似的經營難題,例如:人力不足、店面空間有限等。因此,古吉的產品開發始終圍繞著「省空間、更有效率、降低成本」三大目標,希望透過科技協助店家減輕人力負擔,同時優化營運流程。

正因如此,古吉系統科技不斷研發新產品,目前市場上多數品牌僅能提供 3 至 5 種機型,古吉卻已發展出 12 至 15 種不同尺寸與安裝形式的設備,讓業者能依照自身業態與空間條件選擇最適合的配置。

這樣的研發思維,也體現在古吉 2026 年推出的多款新產品上。例如:雙面自助點餐機採用兩個螢幕共用一台主機的設計,可同時服務兩位顧客;桌上型 1 托 2 點餐機則讓兩台點餐機共用一台付款設備,在有限空間中提升服務量能;而 POS 與自助點餐二合一雙系統機,則兼具店員服務與顧客自助操作兩種模式,可依現場需求靈活調整,無論是店員點餐、顧客自助結帳,或由顧客自行完成點餐與付款,都能有效提升整體營運效率。

「我們不是為了追求產品數量而開發新產品,而是從店家真正遇到的問題出發。」吳三奇表示,正因為持續思考如何解決店家在人力與空間上的限制,古吉才能持續創新產品,並成為台灣商家導入數量最高的自助點餐機品牌。

展望未來,吳三奇認為,隨著食安規範逐步落實,加上缺工問題短期內難以緩解,自助設備在服務業中的角色也將持續轉變,從過去提升效率的選配工具,逐漸成為維持營運、兼顧合規與優化顧客體驗的基本配備,並進一步推動餐飲業展開新一波數位轉型。

#0 從缺工到食安:古吉系統如何推動餐飲業數位化的下一波浪潮?
圖/ 數位時代

面對市場需求持續升溫,古吉系統科技也將持續投入產品創新,包括導入 AI 應用、縮減設備體積,以及開發更多符合不同場域需求的解決方案。同時,古吉也正積極布局日本、香港、越南等海外市場,希望將台灣自主研發的自助服務技術推向國際,讓更多企業透過科技提升營運效率與服務品質。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓