Gemini 3.0 要來了?神秘Google模型一鍵破解古文帳冊:為何AI能看懂手寫字跡,背後商機無限?
Gemini 3.0 要來了?神秘Google模型一鍵破解古文帳冊:為何AI能看懂手寫字跡,背後商機無限?

AI現在不只看得懂字面上的意思,還能理解字面意義背後的真實世界規則。

近期,一位歷史學者把一頁1758年的商人日記帳丟進Google的AI Studio,本想測試抄寫能力,卻看見模型主動推理出英制貨幣與重量的換算,將一串模糊的「145」還原為「14磅5盎司」,並精確對齊最終金額。

加拿大勞雷爾大學教授馬克·亨弗里斯(Mark Humphries)在專文中指出,Google AI Studio近期不定期出現的A/B測試,被認為是Gemini 3.0 Pro在推出前的測試版本。綜合他在上述歷史文件上的測試,亨弗里斯認為這款「未知Gemini模型」同時突破了「手寫文本最後一哩的準確度」與「視覺結合推理的隱性符號化」兩個老問題。

前者,是將手寫文字辨識(HTR)提升到專家級準確度,顯著壓低過去最難的「最後10%」錯誤(特別是名字、日期、金額、地名與不規則拼寫), 實測在排除歧義標點與大小寫後,達到字元錯誤率(CER)約0.56%、詞錯誤率(WER)約1.22%

後者,則是模型在未被明確要求下,能把視覺辨識與情境推理結合,進行近似「符號推理」的一致性校驗與換算。

這兩點使亨弗里斯推論: 當模型不只把字「抄對」,還能連同上下文與世界規則「讀懂、驗算、自我更正」後,原本難用的歷史與實務檔案,將變成可檢索、可審核、可追溯的資料資產。

這意味著, 在需要高精度「視覺+合規推理」的各領域(史料、帳冊、醫療、法務、製造現場),都可能迎來可靠性的質變:從單純的轉錄,進階到基於現實世界規則的上下文理解。

最後一哩的準確度,卡住了AI的價值

手寫文字識別(HTR)是AI最古老的命題之一,從1966年的IBM機器讀字到近年的多模態LLM,進步穩定卻總在「最後10%」前止步。亨弗里斯解釋,對歷史學者而言,真正有用的不是把「大部分」字看對,而是把「名字、日期、金額、地名」這些低機率、不可預測的關鍵信息讀對;沒有這些,文本再優美也無法進入研究與檢索。「最後一哩的準確度,才是生產力的分水嶺。」

亨弗里斯與研究夥伴建了約50份、共1萬字的測試集,涵蓋18至19世紀的各式手寫風格與設備掃描,並以CER/WER評估。此前的里程碑是:Gemini 2.5 Pro在嚴格標準下達到接近人類的區間(CER約4%、WER約11%);若排除大小寫與標點這類不影響理解的爭議性錯誤,能降至CER約2%、WER約4%。這是系統性迭代的勝利,但離「專家級」仍有距離。

轉捩點:一個日記帳,逼出了推理本能

AI Studio近期被發現偶爾會出現A/B雙輸出供用戶投票,外界猜測這是新款Gemini(或許是Gemini 3)的灰度測試。亨弗里斯以同樣測試流程反覆重試,選取最難的五份手稿:混合語言、拼字錯亂、標點雜亂、大小寫不規則。

結果令人吃驚。在嚴格標準下,模型達到CER約1.7%、WER約6.5%;若剔除高度爭議的大小寫與標點,錯字率進一步降至CER約0.56%、WER約1.22%。這幾乎就是「專家水準」。

更關鍵的是第六份「挑戰項」:1758年奧爾巴尼商人的日記帳。這類帳冊的字跡連人都難以辨識,更別說是模型。其以舊式英貨幣(1英鎊=20先令、1先令=12便士)記載,且帳冊中非十進位、小計與合計交錯、項目收支交織、速記符號與刪線混用。傳統模型常在數字與結構上崩潰,例如把單價與合計混在一起、看不出重量或長度單位,甚至在輸出中重複卡死。

但這次, 未知Gemini不但把名字與商品對齊,更在一筆「塔糖(loaf sugar)」的記錄裡,自主判定「145」並非數字序列,而是重量的拆分,進而以價格「每磅1先令4便士(即16便士)」與總額「0鎊19先令1便士(即229便士)」倒推重量:229÷16=14.3125磅,即「14磅5盎司」。

亨弗里斯在文中解讀:「當模型開始自發地對齊上下文,它就跨過了理解的門檻。」

方法論拆解:視覺、語境、規則⋯3重對齊

視覺:從像素到字形的識別

亨弗里斯指出,未知Gemini展現了更穩定的「字形解碼」能力,把多種手寫體的變體、連筆與掃描噪音處理為一致的字符序列。這讓「基礎可讀性」不再是瓶頸,也使後續語境推理建立在乾淨的輸入上。

過去的痛點在於,手寫識別的誤差往往是「連鎖錯誤」:一個字母看錯,整串詞與句意就偏航。穩健的視覺,是所有後續推理的地基。

語境:將「不可預測信息」嵌入情景

名字、日期、金額這些在統計分佈上屬於「低頻且不可預測」的信息,傳統LLM易以高頻詞替代(如把罕見姓氏改成常見姓氏)。未知Gemini的不同在於:它在帳冊情境中,能辨識出「金額=單價×數量」以及「英貨幣的非十進位結構」,於是把低頻信息錨定在更大的語境網絡裡。

簡單來說,在「任務結構可被識別」的場景裡,模型可以透過上下文的一致性約束生成範圍,以避免機器幻覺。

規則:從隱性記憶抽取「世界規則」

最令人側目的,是模型並未被明確告知英制貨幣與重量的轉換規則,卻能在上下文中調用「每先令12便士、每磅16盎司」等隱性知識,並在兩個非十進位系統間來回換算,使「單價、數量、合計」三者閉環一致。

其關鍵在於「隱性符號化」:在足夠多的結構化樣本中,模型可以自己組裝出可操作的準規則,並以一致性檢查確保資料正確。

功能大躍進:從「抄寫員」到「審計師」?

綜合亨弗里斯的發現,這意味著未來AI不僅能把文本準確轉成可檢索的資料,還能對交易、度量衡、文化語境做出一致性解讀;在更廣的產業場景,例如醫療手寫病歷、物流簽收單、法務契據、製造現場點檢,AI模型可從「看懂」走向「查核」,以確保資料的可信度。

對商業來說,這是一個明確信號: 當模型能從語境生成規則,產品就能從工具躍遷為系統。

對Google而言,未知Gemini在AI Studio的試水,展示了從 「視覺→語境→規則→一致性」 的完整飛輪;對所有以資料為燃料的行業,這是一次重要的可靠性疊代。

延伸閱讀:65歲被28歲管,Mata首席科學家不幹了!一場人事動盪,揭社群巨頭技術路線大分歧
當輝達還在舞台走秀,Google悄悄亮出底牌了!第七代TPU「Ironwood」如何將AI戰爭升級至下半場?

資料來源:Generative History

往下滑看下一篇文章
用科技與創意改寫食農未來:好食好事加速器第八屆 Demo Day 登場
用科技與創意改寫食農未來:好食好事加速器第八屆 Demo Day 登場

在科技重塑萬物的時代,飲食與農業的創新也正悄然發酵。台灣唯一專注於食農科技創業輔導的「好食好事加速器」,將於10月30日舉辦第八屆Demo Day。活動將邀請13 家入選新創登台發表,聚焦食農科技、AI供應鏈和飲食創新三大面向,分享他們如何以科技、創意和永續理念,改寫食農產業的未來。現場亦同步規劃「未來食農展演區」,集結本屆共17 家新創團隊,展示最前沿的產品與服務,從飲食創新到食農產業的智慧應用,讓與會者一次看見未來食農的全景樣貌。

化身食農新創關鍵推手,創整體存活率95%佳蹟

好食好事加速器營運總監張正瑜指出,好食好事加速器自2018年啟動以來,至今已輔導 78 家食農新創團隊、累積總資本額達新台幣22.6億元,整體成長率達 114%,整體存活率達 92%。

好食好事3.jpg
圖/ 好食好事

這些成果不僅展現了台灣食農新創的韌性與潛力,更凸顯好食好事加速器在背後扮演的關鍵推手角色,透過系統化輔導、跨域資源鏈結與市場驗證,讓食農創業者能夠以更快的速度、更穩的步伐邁向成功。而因應食農產業的轉型趨勢與全球永續浪潮,今年加速器特別聚焦在以下兩大重點,一是運用科技和創新推動食農產業升級,二是加速飲食創新發展。

食農科技+AI供應鏈,以數位創新驅動食農產業升級

根據張正瑜的觀察,多數人對食農產業的想像皆停留在農作物生產階段,但這其實太過狹隘,「食農產業的真正範圍很廣,從『產地到餐桌』乃至『再循環』的整條供應鏈,都應該被納入其中,」張正瑜說,這當中包含生產、批發零售、物流、用餐場域、包裝材質的選用,甚至或廚餘與農業廢棄物的循環再利用等議題,這些都屬於食農產業的一環。

為了提升食農產業價值,今年入選團隊中,有許多聚焦於 AI、數位科技、永續再生等領域的新創,透過創新的解決方案去優化供應鏈各個節點,讓創新不只發生在農田,而能延伸至整個產業鏈。舉凡食農科技、AI 供應鏈等議題,其目的都是運用科技與創新思維推動食農產業升級。

其中,食農科技指的是,運用創新技術或數位科技改變傳統農作物的生長模式與管理方式,本屆入選團隊好食Agri Optech,便是以室內植物工廠為核心,自主開發高效植物照明技術與模組化系統,不僅大幅節省能源與水的耗用量,更能降低疏菜耗損量,與國際植物工廠解決方案相比,好食Agri Optech無論在價格或營運效能上都極具競爭力,如今更透過好食好事加速器的輔導與媒合,成功對接至連鎖早餐品牌,擴大產品通路與市場觸角。

好食股份.jpg
圖/ 好食好事

而AI供應鏈,則是運用人工智慧讓供應鏈更透明、暢通與高效。例如本次入選團隊——團薦科技開發出的AI零售選址平台,可以透過數據與 AI 模型分析人流熱點、預測未來3個月內的營收表現與展店成功率,協助企業找出最具潛力的展店地點。這項技術不僅提升選址決策的速度和精準度,也大幅優化展店流程與整體效率,同時在加速期間,透過業師牽線順利取得與大型連鎖手搖飲品牌合作的機會。

整合大拙匠人資源,加速推動飲食創新

至於本屆加速器的第二個特色——飲食創新,好食好事攜手新興食品品牌「大拙匠人」推出FMCG(快速消費品)加速項目,將具備台灣特色和在地風味的食品,結合新食材、新技術或新包裝,轉化成可在主流通路販售的商品,進一步走向更廣泛的國際市場。

舉例來說,本次入選團隊阿勇家餐飲,是一家擁有 60 年經驗的辦桌團隊,透過與大拙匠人合作開發新產品,使傳統的辦桌料理得以用全新的形式進入零售通路,從節慶餐桌延伸至日常家庭,甚至邁向海外市場,讓全球都能感受台灣獨有的辦桌文化。

另一家入選團隊日日好食,雖然與大拙匠人同樣主打麵類商品,但其強調高蛋白、低碳水化合物的健康取向,與大拙匠人的主要產品鵝油拌麵,各具不同特色、形成互補,雙方在加速期間不僅共同探索合作開發新商品的可能性,大拙匠人更分享自身進軍大型通路的實戰經驗,協助新創掌握通路策略與進入國際市場的運作節奏。

日日好食.jpg
圖/ 好食好事

不只如此,日日好食也透過好食好事加速器的引薦,接受曾任直銷企業高階主管的業師輔導,進一步優化經營策略、提升銷售表現,並對接大型食品公司洽談合作機會,同時也與海外加速器建立連結,為進軍北美市場做好準備。

「我們想做的不只是產品創新,更是『台灣味』的文化傳承與品牌輸出。」張正瑜強調,把餐飲料理轉化成標準化商品,不僅能擴大銷售通路和市場,更能縮短備菜的人力和時間,成為解決餐飲業人力短缺的有效途徑。

從在地出發,鏈結全球:好食好事推動食農新創國際化

張正瑜認為,台灣食農技術和食品產業都具有很強大的市場競爭力,新創團隊應該更具企圖心,在創業的第一天就放眼海外市場。正因如此,好食好事加速器不僅致力於培育在地新創,更積極推動國際鏈結,透過海外社群串聯日本、新加坡、印尼、北美等地的食農科技與創業生態圈,希望將台灣的新創力量推向全球舞台。

今年 5 月,加速器便帶領校友團隊前往日本參加 SusHi Tech Tokyo 2025(Susai Tech)展會,與日本當地的食農科技團隊與投資人交流;預計 11 月前往新加坡和印尼,透過新加坡知名的食農科技加速器 Innovate 360,接觸具潛力的投資與合作夥伴,並對接由印尼最大食品集團三林集團(Salim Group)成立的加速器 Innovation Factory,進一步串聯當地的大型零售與食品企業,為台灣食農新創開啟跨國合作與市場落地的新契機。

從在地創新到國際鏈結,好食好事加速器持續為台灣食農新創打造更廣闊的舞台。現在就報名 10 月 30 日第八屆 Demo Day,一同見證台灣食農創新的新篇章。

好食好事1.JPG
圖/ 好食好事

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓