Google延伸搜尋觸角 可透過OCR來檢索PDF文件檔
Google延伸搜尋觸角 可透過OCR來檢索PDF文件檔
2008.11.03 |

對許多網路用戶而言,Google簡直是無所不搜的大神。其實,Google雖然善於在茫茫網海中搜尋各種資料,但也並非萬能,好比電子掃描的文件資料就不容易被索引到。這是因為受到現行技術的侷限,通常Google僅能針對這類文件的標題來進行檢索。

不過,最近Google卻透過官方部落格傳達了一個好消息。該公司產品經理Evin Levey表示,他們將使用光學字元辨識軟體(簡稱OCR)來掃描文件,並得以讓廣大的網友藉此來搜尋由Adobe公司所開發的PDF檔案格式的文件資料。對Google來說,這也許只是一個小小的功能,但卻對於資訊的普及和網路文化的推廣有著長足的進步。

一般預料,初期能夠被索引到的文件應以英文為主,畢竟英文字母和數字相對來得容易辨識,而諸如中文、日文等語言還需要一段時間的等待。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓