加入圖像辨識,手機無所不能
加入圖像辨識,手機無所不能
2008.02.01 | 科技

《數位時代》撰文=謝光萍

拿起照相手機拍照、留下生活紀錄,已成為現代人生活的一部分,用手機來視訊通話也稀鬆平常。從產業端來看,蘋果(Apple)公司推出觸控式手機,整合各種娛樂服務;Google推出Android手機平台,要把網路服務串連起來,整個手機市場又進入新一波的競爭,各家無不思考手機還有哪些應用可能? 現在,它甚至可以擔任你的個人翻譯。當你在不同國家旅行,遇到不懂的單字,只要透過手機內建的數位相機鏡頭,對著陌生單字拍攝,透過圖像辨識功能,就可立刻在螢幕上顯示翻譯結果,再也不用帶著大本字典或是慢吞吞地在電子翻譯機輸入單字。

拆解文字技術速遞資訊

這項新技術是由諾基亞(Nokia)中國研究中心所開發,用照相手機拍攝任何物體表面的文字,經由光學辨識,將影像的文字抽取識別,再透過內建的翻譯軟體轉換成不同語言。諾基亞中國研究中心負責人裴斯博(Seppo Pienimaa)表示,該中心針對亞洲語言的研究已長達八年,包括漢語、粵語、英語、泰語、越南語等,希望能夠創造多語言通用的服務,讓使用不同語言的人,可以在生活中更便利地溝通。

諾基亞中國的研發人員表示,現在已經能將中文與英文的文字影像進行拆解辨識,可逐字翻,也可以配上人工智慧的詞組辨識,大從海報看板、小至報章雜誌的說明文字都可翻譯。這項技術最快將可在今年搭配產品問世,屆時可望免除參加北京奧運的外國觀光客看不懂中文菜單的困擾。

透過影像識別的技術,再加上傳輸到某些終端或網路辨識,照相手機的應用還可以作為更精確的個人身份識別。日本松下電器(Panasonic)和夏普(Sharp)公司都已經開始製造具備「面部識別」功能的手機,透過內建相機,來捕捉使用者五官的輪廓與距離,再透過軟體運算,辨別識使用者是否為原手機持有者。

這項研究的應用,不單是打算以手機取代翻譯機,研究人員更試圖讓手機扮演搜尋引擎的角色。諾基亞在加州帕拉阿圖(Palo Alto)的研發中心,就推出一個名為「Point Find」的計畫,只要以照相手機拍攝生活周遭的景物,就可以即時從網路上得到相關資訊。去年秋天,數家印度寶萊塢(Bollywood)電影片廠嘗試了一項新服務:手機用戶將相機鏡頭對準電影海報,然後就可以下載該部電影的主題曲作為手機鈴聲。研究人員在實驗室示範,把手機的相機鏡頭對準一只紅色的鞋子,手機立即可以從網路上搜尋出附近鞋店的資料;對準店面,就能得到門市營業時間的訊息。

諾基亞承諾這項計畫將在三年內實現,而這個概念型科技已經吸引很多人的注意。因為它讓消費者簡單地使用照相手機,得到他們感興趣的資訊。甚至當消費者想要購買某件海報上的洋裝,照相手機也可以搜尋最實惠的價格和購買方式,比起現有搜尋模式(消費者在網路上尋找關鍵文字)便利許多。不過,除了影像辨識,這項技術需要大量科技的配合,例如GPS定位、人工智慧演算法。MIC研究顧問王勝宏表示,利用影像辨識在實體世界搜尋,需要龐大的資料庫和運算能力,更要能夠跨平台的分享資訊,不是單一企業可以做到的。

未來圖像辨識可望與更多應用程式結合,但重點在於要找到利基,提供特定族群消費者一個「渴望擁有」的加值選項,「好用」才能讓圖像辨識成為新的殺手級應用。

往下滑看下一篇文章
從人、流程到工具:TVBS解構新聞業AI轉型方程式
從人、流程到工具:TVBS解構新聞業AI轉型方程式

在生成式 AI 驅動下,新聞產業正加速進入新一輪轉型。這股技術浪潮不僅改變了內容產製模式,也重塑了讀者獲取資訊的入口。面對這場產業變革,台灣科技媒體領導品牌TVBS 展現強勁的轉型動能,不僅積極布局 AI 應用,更憑藉創新專案獲得「nDX數位創新獎助計畫」肯定。

為加速經驗擴散並促進產業交流,日前,TVBS 攜手數位經濟暨產業發展協會(DTA)舉辦「AI in the Newsroom-TVBS轉型實戰分享」發表會,現場匯聚媒體與科技領域專業人士,從實務案例出發,深入剖析 AI 導入新聞現場的應用模式,共同見證 TVBS 如何以 AI 為核心引擎,重新定義數位時代的媒體影響力。

TVBS-1.jpg
圖/ 數位時代

從「人」出發:從超級個體到超級組織,啟動 AI 原生轉型

TVBS 集團成長長簡西村表示,早在生成式 AI 浪潮成形之初,TVBS 便已啟動轉型布局。不僅於 2023 年成立AI未來科技部,專責 AI 應用開發與轉型推進,更由董事長親自主持每週一次的 AI 策略會議,確保決策與執行節奏高度一致,並進一步盤點出「人、流程、科技(PPT)」三大轉型關鍵,逐步落實將 AI 導入各項營運環節。

從「人」的角度來看,TVBS 以 AI 提升效率與創造價值為目標,提出超級個體與超級組織的轉型藍圖。其中,超級個體指的是能善用 AI 工具的記者,例如:透過 AI 分析海量資料、自動生成初稿或經營個人品牌,透過與 AI 的分工協作,不僅提升產出效率,也讓記者得以回歸深度核實與現場採訪等核心職能。

當多個超級個體串聯,便進一步形塑出超級組織,透過 AI 全面提升團隊的數位戰力,成為 AI Native(AI原生)媒體組織。TVBS 的願景是,讓每一個議題皆能發展出專屬 AI Agent,負責資料處理與初稿生成,而人扮演總編輯角色,負責內容品質與倫理把關。如此一來,不僅能實現全天候、高頻率的內容更新,更可透過多 Agent 協作,同時產出文字、影音、Podcast 等不同形式的內容,實現一次生產、全平台分發的目標。

從「流程」出發:讓AI嵌入新聞產製,縮減 30% 作業時間

從「流程」的角度來看,AI 唯有真正嵌入新聞產製流程,才能發揮最大效益。然而,哪些環節最適合導入 AI、導入後流程該如何重塑,往往只有第一線新聞人最清楚。為此,TVBS 邀請新聞部同仁組成「文科種子」團隊,並由主管從日常工作情境出發,親自示範 AI 應用,讓記者實際感受到 AI 帶來的效率提升,進而翻轉「不好用」的既有印象,吸引更多資深同仁投入 AI 應用開發。

TVBS新聞部網路新聞中心總編輯楊致中強調,「AI不是要把新聞人變成工程師,而是要讓新聞人重新回到專業現場。」因此,這群橫跨編輯、記者、編譯等不同職能的種子成員,從使用者視角出發,與工程師並肩協作,以使用情境取代傳統規格書,讓技術團隊得以深入理解採訪流程中的真實痛點,進而開發出涵蓋多語翻譯、初稿生成、重點歸納、多稿比對、標題與內容優化等 AI 應用,整體作業時間平均縮短逾三成。同時,新聞部也與 AI 部門建立每週開會機制,持續提出痛點及回饋使用經驗,推動產品快速迭代。

TVBS-3.jpg
圖/ 數位時代

另一方面,TVBS 也連續三屆舉辦員工限定的「AI 黑客松」,各部門同仁由日常工作中的痛點出發,發想出更貼近第一線需求的 AI 解決方案,讓 AI 逐步成為組織共通的語言,不僅有效提升工作效率,也進一步形塑出 AI 驅動的創新文化。

從「科技」出發:打造混血系統 AI WIZE,讓AI真正貼近使用需求

從「工具」的角度來看,如何在滿足使用需求的同時兼顧技術快速迭代,成為關鍵課題。為此,TVBS 提出混血系統概念,由新聞人與 AI 部門協助,共同開發出專為媒體場景打造的 AI WIZE 平台。

TVBS-2.jpg
圖/ 數位時代

TVBS AI未來科技部副總監吳楨文說明,AI 技術迭代速度極快,若仍沿用傳統「使用者提需求、工程師寫程式」的開發模式,不僅溝通成本高、也難以快速及時優化,容易導致使用體驗不如預期。若是直接使用外部 AI 工具,在產出結果不穩定的情況下,使用者常常要反覆調整提示詞與修正細節,反而會增加時間成本,使 AI 應用淪為新的負擔。

為解決這樣的困境,TVBS 在開發 AI WIZE 時,結合系統化與人才混血兩大策略,由工程師在「深水區」把關系統架構、資訊安全與成本控管,而新聞人則在「淺水區」透過 AI Studio 等自然語言工具定義應用場景,並將新聞專業封裝成可重複使用的 AI Agent技能,同時透過持續回饋機制,讓 AI Agent 不斷學習與優化,使工具更貼近日常工作需求。

簡西村最後強調,人機協作不是選擇,而是必然路徑。TVBS 期望透過這場 AI 轉型,打造兼具速度、深度與可信度的新型媒體競爭力,並以自身實踐經驗為基礎,帶動台灣媒體在 AI 浪潮下強化整體產業競爭力,重新定義媒體的「真實」價值,開創新聞產業的 AI 新時代。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓