Google介入硬體的根本原因:AR/MR─人機介面的未來
Google介入硬體的根本原因:AR/MR─人機介面的未來
2017.09.22 | Google

頂尖的軟體公司,終究需要建立自己的硬體,才能真正實現軟體的價值。相反的,沒有軟體思維與能力的公司,擁有硬體也沒有辦法創造出價值,終究會失敗。

蘋果的思維:為軟體打造專屬硬體

長期以來,蘋果與整個資訊產業最大的不同就是:它一直都是「基於軟體與應用的觀點,去尋找技術與開發專屬硬體」這個策略。

而其他公司,幾乎都是遵循「先打造通用硬體,再尋求硬體的軟體應用」這種思維。這種根本思維上的差別,基本上反應當年影響Apple最大的電腦科學家凱伊(Alan Kay)的名言:People who are really serious about software should make their own hardware.

「為軟體打造專屬硬體」這種思維,在個人電腦桌機的時代,並沒有為蘋果帶來任何優勢,反而使蘋果陷於倒閉邊緣。然而,同樣的思維,從筆電時代開始,就逐漸顯示其意義。到了智慧型手機的時代,則成為蘋果不斷創新與拉大競爭者距離的關鍵。

到了AR/MR/AI 的時代,更將大幅放大蘋果的領先優勢。或許,這也是促使Microsoft與Google這兩個純軟體公司,先後買下手機硬體公司的根本原因。

Apple的硬體護城河

四十年來,人與電腦之間的互動方式,從早期一維的螢幕Command line搭配鍵盤,到二維的視窗與圖像介面搭配滑鼠,再到觸控螢幕搭配各種多點觸控手勢。在這段歷史中,雖然這些技術幾乎無一源自蘋果,但蘋果卻無疑的產業中推動電腦人機介面演進最重要的推手。

可以想像的,人類生活在三度空間的世界,人的動作,周圍的環境與物體都是三維的。所以,對人類而言,最自然的人機互動方式,當然也是三維的。如何將虛擬的數位化影像或資訊物件,和真實世界中的事物自然的融合呈現在三度空間中,並且以三度空間的肢體動作或手勢來操作這些數位物件,就是所謂的Agumented Reality甚至是 Mixed Reality。

未來十年,AR/MR將成為手機,手錶,電視機上盒,智能汽車這類的智慧裝置的主要操作介面,並與我們日常生活全無縫的接軌。

要實現這樣的願景,所需的關鍵技術,包括:電腦3D繪圖與影像處理,人工智慧,3D感測。其實都已經發展與醞釀一段時間。而iPhone X則是更進一步的將這些技術縮小並且整合在手機的處理機,單晶片模組,與作業系統之中。而其中最重要的一塊拼圖就是:行動化的3D感測

行動化的3D感測

所謂的3D感測,就是想辦法把二維的攝影,加入三維的資訊。就以智慧型手機的鏡頭為例,過去十年來,雖然感光元件畫素由2M 增加到 12 M,其核心技術依舊是在二度空間上去記錄三度空間物體的投影。因此,如何去捕捉在攝影過程所失去的維度(包括距離,體積),自然也是科學家與工程師們一直在追尋的。關於這個問題,目前有三種主流的作法。

1. 立體影像Stereo Image

這種方式是模擬人的眼睛,利用雙眼(雙鏡頭)在兩個位置上同時取得兩張類似的影像後,透過影像的交疊比對,去算兩張照片之間的視角差。因為鏡頭之間的距離是固定的,所以有了視角差之後,就可以用簡單的三角函數就去推算出「距離」,也就是影像的「深度」資訊。我們所熟悉的立體電影,在拍攝的階段,也是利用類似的原理來完成。

在消費性電子產品的領域,像三星的手機,以及搭載Intel的Real Sense模組的攝影機都是採用這個方式來增添二維影像中的深度資訊。這種方式最大的好處是,適用於絕大多數自然光充足的場合,也沒有太多距離上的限制。

2. 光子飛行時間計算Time Of Flight

這種方式,是去使用不可見光的低功率雷射,在雷射光中帶著一個時序編碼,發射到物體,反射回來後接收。透過晶片辨識這個編碼,就可以計算出光線從由發射到返回的時間差(也就是光線旅行的時間Time of Flight ),把這個時間乘上光速除以二,就可以知道物體精確的距離。

市場上,包括Kinetic V2,Google Tango,以及iPhone7在內都是採用這種方式。這種方式最大的好處是,它所得到的距離,是精確的距離,而非推估的。而且由於半導體技術的進步,這種元件已經可以單晶片化,並且用real time的方式來感知鏡頭前方物體距離的變化。

3. 結構光Structured Light

這是當年第一代xBox的Kinetic所使用的方式,發展出這個技術的以色列公司PrimeSense,在2013年被蘋果收購,也佈下今日iPhone X 採用結構光技術的局。

要理解結構光的工作原理之前,要先知道什麼是光斑 Light code 。以下試著用最生活化的例子來解釋:晚上關掉電燈,拿一個高聚光的手電筒照在一片木板上,如果木板與手電筒完全垂直,木板上的光影會是一個正圓。而木板與手電筒的距離,會改變這個圓的大小。如果木板有某個傾斜角度,正圓則會變成橢圓。

傾斜角度不同,橢圓的形狀也會不同。如果木板不動,而手電筒任意移動與木板之間的角度與距離,光影就會變成各種不同大小與的橢圓。反過來說,我們就可以用這些不同大小的橢圓來反推手電筒與木板之間的角度與距離。這就是光斑的最原始的想法。

而所謂的結構光,就是先想辦法在感測空間中有計劃,有規則的散佈紅外線雷射光。如果感測空間中有物體存在,那麼這些光線就會在物體上形成各種不可見的光斑。然後用紅外線相機拍下這些光斑,再利用這些光斑的形狀變異,我們就可以推算出空間中所存在物體的距離,大小,甚至形狀。結構光的好處是只要兩張照片就可以完成計算,所以成像速度比 ToF 快。如果搭配專用的處理機核心,甚至可以輕易做到即時(real time)的成像。

事實上,上述三種技術,在筆電或桌機的環境都不算稀奇。但如果要整合起來,成為 AR/MR 的一部分,最大的關鍵挑戰就是「體積尺寸」與「功率耗能」。舉例而言,不論是ToF還是Structured Light,它們的主要限制來自於雷射光的功率,會限制適用的距離偵測範圍。

像手機這種等級的電力,雷射光的功率就只能低到只適用於五十公分內的距離偵測,而像xBox這樣的電玩,雷射光功率就可以大到數公尺範圍的偵測。

以iPhone為例,蘋果在iPhone 7之後,為後置鏡頭加入了雙鏡頭與立體影像的能力,並在前置鏡頭中加入了光子飛行時間距離感測模組,至於最新的iPhone X,則在前鏡頭同時採用了ToF與Structured Light的技術。

未來的應用方向

更重要的,蘋果不是只有硬體,它透過FaceID, Portrait Lighting, Animoji這三個初步的應用,來驗證這些硬體技術的整合應用。而這三個應用,其實也正代表未來十年內人機介面演進的三大方向。

  1. Face ID代表完全Hand Free,而且更安全的身分認證技術即將成熟。在過往,影像辨識的演算法雖然趨於成熟,但限於二維影像資料所提供的資訊有限,要拿臉部影像作為主要的身分辨識方式,還是有很大的困難。但加入三維的資訊與深度學習的技術之後,可以輕易處理包括「髮型,彩妝,眼鏡,面具,照片」等類型的問題,臉部辨識的應用就是完全不同的境界。

  2. Animoji示範了如何在近距離內以即時的速度,精密辨別人臉或肢體的微小動作。如進一步結合AI 的動作識別,它就會是下一代AR 人機互動的主流形式。

  3. Portrait Lighting揭示攝影與影像處理軟體的新世界。經由在照片中加入3D 的資訊,透過程式來人為修正照片(也就俗稱的P圖),將擁有更寬闊的空間。更進一步的,以往已經很成熟的3D影像處理技術,不只可以用來渲染(render)人造的3D物件或模型,未來還可以拿來渲染真實世界中的物體與影像。更白話的說,現在我們還不難區分由電腦3D繪圖所產生的影像,和真實照片之間的差別,但未來這個疆界會更加模糊,而這也正是混合實境(Mixed Reality)的基礎。

細看這上面三種類型的應用,都需要依賴高速影像處理,3D感測與成像,AI運算,以及高度整合的軟硬體,才能實現。所以,蘋果為這些應用打造了專屬的感測器SoC,專屬的光學元件,專屬的GPU,甚至內建專屬AI引擎的CPU。也正因為這樣的軟硬體結合優勢,凱基證券分析師郭明錤認為蘋果在3D感測的領域,至少領先業界一年半到兩年。

換句話說,蘋果很明顯的打算利用iPhone這個全球最大規模的硬體平台,有計劃的驗證與實驗各種3D 感測技術在行動裝置上的可能應用,並且建議專屬硬體的門檻。而其最終的目的,就是利用其軟硬體整合的優勢,為未來的智慧型裝置打造下一世代的人機介面。

iPhone X的真正意義

正如同十年前第一代iPhone揭示了mobile internet與觸控時代的全面來臨,今日的iPhone X也恰如其分的揭示了下一個十年,個人運算環境邁向AI與Mixed Reality時代的可能樣貌,以及軟硬體技術的發展方向。

本文獨家授權轉載自許世杰Facebook。

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場。)

關鍵字: #iPhone #VR_AR_MR
往下滑看下一篇文章
代理式商務來襲:萬事達卡與NCCC攜手產業打造信任新基礎
代理式商務來襲:萬事達卡與NCCC攜手產業打造信任新基礎

隨著代理式 AI(AI Agent)的快速普及,其在商務交易中的應用也從智慧搜尋、商品比價一路延伸至自主下單,逐步形塑出全新的代理式商務(Agentic Commerce)模式。為因應此一趨勢,萬事達卡攜手聯合信用卡處理中心(NCCC)於 15 日舉辦「 AI 時代支付安全與數據信任高峰會」,匯聚產官學界專家共同交流,深入探討代理式商務下的支付授權與驗證機制,以及 AI 時代金融監理的演進與詐欺防治重點。

萬事達卡台灣區董事總經理陳懿文表示,無論交易是由人或代理式 AI 發起,都應該在安全可信的環境中完成,萬事達卡將持續強化支付安全的把關能力,不僅著眼於風險控管,更期望將「信任」轉化為未來創新的基礎與成長動能。聯合信用卡處理中心董事長桂先農則認為,面對 AI 浪潮,支付安全已不再只是技術問題,更要在消費體驗、數據運用與隱私保護之間取得動態平衡。金融監督管理委員會主任委員彭金隆表示,金管會未來將持續秉持安全與發展並進的原則,致力於打造可信賴、穩健且具有包容性的環境,加速金融 AI 應用的發展。

Mastercard-02.jpg
金融監督管理委員會主任委員彭金隆特別出席,表示金管會核心理念為「負責任創新」,並於2025 年成立『金融科技產業聯盟』,期待結合金融周邊單位與金融機構的力量,打造可信任及穩健的AI 金融應用環境。
圖/ 數位時代
Mastercard-03.jpg
萬事達卡台灣區董事總經理陳懿文(左)攜手聯合信用卡處理中心董事長桂先農(右)致詞不約而同提到:面對 AI 浪潮,支付安全將會是如何在消費體驗、數據運用與隱私保護之間取得動態平衡的治理課題。
圖/ 數位時代

AI Agent 重新定義消費旅程,萬事達卡提 4 大要素保障支付安全

Google Cloud 台灣技術總經理林書平認為,代理式商務正在重新定義消費旅程,而 Universal Commerce Protocol(UCP)則是支撐這場變革的關鍵。他表示,UCP 就好像電商界的 Type-C 接口,可以串聯不同代理式 AI 與電商平台後台系統,讓代理式 AI 可以根據消費者需求,自主完成商品搜尋與推薦、比價到下單的交易流程,打造更即時、更個人化的消費體驗。

在此情況下,支付不再只是交易流程中的最後一步,而是串聯個人化服務、授權機制、風險控管與信任的核心環節。萬事達卡數據與顧問服務部資深副總裁戴輝瑾指出,要確保代理式商務下的交易安全,必須具備 4 個關鍵要素,包括可驗證代理式 AI 身份、明確的使用者授權、確保代理式 AI 執行的任務沒有超出授權範圍,以及在發生爭議時,能透過公開透明且可追溯的機制進行處理,確保各方權益。

此外,他也強調,風險管理不應侷限於付款當下,需從交易前、交易中、交易後到持續性的監控,建立端到端的治理架構。為此,萬事達卡推出多元解決方案強化整體防護能力,包括以 Identity Solution 強化數位身分驗證、以 Decision Intelligence Pro 提升即時風險判斷能力、透過 Ethoca 優化爭議處理流程,以及藉由 Recorded Future 提供即時網路威脅情報,全面覆蓋交易生命週期,打造更完整的支付安全生態系。

AI 監理邁入新階段,以信任為核心的監管新框架

從監理角度來看,AI 所帶來的變革也同步改寫治理思維。金管會銀行局局長童政彰指出,監理機關不僅要加強國際合作,更應深化與金融業及科技業的對話,建立更開放且具前瞻性的監理模式。進一步針對代理式商務來看,政大金融AI創新中心主任王儷玲認為,金融監理重心應由模型與資料管理,轉向代理式 AI 安全,尤其當 AI 可以代理消費者進行支付時,如何確保代理式 AI 在授權範圍內執行交易,將成為未來的監理重點。

在國際監理趨勢方面,萬事達卡數據與顧問服務部副總裁 Audrey Wong 分析亞太與全球支付生態並指出,AI 時代的監管核心已轉向「以信任為基礎」,金融業在應用 AI 時,必須具備可解釋性、可問責性與可稽核性,確保決策透明且可追溯。同時,隨著詐騙與洗錢行為跨境化,監理機制也應向外延伸,確保跨境一致性,並透過如 ISO 20022 等標準強化資料透明與治理能力。

回到金融機構實務面,國泰世華銀行數據長梁明喬表示,代理式 AI 將對既有支付與風控機制帶來結構性改變,以信用卡支付為例,過往的驗證重點在於是否為本人,但在代理式 AI 情境下,則轉變為驗證 AI 的身份、授權來源與行為意圖。未來,隨著代理式 AI 的普及發展,授權與權限管理將變得更加重要。

Mastercard-04.jpg
關鍵對談以「AI 時代的資安監管趨勢與企業應對策略 」為題,左起邀請:數位時代總編輯 王志仁主持及重磅與談人國立政治大學金融 AI 創新中心主任 王儷玲、國泰世華銀行數據長 梁明喬及萬事達卡數據與顧問服務部副總裁 Audrey Wong與會。
圖/ 數位時代

AI 詐騙升級,聯防機制成新關鍵

最後,本場研討會亦聚焦討論 AI 造成詐欺風險升級的議題。台灣大哥大資訊長蔡祈岩觀察,詐騙已從單一管道演變為跨平台、跨場景的複合型攻擊,尤其是假冒「代理式 AI 」的詐騙手法,透過對話引導消費者提供個資與支付資訊,正成為新興且高風險的威脅來源。

萬事達卡 Franchise Innovation 副總裁Dennis Koh 進一步歸納出 3 大詐欺發展趨勢。第一,Deepfake 服務化使詐騙門檻與成本大幅降低。第二,詐欺行為跨境化與遠端化,已經突破地理限制、走向全球攻擊。第三,社交工程從大量投放釣魚信件,轉為高度個人化、難以辨識的精準攻擊。

面對詐欺手法持續演進,聯合信用卡處理中心風險管理部資深協理李錦堯表示,聯卡中心正透過區塊鏈與FIDO生物識別技術,打造無密碼的數位身分認證系統,並結合AI數據模型提升TRACE風險預警系統的效能。未來,聯卡中心將持續優化模型,並建立跨機構資料共享的聯防機制,整合發卡機構與國際組織資源,以提升整體防詐能力,對抗日益複雜的詐欺攻擊。

代理式商務將為消費者帶來更好的消費與支付體驗,但同時也對安全、治理與信任造成更大的影響,促使產業必須從單點防護走向跨機構、跨生態系的整體治理思維。在此趨勢下,萬事達卡將持續扮演關鍵推動者角色,攜手監理機關與產業夥伴,強化支付安全標準,推動台灣支付產業的監管框架與創新發展,打造兼顧效率與信任的數位商務環境。

Mastercard-05.jpg
回應AI 代理經濟下的詐欺防制與個資挑戰,本論壇特別邀請台灣大哥大資訊長 蔡祈岩、聯合信用卡處理中心風險管理部資深協理 李錦堯、萬事達卡Franchise Innovation副總裁 Dennis Koh交流趨勢觀點。
圖/ 數位時代

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓