李飛飛:我們如何教電腦看懂圖像
李飛飛:我們如何教電腦看懂圖像
2017.08.03 | 人物

我們的終極目標就是教導機器能夠像人一樣理解所見之物,像是識別物品、辨認人臉、推論物體的幾何形態,進而理解其中的關聯、情緒、動作及意圖。

要電腦達成這個目標的第一步,就是教導電腦如何辨別物品,這是視覺的基石。簡單來說,我們教導的方法是給電腦看一些特定物體的影像,以貓咪為例,貓咪由一些幾何圖形和顏色所組成的,我們用數學語言告知電腦演算方法,貓就是有圓圓的臉、胖胖的身體、兩個尖尖的耳朵和一條長尾巴。那困難點在哪裡?但如果貓咪造型改變,全身都捲起來了,這下子我們就要在原來的模型加上新的形狀和不同的視野角度,又如果貓咪是躲著的呢?我們發現,即使簡單如貓這樣的家庭寵物,也會有相對於原型以外、數也數不清的其他形態表徵, 而這只是其中一樣。

不過,就在八年前,一項簡單而深刻的觀察,改變了我的想法,我發現沒有人教導孩童如何去「看」世界,特別是在孩童早期發育階段,孩童是直接從真實世界的經驗中學習,到三歲左右的年紀時,孩子們已經看過了真實世界中數以百萬計的照片,這樣的訓練範例是很大量的,因此直覺告訴我應以孩童學習經驗法則,兼以質與量,提供訓練的資料給電腦,而非一味追求更好的程式演算。

有了上述的洞見,我們必須要蒐集大量資料群,於是我與普林斯頓大學的李凱教授共同於2007年開始ImageNet專案。2009年起,ImageNet已經是個擁有涵蓋了2萬2千種不同類別,多達150億幅圖像的資料庫,這樣的規模,不論是「質」或「量」都是史無前例的。有了這些資料,我們可以教育我們的電腦,結果我們發現:ImageNet所提供的豐富資訊恰巧與機器學習演算的其中一門特定領域不謀而合,我們稱它為「卷積神經網絡」(Convolutional Neural Network,CNN)──在七零及八零年代,辛頓(Geoff Hinton)和勒丘恩(Yann LeCun)等學者為該領域的先驅。

卷積神經網絡就在眾人的意料外開花結果了。在一般的神經網絡中,我們用作訓練的物品辨識模型就有2千400萬個節點、1億4千萬個參數,以及150億個連結。正如同人類的大腦是由無數個緊密連結的神經元所組成,而神經網絡的基本運作單位是一個類神經元的節點。ImageNet的運作方式是從別的節點得到資料,然後再傳給其他的節點,這些數不清的節點擁有層層的組織架構,就好像我們的大腦一樣。現在,電腦不僅能告訴我們圖中有隻貓,還能告訴我們貓在哪裡。

Google雲端人工智慧暨機器學習首席科學家李飛飛
視覺始於眼睛,但真正使它有用的,卻是大腦。

有時候,如果電腦不確定自己所見到的東西時, 我們已經將它教到可以聰明地給一個安全的答案,而非莽撞地回答,就像一般人能做到的那樣。更有些時候,電腦的運算竟能夠精準地辨別物體品項,例如製造商、型號、車子的年份。舉例來說,Google將這個演算程式廣泛地運用在數百個美國城市的街景裡,也因此我們從中得到了一些有趣的概念。首先,它證實了一項廣為人知的說法,也就是汽車價格和家庭收入是息息相關的。然而令人驚訝的是,汽車價格也和城市中的犯罪率以及區域選舉模式,有一定程度的關係。

那電腦已經趕上、甚至超越人類了嗎?還早得很呢!到目前為止,我們只是教導電腦辨識物品,就像小孩子牙牙學語一樣,雖然這是個傲人的進展,但它不過是第一步而已,很快地,下一波具指標性的後浪就會打上來,小孩子開始進展到用句子來溝通。因此,他已經不會用「這是貓」來描述圖片,而是會聽到這個小孩說:「這是躺在床上的貓。」

因此,要教導電腦看到圖並說出句子, 必須進一步地仰賴龐大資料群以及機器的學習演算。現在,電腦不僅要學習圖片辨識,還要學習人類自然的說話方式,就如同大腦要結合視覺和語言一樣,我們做出了一個模型,它可以連結不同的可視物體,就像視覺片段一樣,並附上句子用的字詞和片語。約四個月前,我們終於把所有的元素全部兜起來了,做出了第一個電腦版的模型,它可以在初次看到照片時說出像人類般自然的句子。

這是第一次人類的眼睛不是唯一可以用來思考和探索世界的工具,我們不僅可以利用機器的智能,更可以運用更多你想像不到的方式攜手合作。這也是我想追求的目標,給予機器智慧之眼, 為整個世界創造更美好的未來。

李飛飛

出生|1976年
學歷|加州理工大學電機工程博士
經歷|史丹佛人工智慧實驗室主任、史丹佛視覺實驗室主任、豐田-史丹佛人工智慧研究中心負責人
現職|Google雲端人工智慧暨機器學習首席科學家

整理.撰文/翁書婷;文章整理自TED

關鍵字: #Google #機器學習
往下滑看下一篇文章
終於出現「看得懂的保險」!國泰人壽以「保險視圖」引領資訊透明革命
終於出現「看得懂的保險」!國泰人壽以「保險視圖」引領資訊透明革命

在台灣,多數人的第一份保障來得很早,可能來自父母,或是出社會後自行投保。然而,直到今天仍有許多人即使手握數張保單,仍說不清自己到底保了什麼。條款繁複、名詞艱澀,導致投保當下似懂非懂,過一陣子就全忘了。保險資訊的不透明,讓風險管理變成了一場全憑印象、依賴業務員的信任遊戲。

自從國泰人壽推出 App 3.0,以「陪伴」重塑保戶與保險的關係,下一步,更要讓資訊變得透明、易讀、好上手。於是,「保險視圖」誕生了—由國泰人壽戰情室 diLab(Digital Insurance Lab)領軍打造的這個平台,試圖翻轉保單難懂的問題,將散落於規範、條款與系統的資訊重新整理、轉譯與可視化,讓保戶終於能「一圖看懂」保障全貌。

「我們希望做到的不只是查詢工具,而是讓保戶真正理解風險、開始做決定。」diLab 經理林蔚安說,這項專案從發想到上線歷時多年,可說是完成了連同業都不敢想像的艱鉅任務。這場透明革命如何開始?國泰人壽又如何讓這個看似困難的挑戰落地?

資訊透明:讓保險回到能被理解的語言

「保險商品本身就很複雜,很多人買了保險,打開保單還是看不懂。」林蔚安指出,國泰人壽累積 800 萬保戶,團隊在梳理客戶旅程時發現,即使擁有多年的資歷與服務經驗,卻未能讓保戶更清楚自己的保障;大多僅在與業務員討論時略有概念,事後又陷入陌生感。因此,「保險視圖」的構想,就是要讓保戶能在同一平台掌握所有保障與資產資訊。

數位時代
diLab 經理林蔚安與團隊歷時打磨領先業界的保險視圖,幫助保戶一次看懂保障。
圖/ 數位時代

第一步,是處理「看不懂」這件事。diLab 從資料盤點開始,依照生涯階段與保障屬性,將保單內容重新分為「我的健康照護」、「我的保險資產」、與「我的壽險傳承」三大方向,讓保戶以更貼近日常的邏輯理解保障結構,例如「住院時有哪些保障?」。

「調研時發現,國內幾乎沒有成熟案例可參考,國外雖有概念但差異極大。」林蔚安表示,圖表複雜,反而增加理解負擔,因此團隊反覆推敲呈現方式,「要放什麼、怎麼放、放到什麼程度,光這個架構就討論了數個月!」每一個看似微小的改變,背後都是無數次的反覆測試與訪談,「我們帶著不同版本的草稿詢問保戶,在沒有業務員引導下是否看得懂。」最終,團隊定調以金字塔結構建構視圖基礎,從保戶自己的健康保障,到未來可運用的累積資產,最終到照顧家人的壽險傳承。沒有看似花俏的圖表,只希望讓多數保戶好理解的簡單呈現。

但挑戰不只在前端設計,還有保險條款轉譯。傳統保單以商品邏輯分類,與使用者思考「何時會用到」的方式完全不同。為了讓資訊更貼近生活情境,「保險視圖」不再以條款分類,而以場景情境作為基準。例如保戶生病住院時,介面會按照基礎醫療、意外、癌症、重大疾病、長照與壽險等六大結構分層呈現,先呈現核心,再逐層深化,視覺化整體保障全貌,並同步提供現金價值與現金流資訊,形成一套完整的理解脈絡。

風險洞察:AI協助人們看清保障缺口

國泰人壽
視覺化保障達成率,一眼了解保障缺口。
圖/ 國泰人壽
國泰人壽
提供熱門推薦與更加個人化的AI推薦,喚醒補強意識。
圖/ 國泰人壽

當保險資訊透過直覺式的設計變得透明,下一個挑戰就是讓保戶理解「自己目前的保障夠不夠」。

因此「保險視圖」也導入保障目標試算功能,保戶只需回答幾題簡單問題,如:住院希望住單人房或雙人房、對疾病治療的費用承受度等,系統即可推算個人的保障目標。接著,AI 會即時計算保障達成率與缺口比例,將複雜的理賠與條款結構轉換成直覺的百分比。「醫療保障達成率 60%」、「癌症保障達成率 45%」,藉由直觀的數字圖表呈現,讓保戶能一眼看出自己保障的完整程度。

此外,平台不只呈現差距,還會以情境推估可能的支出。例如住院五天、手術一次的費用與實際理賠差異,讓保戶真正感受到風險的具體樣貌。「保戶不再是聽到『癌症住院很貴』這種抽象說法,而是看得到具體數字。」透過以場景為基礎的推算,使保戶終於能對模糊的風險概念有畫面,並對理賠內容有更直觀的理解。

平台也提供「熱門推薦」與「 AI 推薦」兩種建議模式。前者以性別、年齡作為分析基礎,後者則依個人資料與既有保單做更客製化的配置。保戶可在平台初步理解現況後,再與業務員討論,透過數位賦能、與有溫度的人性服務建立互補機制,也讓業務溝通更聚焦、更有效率。

領航轉型:戰情室以創新實踐「以人為本」

保險視圖歷經多次迭代上線,雖仍在推廣階段,但初步成效已浮現。以今年 4 月關稅議題為例,資產型保單查詢需求明顯攀升,保戶登入次數從每週平均 4 萬次提升到 5 萬 6 千次,大幅成長40%。以往查詢保單價值需透過業務員協助或臨櫃辦理,如今登入平台即可取得資訊。

國泰人壽
保險視圖一次呈現保戶的整體保險資產,建立更清晰的財務健康圖像。
圖/ 國泰人壽

此外,視覺化呈現保障缺口後,有保戶回饋「看到達成率 70%,就想補到 100%」,顯示視覺化真正促進了主動管理的行為轉換。

數位時代
diLab 戰情室跨商品、設計與數據協作,以使用者為中心反覆驗證,用心設計保險資訊呈現方式。
圖/ 數位時代

能完成一份視覺化介面不難,但能把 60 多年累積的保險商品結構、條款邏輯與資料系統重新整合再轉譯,背後極度仰賴組織文化。尤其,保險視圖的誕生,從構想到落地,專案歷時 4 年,期間國泰以「區塊化堆疊」的方式逐步發展服務功能,包括資產總覽、健康與壽險視圖、缺口試算與 AI 推薦,每一步都需要長時間協作與反覆推敲。

林蔚安形容:「戰情室就像加速器。」其角色是串聯商品、數據、數位、UI與UX設計、開發工程與行銷等多個團隊,以使用者中心作為共通語言,讓跨部門能在同一個目標下推進。「大家的專業不同,但只要目標一致,就能共同前進!」

數位時代
專案歷時多年,團隊成功以敏捷方式快速迭代,實現保險資訊透明化。
圖/ 數位時代

展望未來,透明化只是起點。林蔚安指出,下一步是讓更多保戶願意使用平台,使行為軌跡形成數據基礎,再透過個人化推播與 App 串接,發展國泰人壽保戶更完整的數位體驗。「這條路很難,但值得做。」他分享,有一次泰國人壽數位團隊來台交流,第一眼看到保險視圖就說:「這真的很不容易。」但也因此,更突顯國泰人壽勇於創新、以人為本的服務精神。同時,保險視圖也不會是終點,卻會是打開未來保險模式的一把關鍵鑰匙。國泰人壽以具體行動落實「Better Together 共創更好」,在每一項細節中重塑保險服務的日常價值。

保險視圖:https://cathaylife.tw/VoeoOdb

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓