李飛飛:我們如何教電腦看懂圖像
李飛飛:我們如何教電腦看懂圖像
2017.08.03 | 人物

我們的終極目標就是教導機器能夠像人一樣理解所見之物,像是識別物品、辨認人臉、推論物體的幾何形態,進而理解其中的關聯、情緒、動作及意圖。

要電腦達成這個目標的第一步,就是教導電腦如何辨別物品,這是視覺的基石。簡單來說,我們教導的方法是給電腦看一些特定物體的影像,以貓咪為例,貓咪由一些幾何圖形和顏色所組成的,我們用數學語言告知電腦演算方法,貓就是有圓圓的臉、胖胖的身體、兩個尖尖的耳朵和一條長尾巴。那困難點在哪裡?但如果貓咪造型改變,全身都捲起來了,這下子我們就要在原來的模型加上新的形狀和不同的視野角度,又如果貓咪是躲著的呢?我們發現,即使簡單如貓這樣的家庭寵物,也會有相對於原型以外、數也數不清的其他形態表徵, 而這只是其中一樣。

不過,就在八年前,一項簡單而深刻的觀察,改變了我的想法,我發現沒有人教導孩童如何去「看」世界,特別是在孩童早期發育階段,孩童是直接從真實世界的經驗中學習,到三歲左右的年紀時,孩子們已經看過了真實世界中數以百萬計的照片,這樣的訓練範例是很大量的,因此直覺告訴我應以孩童學習經驗法則,兼以質與量,提供訓練的資料給電腦,而非一味追求更好的程式演算。

有了上述的洞見,我們必須要蒐集大量資料群,於是我與普林斯頓大學的李凱教授共同於2007年開始ImageNet專案。2009年起,ImageNet已經是個擁有涵蓋了2萬2千種不同類別,多達150億幅圖像的資料庫,這樣的規模,不論是「質」或「量」都是史無前例的。有了這些資料,我們可以教育我們的電腦,結果我們發現:ImageNet所提供的豐富資訊恰巧與機器學習演算的其中一門特定領域不謀而合,我們稱它為「卷積神經網絡」(Convolutional Neural Network,CNN)──在七零及八零年代,辛頓(Geoff Hinton)和勒丘恩(Yann LeCun)等學者為該領域的先驅。

卷積神經網絡就在眾人的意料外開花結果了。在一般的神經網絡中,我們用作訓練的物品辨識模型就有2千400萬個節點、1億4千萬個參數,以及150億個連結。正如同人類的大腦是由無數個緊密連結的神經元所組成,而神經網絡的基本運作單位是一個類神經元的節點。ImageNet的運作方式是從別的節點得到資料,然後再傳給其他的節點,這些數不清的節點擁有層層的組織架構,就好像我們的大腦一樣。現在,電腦不僅能告訴我們圖中有隻貓,還能告訴我們貓在哪裡。

Google雲端人工智慧暨機器學習首席科學家李飛飛
視覺始於眼睛,但真正使它有用的,卻是大腦。

有時候,如果電腦不確定自己所見到的東西時, 我們已經將它教到可以聰明地給一個安全的答案,而非莽撞地回答,就像一般人能做到的那樣。更有些時候,電腦的運算竟能夠精準地辨別物體品項,例如製造商、型號、車子的年份。舉例來說,Google將這個演算程式廣泛地運用在數百個美國城市的街景裡,也因此我們從中得到了一些有趣的概念。首先,它證實了一項廣為人知的說法,也就是汽車價格和家庭收入是息息相關的。然而令人驚訝的是,汽車價格也和城市中的犯罪率以及區域選舉模式,有一定程度的關係。

那電腦已經趕上、甚至超越人類了嗎?還早得很呢!到目前為止,我們只是教導電腦辨識物品,就像小孩子牙牙學語一樣,雖然這是個傲人的進展,但它不過是第一步而已,很快地,下一波具指標性的後浪就會打上來,小孩子開始進展到用句子來溝通。因此,他已經不會用「這是貓」來描述圖片,而是會聽到這個小孩說:「這是躺在床上的貓。」

因此,要教導電腦看到圖並說出句子, 必須進一步地仰賴龐大資料群以及機器的學習演算。現在,電腦不僅要學習圖片辨識,還要學習人類自然的說話方式,就如同大腦要結合視覺和語言一樣,我們做出了一個模型,它可以連結不同的可視物體,就像視覺片段一樣,並附上句子用的字詞和片語。約四個月前,我們終於把所有的元素全部兜起來了,做出了第一個電腦版的模型,它可以在初次看到照片時說出像人類般自然的句子。

這是第一次人類的眼睛不是唯一可以用來思考和探索世界的工具,我們不僅可以利用機器的智能,更可以運用更多你想像不到的方式攜手合作。這也是我想追求的目標,給予機器智慧之眼, 為整個世界創造更美好的未來。

李飛飛

出生|1976年
學歷|加州理工大學電機工程博士
經歷|史丹佛人工智慧實驗室主任、史丹佛視覺實驗室主任、豐田-史丹佛人工智慧研究中心負責人
現職|Google雲端人工智慧暨機器學習首席科學家

整理.撰文/翁書婷;文章整理自TED

關鍵字: #Google #機器學習
往下滑看下一篇文章
TWNIC歡慶25周年加碼挺新創 ,52168免費域名方案!從創業第一天開始就打造新創數位競爭力、強化數位資產
TWNIC歡慶25周年加碼挺新創 ,52168免費域名方案!從創業第一天開始就打造新創數位競爭力、強化數位資產

每年在台灣約有超過8萬家新設公司商號的誕生,然而根據台灣網路資訊中心(TWNIC)內部統計數據顯示,真正完成網站架設、踏上數位轉型起點的新設立公司卻不到一成。這意味著絕大多數的新創團隊或微型企業,雖然正式登記成立,卻仍缺乏最基本的「數位門牌」,也就是企業的專屬域名名稱。

TWNIC 執行長余若凡指出,這看似是台灣新創團隊在數位轉型上的一個缺口,實際上卻是關鍵成長與強化自身數位資產的關鍵。「域名其實是數位轉型的起點,如果沒有自己的域名,基本上就還沒真正開始。」她強調,數位轉型已經不只是上雲端或導入 IT 設備,更進一步的是「建立數位信任」;但眼下許多新創連第一步都還沒跨出。

三大現實痛點突顯,域名是新創跨出數位轉型第一步的關鍵

余若凡觀察,許多新創公司之所以未能及早佈局域名與數位資產,主要來自三個現實因素。首先是資金有限。對於初創立的新創團隊來說,創業初期事務繁雜、資金有限,許多團隊會優先把錢投入營運,對域名或網站架設常抱持「之後再說」的心態。其次,則是缺乏整體數位策略的構想。余若凡表示,許多新設企業或新創團隊少有在成立之初就規劃品牌的數位溝通路徑,更遑論導入數位品牌策略。

最後是對「數位信任」的認知不足。余若凡提到,許多企業直到品牌被仿冒、消費者受詐騙波及時,才意識到域名的重要性。「你等到有名氣後再來搶域名就太晚了。」她特別提醒。一旦品牌名稱被他人搶先註冊,甚至被詐騙集團利用,損失往往難以挽回。

而看在余若凡的眼裏,域名對於新創企業其實有三重意義。第一,它是企業的「數位門牌」。清楚、好記的域名能讓消費者快速找到企業,也代表著品牌在網路上的官方身分。第二,它是品牌行銷的起點。她指出,你必須要有自己的家,然後再去連結各種社群平台與通路。擁有域名,可以將社群經營、搜尋流量與品牌曝光整合在一起,累積成企業的長期數位資產。第三,它也是防禦性的工具。許多企業認為「不架網站就不需要域名」,但實際上,單純註冊域名就能防止他人搶註或利用相似網址詐騙,成本只要幾百元,卻能省下未來更多麻煩。

台灣網路資訊中心 余若凡執行長
圖/ 數位時代

從「免費申請」到「快速架站」,52168為新創打造快速數位起步

為協助更多新創企業補上這一塊關鍵拼圖,TWNIC 為歡慶25周年,今年特別規劃「52168 Go! 免費域名註冊方案」,更首度針對自112年起的新設公司與商號,加碼免費提供含「com.tw 或 .tw」及「.台灣」等兩筆域名的註冊。這不僅讓新設公司能以0元自選擁有自己的域名,及低成本建置國際品牌識別,中文域名更能讓以在地化為優先的新設公司、新創團隊或是擁有創意諧音名稱的店家,直接使用最具代表性的中文作為數位門牌。

「我們希望透過免費的方式,讓企業更容易跨出第一步,養成擁有自己數位門牌的習慣,無論是用來建品牌、做轉址,或先作為防禦性註冊,都可以開始累積數位資產。」余若凡表示。今年TWNIC方案不僅延長了申請對象的年限,也在免費之餘特別簡化申請流程,讓新創團隊輕鬆完成。余若凡說,企業只要備妥公司或商號設立證明,線上填寫資料、選好想要的域名並上傳文件,最快一個工作天內即可生效。

「我們希望讓這件事情的流程簡化到創業家們用幾分鐘就能完成申請,」余若凡笑說。不僅如此,TWNIC 也希望讓這項服務的效益極大化,不只是積極推動域名的申請,更同步規劃了後續的配套措施。申請完成後,企業可以透過「轉址教學」將域名直接連結至現有的社群媒體等平台,不需額外調整營運模式,就能立即擁有屬於自己的專屬門牌;同時,TWNIC也提供大型雲服務供應商的免費空間作為範例,提供清楚的「架站」教學,協助企業快速打造基本網站。這樣的設計,讓資源有限的新創企業不僅能輕鬆取得域名,還能在最短時間內建立屬於自己的數位家園,為品牌發展打下穩固基礎。

從「數位門牌」出發,為新創奠下品牌與信任的起跑線

對於許多初創企業而言,品牌的第一張名片,可能不是實體名片,而是域名名稱。余若凡強調,數位轉型的時代已經不是「要不要做」的問題,而是「非做不可」的基本條件。

「我們希望 52168 能成為新創的堅強後盾,從最簡單、最基本的地方,幫助他們在數位化的道路上打好地基。當企業開始累積數位資產,品牌信任也會逐步建立,整體產業生態才能變得更安全、更有韌性。」余若凡說。透過52168方案,TWNIC 不僅提供免費資源,更試圖翻轉企業對「數位門牌」的認知。對於正處於創業起跑線上的新創來說,這或許是一個最簡單,也最值得立即行動的關鍵步驟。

請上「52168 Go! 新設立公司/商號免費域名註冊」活動網站 https://52168.tw/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓