AI換臉的偽造影片到處流竄,識別造假的軍備競賽開打
AI換臉的偽造影片到處流竄,識別造假的軍備競賽開打

Deepfake自問世以來,一路向著人性陰暗面奔去。

民間技術流已經對AI換臉教程玩得不亦樂乎。但每個人也更容易成為受害者:偽造綁架影片勒索詐騙,不雅影片毀壞名譽,或者恐怖影片製造混亂,都因為Deepfake的開源技術變得空前容易。

Deepfake2
讓一眾名人換上美國前總統布希的面部動作圖TED
圖/ 品玩

在Photoshop摧毀了大眾對圖片的信任後,Deepfake正在摧毀大眾對影片的信任。沒人想在網路上看到自己的面孔說著自己沒說過的話。許多針對個人的傷害,也因為影響不夠巨大而投訴無門。

美國正在組成一支Deepfake打假隊伍,不僅是各大實驗室、研究中心在尋找Deepfake的破綻,一股創業潮流也正在興起。

但這是一場造假AI與鑑假AI之間「你有張良計,我有過牆梯」的競賽。每一篇檢測Deepfake的論文,彷彿都能提示造假技術修補自身漏洞,從而更上一層樓。

關上Deepfake的潘朵拉魔盒,他們能做到嗎?

用打假Deepfake創業

西瓦.金塔利(Shiva Kintali)離開擔任講師4年的普林斯頓資工系,正在矽谷創業鑑別偽造影片。他的合作對像有警察、記者、保險公司等,透過機器學習尋找偽造影片的破綻,用區塊鏈記錄信息等技術來輔助鑑別。

金塔利的網站已經可以上傳圖像、音樂、影片,來分析檢測是否有修改痕跡。他同時在開發一個手機相機應用程式,用人工智慧為圖像添加時間、地點、浮水印,並將圖片原始信息印在區塊鏈上。一旦傳播圖像的信息與原始圖片不符,就容易判斷真偽。

這些產品希望幫助記者、媒體公司、政治競選團體、執法機構(例如:FBI、NSA),保險公司(面臨虛假事故照片的保險索賠問題)和大公司(例如:Facebook、Twitter、Redditt、Pornhub),在其平台上阻止虛假的影片、音樂、照片傳播。

由於Deepfake降低了影片造假的門檻。面對真偽難辨的影像資料,記者不知道能否發布,保險公司不知是應該理賠還是報警詐騙,警察收集證據後,也需要專業工具去鑑定圖片和影片的真偽。

目前流傳的假影片大多是「淺度造假」,但因為數量多,造成了無數困擾。史丹佛的研究人員向鑑別公司了解到困擾他們的三大問題:數量太多,可用鑑別時間太短,缺乏標準化的工具。

因此,研究者們在尋找能夠大規模應用的打假方法。Facebook、Twitter等社交網絡上爆炸式傳播的圖片和影像,給闢謠留下的時間窗口越來越短。普通大眾也不可能僱傭專業人士進行鑑別。

搶先商用化的圖像驗證平台Truepic已經上線了一款智慧相機應用。用戶拍下的圖像將上傳至服務器,在創建時對照片和影片進行身份驗證,獲得唯一編碼。相機應用捕獲設備的感測器數據,在傳輸之前加密照片或影片,運行20多個圖像取證測試,並在幾秒鐘內,將圖像的加密簽名印在公共區塊鏈上,使得信息不可被篡改。

這是一種「自證清白」的方式,適用於電子商務平台和公民記者類用戶。如果用戶將圖片發送給接收者,Truepic允許收件人驗證圖像的原點和元資料的完整性。任何二次傳播的多媒體材料,都可以與區塊鏈上的原始信息對比,辨別真假。

在Deepfake的威脅下,鑑定圖片、影片的真實性,都成了相機應用的賣點。但這類以營利為目的的產品又引起了用戶新的隱私擔憂。畢竟,誰能確保Truepic不作惡呢?

演算法打演算法

位於矽谷的史丹佛實驗研究院(SRI International)的AI中心則「以毒攻毒」,用偽造的影片訓練演算法,讓演算能夠更好識別出偽造痕跡。在人們上傳影片到社交網站的時候,平台需要對影片重新編碼。這是一個檢測虛假影片的好時機。

但隨著Deepfake的漏洞日漸優化,用演算法打演算法的難度也日益加大。

打假AI原本就是訓練造假AI的一部分,二者剛好在生成對抗性網路的兩端。一個生成器,一個鑑別器,道高一尺,魔高一丈。

由於Deepfake的技術在於篡改數據,那麼鑑別方則在尋找一切篡改數據的痕跡。一種方法是基於像素的影片檢測,影片其實是成千上萬幀圖片連放,細緻到檢測每個像素的改變痕跡,是一件頗為浩大工程。

此外,偽造的面部表情目前仍有缺陷。偽造的臉部表情往往與其他部分存在不一致,電腦演算可以檢測圖片或影片中的這種不一致。

Deepfake#
加州大學柏克萊分校的研究者比較真假人物的面部差異
圖/ 品玩

舉例而言,初代Deepfake影片中的人物,眨眼的方式都有點奇怪。

紐約州立大學奧爾巴尼分校電腦科學系副教授呂思偉曾撰文表示,成年人的眨眼間隔為2秒到10秒,一次眨眼需要十分之一到十分之四秒。這是正常影片人物應有的眨眼頻率,但很多Deepfake影片的人物沒能做到這一點。

彼時由於缺乏閉眼圖像數據,算法的訓練並不完美,影片人物面孔總有一種「哪裡不對」的不和諧感。

然而,通過閉眼的面部圖像、或使用影片序列進行訓練,可以改善眨眼間隔。虛假影片的質量總會提高,而研究人員需要繼續尋找檢測它們漏洞的方法。

南加大的研究者威爾.阿布達-阿爾瑪基德(Wael Abd-Almageed)表示,社群網路可以使用算法來大規模識別Deepfake。為了實現這一過程的自動化,研究人員首先建立了一個神經網絡,「學習」人類在說話時如何移動的重要特徵。然後,研究人員使用這些參數將偽造影片的堆疊幀輸入AI模型,以檢測隨時間的不一致性。

普渡大學的研究人員也採用了類似的方法,他們認為,隨著訓練模型的Deepfake影片數據量越來越大,模型也會更加精確,更容易檢測出偽造的影片。

美國2020年大選在即,如何阻止Deepfake從低俗娛樂發展到操縱民意,是研究者們最迫切的動力之一。但願一鍵打假的速度,能追上一鍵換臉的速度。

責任編輯:江可萱

本文授權轉載自:PingWest

往下滑看下一篇文章
從影像晶片到AI感知平臺:芯鼎科技以ThetaEye開啟智慧視覺新篇章,搶攻車用與智慧場域
從影像晶片到AI感知平臺:芯鼎科技以ThetaEye開啟智慧視覺新篇章,搶攻車用與智慧場域

2009年,芯鼎科技自凌陽科技影像部門獨立(spin-off)而出。當時,數位相機市場正值鼎盛,而芯鼎科技憑藉其深厚的影像訊號處理器(Image Signal Processor, ISP)與影像處理核心技術,迅速在市場上嶄露頭角,不僅長期是日系大廠的合作夥伴,更是日本數位相機品牌的核心供應鏈夥伴。「當時,我們的技術在數位相機領域可說是首屈一指,特別是在處理高像素影像方面。」 芯鼎科技總經理許英偉驕傲地說。

然而,科技浪潮從不等人。隨著2014年後智慧型手機的普及,對數位相機市場造成衝擊,成為半導體業界口中的「典範轉移」經典案例。許英偉回憶道,當時市場營收掉得非常快,我們真切感受到那股壓力,甚至可以說是瀕臨滅頂的邊緣。也正是這股壓力,促使芯鼎科技痛定思痛,開始自問:「在相機領域累積了核心技術後,究竟芯鼎科技還能做些什麼?」

數位相機市場退潮,芯鼎科技尋找新戰場

面對市場重大的典範轉移,芯鼎科技並沒有選擇固守在原本逐漸式微的數位相機領域,而是把多年累積的影像技術,帶往更高門檻、也更具發展潛力的新市場。當時,他們看見了全新的機會點:車用影像。「當時網路攝影機(IP Camera)市場競爭太激烈,尤其大陸廠商進入速度非常快,我們反而選擇挑戰門檻更高的車用市場,特別是前裝市場(Factory-installed products)[註一]。」許英偉回憶說到。

不同於家用相機多數時間是閒置的,車用影像系統一旦啟動就必須在高溫、長時間運作與劇烈震動等極端環境下持續穩定運作。而且,車用市場不只要看得清楚,更關乎安全與責任。這讓芯鼎科技意識到,單純依賴過去的影像演算法已不足以應對市場需求,必須深入系統整合與跨領域的技術布局。

在這段轉型的過程中,芯鼎科技的核心能力不再只是單純的ISP晶片,而是逐步擴展到整合多顆影像感測器、進行車用級系統設計,並在高階影像分析領域累積了能量。他們的產品已成功導入包括歐洲多家車廠在內的車用影像系統,例如電子後照鏡,以及先進駕駛輔助系統(Advanced Driver Assistance Systems, ADAS)的智慧影像分析等高階應用;同時,芯鼎科技也把觸角延伸到室外高階監控市場,投入AI節能感測裝置的開發與工業應用領域,像是機器視覺與工廠自動化等初步探索。

芯鼎科技建置專業測試場域,以確保 AI 視覺方案符合需求。
芯鼎科技建置專業測試場域,以確保 AI 視覺方案符合需求。
圖/ 數位時代

然而,隨著車用電子與各行各業對智慧化的需求日益升高,市場開始對晶片提出全新的挑戰,「比如說,如果前方突然衝出行人,晶片必須在千分之一秒內做出反應,這種功能需求已經超越傳統影像處理的範圍,而屬於AI感知與判斷的範疇。」許英偉說,晶片要看得清楚、更要看懂環境。除了車載應用,團隊也看到智慧監控、機器視覺、無人機等多個場域都開始需要相同技術,而22奈米或28奈米等成熟製程的晶片已無法同時兼顧運算效能、功耗以及多感測融合的複雜需求,因此,芯鼎科技開始醞釀打造全新的 ThetaEye AI Solution SoC平臺,聚焦於 AI 視覺系統單晶片(System on a Chip, SoC)的特殊應用晶片(Application Specific Integrated Circuit, ASIC)設計服務,同步導入 6 奈米先進製程技術。不過,從成熟製程跨入先進製程,再加上小晶片(Chiplet)架構、功能安全與資安防護等多重需求,對一家IC設計公司而言,其實是極大的挑戰。

邁向AI視覺 SoC新世代,迎戰高算力與多感測融合挑戰

適逢國科會協調經濟部及各相關部會共同合作,提出「晶片驅動臺灣產業創新方案」。在此框架指引下,經濟部產業發展署積極推動「驅動國內IC設計業者先進發展補助計畫」(以下簡稱晶創IC補助計畫)。芯鼎科技看見了一道可能突破現狀的契機。「如果沒有外部資源的支持,要公司投入到先進製程以及全新的平臺開發,風險實在太高。」許英偉坦言。於是,在「晶創IC補助計畫」的支持下,一個從影像領域累積多年技術的團隊,正式踏上AI視覺系統SoC新世代的道路,也為打造 ThetaEye 平臺奠定了重要基礎。

芯鼎科技核心經營與技術團隊合影,藉由晶創IC補助計畫攜手推動從影像 ISP 晶片到 AI 視覺 So
芯鼎科技核心經營與技術團隊合影,藉由晶創IC補助計畫攜手推動從影像 ISP 晶片到 AI 視覺 SoC 的跨域轉型,積極布局智慧車用、機器視覺及工業應用市場。
圖/ 數位時代

決定跨足AI視覺 SoC之後,芯鼎科技最先碰到的,就是先進製程的巨大門檻。「從相機領域的ISP晶片,要進化到AI視覺SoC,算力需求已經高出過往幾十倍,而這又帶來功耗、散熱與成本的挑戰。」許英偉說。為此,芯鼎科技著手打造 ThetaEye AI Solution SoC 平臺,與過去的單晶片解決方案不同,新平臺導入先進的6奈米製程,讓晶片在相同面積下能容納更多AI運算單元,同時降低功耗。「多鏡頭、熱感、紅外線感測的需求愈來愈多,傳統製程做不來,尤其車子未來要做到360度全方位視覺感知,需要非常高的算力。」許英偉指出。更關鍵的是,芯鼎科技在 ThetaEye AI 平臺上導入小晶片設計,它能像積木一樣靈活拼接不同功能的晶粒,實現模組化、可客製的設計思維。這對 IC 設計公司意義重大,許英偉表示,若客戶只需要影像融合,可以只選擇相對應的模組;若需要 AI 推論或進階安全防護,也能彈性加進來,無須重頭打造整顆晶片。

除了硬體設計,芯鼎科技也同步把功能安全(支援ASIL-B安全等級)與資安架構,納入ThetaEye AI 平臺的設計考量,滿足車用產業對安全性與可靠性的高標準。「我們不只是做一顆晶片,而是希望打造一個可以快速導入不同市場的感知平臺。」許英偉強調。這樣的平臺化策略,不僅能讓芯鼎科技在車用市場、無人機、機器視覺、工業自動化等不同領域間快速複製技術成果,大幅縮短客戶導入時間,更是未來企業的競爭利基,也有助臺灣半導體產業在AI浪潮中掌握更多話語權。

回首這條轉型路,芯鼎科技從過去熟悉的靜態影像,踏入需即時判斷與決策的AI視覺新戰場,應用場景也更多元,期許讓臺灣成為AI感知晶片的關鍵力量,「我們相信,未來不只是車子,而是任何需要眼睛與大腦的智慧裝置,都將是我們的舞臺。」許英偉有信心的說。

|企業小檔案|
- 企業名稱:芯鼎科技
- 創辦人:羅森洲
- 核心技術:影像處理晶片IC設計
- 資本額:新臺幣9億509萬元

|驅動國內IC設計業者先進發展補助計畫簡介|
由國科會協調經濟部及相關部會共同合作,所提出「晶片驅動臺灣產業創新方案」,目標在於藉由半導體與生成式AI的結合,帶動各行各業的創新應用,並強化臺灣半導體產業的全球競爭力與韌性。在此政策框架下,經濟部產業發展署執行「驅動國內IC設計業者先進發展補助計畫」,以實質政策補助,於113年鼓勵國內業者往 AI、高效能運算、車用或新興應用等高值化領域之「16奈米以下先進製程」或「具國際高度信任之優勢、特殊領域」布局,以避開中國大陸在成熟製程的低價競爭,並提升我國IC設計產業價值與國際競爭力。

【註一】
前裝市場 (factory-installed products):在汽車製造過程中,由原始設備製造商(OEM)所預先安裝或整合的零組件、軟體或設備。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓