全由AI生成的電影!畫面不自然、角色表情詭異,但「最大問題」克服了⋯
全由AI生成的電影!畫面不自然、角色表情詭異,但「最大問題」克服了⋯

過往人們認為AI在影視產業的應用可能是協助撰寫劇本、協助動畫電影作圖等等,但未來有可能一切都要改觀了。《冰霜》(The Frost)是一部完全由DALL-E 2創作的12分鐘電影。這部電影由位於底特律的影片創作公司Waymark製作,雖然展示了AI電影製作的潛力,但詭譎的敘事風格和令人不安的能力也同時展現了出來。

完整的12分鐘內容

AI電影如何產出的?公司又是什麼來頭?

《MIT Technology Review》報導,為了製作這部電影,Waymark採用了該公司的執行製片人兼導演魯賓(Josh Rubin)撰寫的劇本,並將其輸入到OpenAI的圖像生成模型DALL-E 2中。經過一些嘗試和調整後,以便讓模型產生符合他們滿意的風格的圖像。製片人使用DALL-E 2生成了每一個鏡頭,接著他們使用了一種名為D-ID的AI工具,可以對靜止圖像加入動態,像是眨眼或是讓嘴唇移動等等。

Waymark是一間廣告起家的公司,將數種不同人工智慧技術結合在一起,提供客製化廣告影片。它們使用了包括大型語言模型、圖像識別技術以及語音合成,旨在即時的生成一段廣告影片。製片人魯賓表示,「我們用DALL-E產出的東西建構了一個世界,雖然目前呈現出看似奇怪的美學,但我們仍然張開雙臂歡迎它」。

獨立電影製作人梅達維(Souki Mehdaoui)表示,「這無疑是我看過的第一部風格一致的生成性人工智慧電影,生成靜態的圖像並用類似魁儡戲的敘事風格,帶來一種有趣的拼貼感。」言下之意即過往AI產製的電影經常會有風格不一致的問題,但這部作品克服了這點。

AI技驚四座,依然有明顯破綻的奇特美學

《MIT Technology Review》指出,這部電影加入了一系列使用生成式AI工具製作的短片,而這些片段在過去幾個月中已經推出過。目前市面上最好的生成式AI模型只能生成幾秒的影片,這部以許多靜止圖像和長度不等的影片結合而成的電影雖然看似有許多破綻,但已經是目前所能呈現的最好畫面。

從這部電影中可以看出許多明顯的不自然處:

  • 男性角色吃東西時不自然的臉部表情
正在吃肉的男性角色
  • 靜態畫面中人物與背景的違和感
靜態畫面中的人物
  • 人物跌下山峰的不自然畫面
從山峰墮入谷底的人
  • 角色手指的明顯破綻
破綻明顯的手指

從影片中可以看到,雖然畫面中的人物大多是靜態的,但因為是在冰河氣候中,人物還是有口吐霧氣的動態感,而在沒有人物或動物的畫面中,畫面也較為自然,可以說人物的細微面部表情是目前的技術限制之一。

生成式AI可能越來越多人採用,業內人士怎麼看?

廣告公司Private Island的客戶囊括百威、Nike、優步(Uber)等跨國企業,而它們這幾年來也一直在製作短影片的後期導入AI工具,例如使用機器學習技術從現有影片中提取動作捕捉數據,而不是土法煉鋼地從頭開始收集。

這家公司在幾個月前發布了一則名為合成之夏(Synthetic Summer)的惡搞啤酒廣告,該廣告使用Runway公司的影片製作模型Gen-2和Stability AI的圖像製作模型Stable Diffusion製作。

Synthetic Summer影片

聯合創辦人波以耳(Chris Boyle)表示生成式AI這項技術是新的境界,更提到「這將改變一切」。

但也有許多公司在意成本方面的考量,雖然生成式AI的技術讓人驚艷,但科技的推出日新月異,許多人擔憂科技變化的太快,不願將資源投入。波以耳提到也有許多人擔心如果使用有版權的影像而遭到法律訴訟的問題。

延伸閱讀:【專欄】ChatGPT能寫劇本、拍電影!它究竟是得力助手還是暗黑殺手?

資料來源:MIT Technology Review
責任編輯:蘇祐萱

往下滑看下一篇文章
從掃地機器人到智慧座艙,凌陽科技C5晶片如何在AI時代掌握邊緣算力主控權?
從掃地機器人到智慧座艙,凌陽科技C5晶片如何在AI時代掌握邊緣算力主控權?

掃地機器人也會說話嗎?或許在不久的將來,它不只會自動導航和避開障礙物,還能經由辨識主動發問:「前面是水漬,要幫您拖乾嗎?」這不再是實驗室裡的遠景研究,而是IC設計大廠凌陽科技即將推出的C5平台晶片技術中,正準備實現的日常智慧場景之一。

創立於1990年的凌陽,從消費性多媒體IC設計起家,逐步拓展至車用數位影音、沉浸式聲學系統單晶片等領域。近年來,凌陽提出「C+P Plus 1」的晶片架構策略—也就是以核心運算晶片(Computing, C Chip)加上外部裝置(Peripherals, P Chip),形成一個策略性整合的應用單元(Plus 1),形成模組化、可客製的系統解決方案。這樣的設計方式,不僅能透過先進製程打造更小、更有效率的小晶片(Chiplet),還能透過與生態系夥伴共研周邊模組,降低創新應用的門檻,加快產品落地速度。

這樣的晶片模組策略,展現出凌陽對市場變化的敏銳洞察,也顯示在 AI浪潮的趨勢下企業的積極轉型。而如今打造C5平台的能力,正是建立在 C3平台的技術累積與經驗之上。

讓機器「看得見」,C3平台打開邊緣AI應用之門

C3平台具備 AI 影像辨識能力,應用於智慧設備場景。
C3平台具備 AI 影像辨識能力,應用於智慧設備場景。
圖/ 數位時代

「C3的任務,是要讓機器能看得見,」凌陽產品總監黃興生如此定義這款SoC晶片的角色。他表示,C3 平台是一款整合AI加速器的影像處理系統單晶片(SoC),具備即時辨識功能,能運行CNN(卷積神經網路,Convolutional Neural Network)等深度學習模型,適用於智慧相機、掃地機器人、安防設備等場景。透過感測與辨識畫面中物體、人臉、動作等關鍵資訊,C3讓終端設備不只是可以看見,還能提升裝置主動判斷能力還具備判斷的能力,像是避障、偵測跌倒等功能。

凌陽當初推動C3平台的關鍵決策,來自對邊緣AI發展趨勢的深刻洞察:AI技術正從單純的資料擷取,邁向即時決策的全新階段。與其將大量影像資料傳回雲端進行處理,凌陽選擇在裝置邊緣端直接完成分析,不僅大幅提升反應速度,也確保資料安全性與隱私。

這項技術路線不僅展現凌陽在AI應用上的前瞻佈局,更幫助品牌客戶打造具備差異化的智慧產品,為其搶占市場先機。C3平台目前已廣泛應用於IoT、長照與消費性電子等領域,讓凌陽在相關市場搶得先機。

然而,隨著語音助理與生成式AI技術的迅速崛起,凌陽也意識到僅具備影像辨識與判斷能力的C3,已難以滿足未來市場對「互動性」與「理解力」的高度期待。下一代晶片勢必得導入語言理解與生成能力,才能真正滿足客戶對於AI在各場景應用的想像。

早在2023年中、全球掀起ChatGPT與大模型熱潮之前,凌陽就已開始密切關注生成式AI的應用趨勢。當時,凌陽團隊在分析C3平台的市場反饋時,發現儘管機器已能「看懂」影像,卻仍無法「聽懂」語言、更無法「理解」使用者的真實意圖,導致智慧裝置的互動體驗始終停留在被動回應的階段。

用C5迎戰AI互動時代,從晶片到平台加速少量多樣的AI應用

「下一代AI晶片,不該只是影像辨識的機器視覺工具,而應該是一個能『理解場景、理解語意』的互動平台,」黃興生回憶道。正是在這樣的思維驅動下,C5平台的構想逐步成形。

但這項轉型也意味著凌陽必須面對前所未有的技術挑戰。為了支援大型生成式模型運算,晶片所需的記憶體頻寬從過去的10GB/s躍升至100GB/s以上,晶片面積、功耗與資料搬運效率都成為設計瓶頸。開發C5所需的資源與技術複雜度,遠超以往,這已不再是單靠企業內部團隊即可獨力完成的任務。

因此,凌陽科技決定參與由經濟部產業發展署推動的「驅動國內IC設計業者先進發展補助計畫」(簡稱「晶創IC補助計畫」),藉由政府資源挹注,加速推動C5晶片架構的研發、IP整合及場域驗證工作。在本計畫的支持下,凌陽成功建構完整的SDK(軟體開發工具包)工具鏈、模組化平台與開源開發架構,同時擴編軟體開發團隊。「與其說C5是一顆AI晶片,更貼切地說,它是一個完整的開發平台。」黃興生表示。

面對AI應用「少量多樣、快速導入」的市場特性,C5從一開始就被定義為模組化、可擴充的開發平台。凌陽同步提供韌體、SDK、開發板與可視化工具鏈,並開放原始碼,協助不同領域的業者依場景快速部署。比起 C3強調即時影像辨識的單點功能,C5進一步整合語音輸入、自然語言處理(NLP)與大型視覺語意模型(VLM),具備情境推論與語音互動的能力——讓機器從「能感知」真正走向「能理解」。

舉例來說,在C3的掃地機器人應用中,晶片可辨識障礙物與髒汙物並繞開它們;但在C5平台上,同樣的機器人不僅能看到,也能主動提醒使用者:「前方髒汙,是否需要啟動拖地模式?」或依據內建情境判斷,自主決策是否清理,並提供語音互動回饋。而在長照場域中,則能透過語音確認長者意識狀況,例如在偵測跌倒後主動詢問:「您還好嗎?需要我幫忙聯繫照護人員嗎?」

凌陽產品總監黃興生展示C3平台,奠定了推動 AI 視覺晶片C5平台的基礎。
凌陽產品總監黃興生展示C3平台,奠定了推動 AI 視覺晶片C5平台的基礎。
圖/ 數位時代

目前C5已完成初步晶片架構設計,預計將於2026年第二季投片,並於2027年進入應用導入階段。凌陽同步規劃將C5平台推廣至智慧座艙與工業機器人等領域,結合車內語音控制、駕駛監控與乘客情緒辨識等功能,打造真正具備語音理解與空間感知能力的智慧終端。「AI晶片的競爭力,不再只在於速度與功耗,而在於能否真正理解使用者與環境。」黃興生強調。 C5 不只是凌陽邁向 AI 世代的關鍵一步,更代表台灣 IC 設計產業朝整合平台與價值鏈重塑的重要實踐。。當晶片能讓終端設備具備說話、回應與推論的能力時,象徵的將不再只是技術進化,更是人機關係的重新定義。

|企業小檔案|
● 企業名稱:凌陽科技
● 董事長:黃洲杰
● 核心技術:車用智能座艙系統、先進駕駛輔助系統、無線音頻系統、家用影音娛樂系統與Edge AIoT小晶片等產品之研發。
● 資本額:新台幣59億8000萬元
● 員工數:320人

|驅動國內IC設計業者先進發展補助計畫簡介|
在行政院「晶片驅動臺灣產業創新方案」政策架構下,經濟部產業發展署透過推動「驅動國內IC設計業者先進發展補助計畫」,以實質政策補助,引導業者往AI、高效能運算、車用或新興應用等高值化領域之「16奈米以下先進製程」或「具國際高度信任之優勢、特殊領域」布局,以避開中國大陸在成熟製程之低價競爭,並提升我國IC設計產業價值與國際競爭力。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓