《暮光之城》女主角共同發表了一篇AI論文?專家:充其量只能算一篇部落格
《暮光之城》女主角共同發表了一篇AI論文?專家:充其量只能算一篇部落格
2017.01.22 | 人物

1月20日,國外多家媒體報導,暮光之城女主角Kristen Stewart發表了一篇關於圖像風格遷移的人工智慧論文,引起業內廣泛討論。不少人感歎,人工智慧領域將迎來一位高顏值研究者。不過,最近Quora上的討論卻不那麼激動,眾多業內人士紛紛指出,Kristen Stewart的研究根本算不上是一篇人工智慧論文,充其量只能算一篇部落格文章,並且毫無價值,完全沒有新意。

幾天前,人工智慧研究界忽然掀起一陣喧嘩——ArXiv上出現了一篇電影《暮光之城》的女主角Kristen Stewart署名的學術論文,內容有關使用神經網路進行圖像風格遷移的技術,並以電影《Come Swin》為案例進行研究。

國外許多媒體紛紛跟進報導,其中包括Quartz就使用了《Kristen Stewart (對,就是眾所周知的 Kristen Stewart )剛剛發表了一篇人工智慧論文》的大標題。

近日,Quora上,一些機器學習業內人士對這一話題展開了討論,他們基本的觀點是:Kristen Stewart署名的文章根本算不上是一篇「人工智慧論文」,最多只是一篇部落格文章,從內容上來說,與Prisma此前的研究論文有很大的相似性,基本是重複工作。

隨著人工智慧越來越熱門,似乎任何事情都可以跟人工智慧沾邊,Kristen Stewart的真實意圖是什麼現在不得而知,但是媒體上動輒「AI+」的大標題,確實有誤導之嫌。

我們先來看一下論文的主要內容:

Neural Style Transfer是最近開發出來的一種令人矚目的技術,利用神經網路將一幅圖像重新描繪為原圖像的藝術風格。這篇論文探討了在電影製作中使用這種技術的過程,利用Neural Style Transfer將影片《Come Swin》中的關鍵場景轉換為印象主義風格繪畫,《Come Swim》這部影片也正是受了印象主義風格的啟發。我們記錄下了如何在逐次反覆運算的創作過程框架中使用這種技術使畫面呈現理想的結果,並提出了一種將廣闊的參數空間映射到一組關鍵創意控制元素(control)的方法。我們希望這種映射方法能為以後的研究提供參考。

可以用論文中的一張圖來看懂作者的研究意圖:

輸入左邊的圖片+系統記憶體儲的照片風格(中),得到最右邊風格變換後的照片。這就是神經網路圖片風格遷移。

論文:

論文網址,全部共三頁。

1. 把Kristen Stewart去掉,機器學習界不會有人看這篇論文超過兩次

俄羅斯斯科爾科沃理工學院資訊工程與資料專業碩士, Facebook AI研究室2016年實習生Roman Trusov說:

「他們幾乎從來沒有想過這個問題。這不是一份研究論文,並且也不算關於人工智慧的。報導的題目唯一正確的部分是『Kristen Stewart』。這,就是我的看法。」

他們做了什麼:他們下載了一個經過預訓練的、可用的架構,將自己的圖像在這一框架上運行,不需要訓練任何東西。難點在於找到一個足夠輕量(lightweight)的解決方案(vgg16 vs vgg19),並且設置降噪的常規。

如果你把文章中的「Kristen Stewart」名字去掉,機器學習界不會有人看這篇論文超過兩次,這麼說你應該能理解其中的科學含量有多少了。

除此之外,這一文章也是一個減少Erdős–Bacon數量的嘗試。顯然,這是實實在在的。另外,也許這會鼓勵更多的女性選擇電腦科學。

2. 一篇使用了人工智慧的應用型論文

機器學習研究者,Quora工程主管Xavier Amatriain說:

這裡可能有兩個不同的問題需要回答:1)我們怎麼評價這篇論文?2)我們怎麼評價這篇論文引起的報導?

我首先回答第二個問題,因為我認為這是(潛在)問題的根本所在。現在,大多數事情都圍繞著AI,所以肯定會有一些過熱效應。我也理解,對於一篇嘗試把AI和一位好萊塢女星聯繫在一起的論文,公眾的整體反應會是什麼樣的。老實說來,我發現Quartz(一家新聞媒體)的方式既有好處也有害處。我必須承認,我在Twitter和Facebook上分享了這篇論文。

首先需要說明的是,Quartz使用的詞是released (發佈)而不是publish(發表)。這很好。他們也在文章後解釋了,在ArXiv上發表一篇paper並不意味著已經通過同行評議或者被任何的研究社群接收。人們應該記住,ArXiv會審核提交的論文,但是他們並不會對網站上論文的品質負責。換句話說,提交一份草稿或者一個課程作業也是可以的。目前,在這篇論文被其他任何社群接收之前,強調這一背景是很有必要的。

第二,正如其他人所指出的那樣,和新聞報導標題報導的不一樣,這並不是一篇關於AI的研究論文。這是一篇使用了人工智慧的應用型論文。二者是完全不同的。當然,這也不意味著文章本身是一篇很爛的研究論文,但是它需要基於不同的標準進行評估,因為顯然論文並沒有給AI/ML(機器學習)社群帶來任何新東西。基於以上幾點,AI研究者們的評論都沒有真正地抓住重點。

在這件事上,我覺得自己是有資格進行評論的。雖然我自己做的研究是關於機器學習的,但是我的大部分作品實際上都是應用型的論文,涉及的領域包括推薦系統和多媒體系統。事實上,我也曾與藝術家一起合作論文,其中的一些論文已經發表在國際會議和期刊上。

所以,記住了這一點後,我來回答另一個問題:我對論文本身的評價如何?

不幸的是,論文沒有給我留下什麼印象。作為一篇藝術應用AI論文,它的價值非常有限。論文本身有很多問題,導致其很難被大多數的會議接收:

  1. 這一應用總結的經驗實際上很難推廣,甚至連希望實現的目標都不能滿足。
  2. 其採用的思路和方法比較有限。
  3. 引用不夠。特別是,作為一篇應用型的論文,僅僅引用最近的AI/ML(機器學習)論文是不夠的。作者應該引用其他藝術家用AI進行創作的研究。

也就是說,我認為論文可能足夠提交到一個poster或者workshop上。考慮到其形式和長度,我認為這也許是作者的本意。

最後,我回答一下,Kristen Stewart該不該成為論文的作者的問題。我的觀點非常清晰:Kristen肯定應該成為作者之一。再次強調,這是一篇應用性論文(或者說,是一篇藝術創造論文)。藝術家或者創作者本身的角色應該和AI研究者的作用一樣重要,或者更加重要。事實上,我想透露的秘密是,與一些博士論文中的署名導師或教授比起來,Kristen在這篇論文中所做的貢獻肯定要多得多。

3. 只是對Prisma技術原理的擴展

新加坡-MIT研究與技術聯盟實習研究員,Shashwat Verma說:

聽說過Prisma嗎?這個APP能根據源照片的風格重新繪製你上傳的照片風格。關於這一APP的最初論文:連結作者 Gatys等人。

如果你還不知道Prisma,可以看下面的例子:

這是使用卷積神經網路來完成的。我上面提到的論文使用了深度學習來進行藝術創造而不僅僅是識別貓。這是一篇很好的論文。你可以重新驗證其結果。

Kristen Stewart的論文(可能?)擴展了Gatys等人的工作。

首先需要指出,Kristen Stewart等人的論文並不是一篇真正的AI論文。可能,他們自己也並沒有打算稱其為一篇AI論文。讓我們分析下這一點和這篇AI論文中唯一的數學等式。

試驗風格轉移比率後,我們得出結論,要進行有意義的創造性探索,它需要是指數形式的。主觀地,這種指數形式給了我們一個對不真實性的有用測量,表示為u,這是一個粗略地反映風格轉移的圖像看起來會有什麼印象的方法:

style transfer ratio = 10^u

Kristen Stewart的論文的貢獻(可能是最重要的一點)甚至都不能稱之為貢獻。Gatys最初的論文已經對這一公式進行了論述,甚至還附上了一張非常好的照片,來展示U的改變帶來的效應。

他們提到了另外的一些貢獻,但是這對於一篇論文來說是遠遠不夠的,我認為。他們談到了一系列參數(不是超參數),已經如何調整。但是這不足以讓其成為一篇AI論文。他們本可以發一篇部落格就夠了的。我本人並沒有發現這篇論文有任何好的地方。沒有讓我學到任何新的東西。

但是,這篇論文對於那些希望使用深度學習進行風格遷移的電影製作者來說可能會有用。他們可能會需要調整參數,讓輸出的圖片足夠好(主觀的)到可以產出。

如果你真的想知道Kristen Stewart的論文究竟是什麼,或者Prisma APP的工作原理,還是去讀Gatys的論文吧。

最後,我不認為Kristen做了任何技術方面的工作用於深度學習的預訓練。她可能就像其他教授一樣,只是署名而不做任何工作。 Kristen是一名演員而不是深度學習工程師。所以,對論文的批評應該指向研究工程師Bhautik J Joshi。

本文授權轉載自:36 氪

關鍵字: #人工智慧
往下滑看下一篇文章
新北首間 AI 科技高中!錦和高中導入羅技電子 Rally Board 65 打造「移動任意門」,讓世界走進教室!
新北首間 AI 科技高中!錦和高中導入羅技電子 Rally Board 65 打造「移動任意門」,讓世界走進教室!

深夜11點,多數高中生可能已經準備熄燈就寢,但新北市錦和高中的 AI 基地教室卻燈火通明。原來,錦和的老師、學生,正利用 Logitech 的會議室解決方案 Rally Board 65,和遠在美國科羅拉多州、有 17 小時時差的 Kent Denver School進行視訊。兩校學生在螢幕上熱切分享文化習俗與校園趣事,教室氣氛熱絡。

在錦和,這樣跨越時區和國界的「深夜國際教室」,並非偶一為之的特殊活動,而是透過台美教師討論規劃,有系統制度的國際交流日常。

事實上,作為新北市政府教育局認可的全新北市首間「AI科技高中」,近年來,錦和在數位轉型、科技教育上多有著墨。從生生用平板、建置全校數位互動軟體,到引進被師生譽為「移動任意門」的 Logitech Rally Board 65,錦和正以活潑、彈性的數位學習策略,重新定義未來教室的模樣。

注入數位學習DNA,翻轉傳統教學模式

但錦和的數位轉型並非一蹴可幾。早在疫情期間,錦和高中校長張純寧就意識到,數位教學不是選擇題,「因應數位浪潮、社會趨勢,我們一定得這麼做!」當時,她大刀闊斧將行政人員分組,手把手協助全校老師跨越科技門檻、熟悉線上教學,成功將「數位 DNA 」注入錦和。

如今,走進錦和的課堂,會看到生物老師利用平板搭配 AR 擴增實境技術,將圖像化為立體,讓學生直觀地觀察昆蟲解剖構造和心臟血液的流動;數學老師則透過 VR 虛擬實境,設計「密室逃脫」遊戲,讓學生在解謎中,學著邏輯推演;公民老師更帶著學生投入田野調查,將時事探討結合數位資訊,提升學習興趣。

「錦和的老師,幾乎都已經完成 AI 的增能研習。」張純寧透露,學校在將數位工具融入教學之餘,更和淡江大學合作開發專屬的「AI 倫理素養手冊」,並列為校定必修課程,目的是確保學生在擁抱 AI 的同時,也能建立正確的價值觀。

引進 Logitech Rally Board 65,打造無縫國際交流體驗

而隨著數位學習的版圖不斷擴張,近來,錦和面對的新挑戰,是為學生創造「無縫的國際交流體驗」。

為了讓學生有機會開口說外語、和世界接軌,錦和申請校園雙語計畫子計畫三,採購Logitech Rally Board 65,方便與美國、法國等國的姐妹校線上交流。但過去,要進行高規格的遠距教學,學校必須斥資打造一間固定的遠距教室,裡頭還得裝設投影機、追蹤攝影機和收音設備,不僅空間受限,設備盤點、維護也是行政人員的夢魘。

錦和高中圖書館主任吳孟仁解釋,如果讓學生一人用一台筆電視訊,只要有一位學生的設備出狀況,或是網路連線有問題,老師就必須先中斷課程,接著再像個工程師般,協助學生一一排除障礙;若採用多人在同一鏡頭前發言的模式,傳統的視訊鏡頭又無法照顧到每一個人,導致交流缺乏臨場感。

#1 羅技_第一篇(錦和高中)_115126
吳孟仁表示,學生為參與跨國交流,常於夜間上線,展現高度投入與國際視野。隨著數位工具融入學習,學生更主動表達、協作與創造,培養面向未來的關鍵能力。
圖/ 數位時代

「我們要的,是一款將使用門檻降到最低、讓老師容易上手的數位工具。」張純寧指出,本學年藉由校園雙語化計畫與參與教育部高中優質化數位前導學校計畫的契機下,錦和偶然接觸到 Logitech Rally Board 65,結果意外發現,Rally Board 65 能徹底解決跨國交流的痛點。

#2 羅技_第一篇(錦和高中)_115126
Logitech Rally Board 65 結合 65 吋觸控螢幕與 AI 視訊技術,搭配移動式腳架,有效解決跨國交流溝通挑戰。透過 AI 與數位工具導入,學生培養跨域協作與問題解決能力,學習成果不再侷限於考試。
圖/ 數位時代

Rally Board 65 作為專為新世代協作而生的全功能,配有 65 吋的 4K 超高畫質觸控螢幕,還有兩支無須配對、充電的隨插即用數位筆,讓師生能輕鬆在白板上書寫、共編討論。鏡頭、麥克風和揚聲器一體成型的配置,打破了過往需要拼拼湊湊各項硬體的限制;內建的「RightSight 2」智慧取景技術,不僅能自動追蹤並清晰框選正在發言的師生,學生不再需要擠在一個小小的筆電鏡頭前,也不用傳麥克風,只要像平常聊天般自然發言即可;另外,「RightSound 2」智慧調音技術則能透過 AI 回音抑制技術,過濾背景噪音,確保討論過程不受環境音干擾,讓跨國溝通有如面對面交流般清晰。

#3 羅技_第一篇(錦和高中)_115126
錦和高中透過視訊設備,與長期有往來的美國肯特丹佛學校進行即時交流,科技賦能教育場景,讓跨國學習成為日常。
圖/ 數位時代

張純寧特別提到,Rally Board 65 擺脫傳統需固定於牆面的限制,只要裝上專屬推車腳架,就能任意移動,「Rally Board 65 最大的優點,是『可攜』!讓我們隨時隨地都能在學校的任何一個地方,創造『教學角』。」她笑稱,要是學校裡多幾台這樣的設備,等於多蓋了幾間多功能教室。不僅具備高度機動性,Rally Board 65 在安裝與視角上也同樣靈活,支援桌面、壁掛等多元配置,螢幕亦可雙向翻轉,根據需求調整上下視角,輕鬆融入各種教學情境。

同時,Rally Board 65 還有「免學習」的特性,「插電就能用,老師完全不用特別學習。」吳孟仁分享,現在的台美跨國連線,即便安排在夜間11點,學校也不必指派資訊人員留守,老師自己就能輕鬆開機、主持課程,大幅提升設備的使用率與教學彈性。

軟、硬體設備的升級,最終仍要回歸學生的成長。張純寧表示,當學生具備強大的數位協作能力,並習慣在虛實整合的環境中表達自我時,「你會明顯發現,沒有學生再躲在角落了!每個人都必須、也樂於站出來展現自己。」比方說,在自然科探究與實作的全年級發表會裡,學生是以「線上共編」模式,繳出成果;原先對寫程式一竅不通的社會組學生,經過 AI 課程上的學習,現在竟然能運用 AI 工具,協助弱勢團體、公益組織開發出線上的「記帳系統」。

#4 羅技_第一篇(錦和高中)_115126
張純寧表示,穩定且符合使用習慣的數位工具,是支撐長時間教學與行政工作的關鍵。透過羅技鍵盤滑鼠符合人體工學的設計,在高工時及高強度的辦公室工作下,保持舒適與效率。
圖/ 數位時代

從最初克服線上教學的陣痛,到成為新北市首間 AI 科技高中,以及引進 Rally Board 65,錦和用實際行動證明,只要具創新教育思維、善用多元數位工具,就能打破空間、時間限制,為孩子們打造一座與世界無縫接軌的未來校園。

從理念到實踐,打造未來教學場域。歡迎教職員夥伴預約參觀 Logitech 展示中心,了解更多 AI 教育解決方案:https://360theredmarker.com/vt/logitech-taipei/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓