AI又學會新招!DeepMind深度學習系統將Google街景圖後製為專業水準攝影作品

DeepMind
DeepMind開發出一套藝術內容創作的深度學習系統「Creatism」,讓電腦模仿專業攝影師的工作流程,可將Google街景圖後製為符合攝影美學的照片,有的甚至達到專業攝影的水準。

開發出發AlphaGo的Google人工智慧實驗室DeepMind,繼圍棋、醫療、能源、唇語辨識後,又將機器學習用於新領域:攝影。他們開發出一套藝術作品創作的深度學習系統「Creatism」,讓電腦模仿專業攝影師的工作流程,可將Google街景圖後製為符合攝影美學的照片,有些甚至達到專業攝影的水準。

不只是濾鏡工具,而是學習攝影作品的美感元素

Google在部落格表示,他們的虛擬攝影師透過Google街景服務遊歷超過4萬個景點,可「拍攝」出接近專業等級的攝影作品。

想讓機器學會「美感」並不容易。雖然審美觀可以透過美學視覺分析資料庫AVA學習,但這種方法可能導致照片過於注重某種美感元素、忽略其他部分,例如將照片飽和度調過高。而利用監督式學習雖然可以避免這種情況,但卻需要替每張照片上的美感用標籤標示,相當耗時。

Google的方法是,讓系統掃描一系列專業攝影照片,不提供後製前後的照片讓電腦對照、也不替照片加上任何美感的標籤,而是讓系統自動辨識出照片中的美感並分類。在建立好美感類型後,系統會產出相對負面的範例,訓練系統學會分辨美感的好壞程度。

訓練好的系統會先擷取全景圖中的一部分(就像攝影師在真實世界要先取景一樣),並加強照片的圖像組成、飽和度和HDR程度、戲劇性光影等,快速優化照片。其中,他們用戲劇性遮罩(dramatic mask)替照片加上光影,不像傳統暈影只能加上形狀固定的光影,戲劇性遮罩可以根據照片中的物件調整亮暗。

DeepMind

該研究的第二作者表示,這和Instagram這類的濾鏡工具完全不同,因為他們是藉由模仿攝影師的攝影作品來提升照片美感,而不是只是單純套用濾鏡,調整範圍從構圖到後製,除了HDR、飽和度,也有局部光影加強。

義大利的Park Parco delle Orobie Bergamasche。
DeepMind
瑞士茵特拉根。
DeepMind
加拿大賈斯珀國家公園。
DeepMind
加拿大賈斯珀國家公園。
DeepMind

40%的作品近專業攝影水準

為了測試該模型的成果,Google設計類似「圖靈測驗」的實驗,看人類是否能分辨出作品是由機器或人類攝影師拍攝。實驗將機器生成的攝影作品和其他專業程度不同的照片混合,再拿給專業攝影師評1到4分。1表示照片毫無考慮到構圖和光影,2為無攝影背景的一般人拍的普通照片,看不出特別的美感,3為半專業,即照片可清楚看出美感,攝影師正在成為專業攝影師的路上,4為專業攝影師的等級。

結果顯示,機器學習的攝影作品,約有40%被評為半專業和專業的等級。

有興趣的話,可以到這裡欣賞更多Creatism的作品集。大家覺得這些照片具備「專業水準」嗎?

資料來源:GoogleHackerNews

機器學習
Machine Learning
「機器學習」是指計算機模擬或實現人類的學習行為,機器學習能透過經驗,自動修正計算機的演算法,以獲取新知或技能,重新組織原有的知識結構,不斷改善自身性能。 機器學習並非只是用於處理資料庫問題,它屬於人工智慧 (Actifical Intelligence) 的分支,讓機器可以自動學習,從巨量資料中找到規則,進而有能力做出預測。 簡單來說,機器人像是人的「身軀」,人工智慧則是人的「腦」,機器學習就是將兩者合為一體。 (來源: 維基百科MBA 百科 )
圖靈測試
Turing test
圖靈於1950年提出的一個關於判斷機器是否能夠思考的著名試驗,測試某機器是否能表現出與人等價或無法區分的智能。如果一個人(代號C)使用測試對象皆理解的語言去詢問兩個他不能看見的對象任意一串問題。對象為:一個是正常思維的人(代號B)、一個是機器(代號A)。如果經過若干詢問以後,C不能得出實質的區別來分辨A與B的不同,則此機器A通過圖靈測試。 (來源: 維基百科 )
追蹤我們