想像一下一個場景,一位人類學家,手邊擁有數億張一百年來的人類的生活照,並且擁有強而有力的工具能夠分析這些照片,將可以探索多少新的問題?
這個想像也激發了康乃爾大學的研究人員,他們認為每天上傳到社交媒體數以百萬計的照片是一個可以觀察人類文化、社交、經濟的豐富資源,並搭配強大的機器學習演算法以及電腦的運算能力,將可以洞察到人類文明更深一層的脈絡。
他們決定先探討一定時間內人們穿衣風格的變化,例如美國人使用圍巾的頻率有沒有隨著時間改變,或哪個城市特別偏重什麼風格的衣服等等。他們首先先跟Instagram合作,下載了來自44個城市、總共一億張的照片,並運用臉部辨識程式先刪掉不包含人臉的照片,留下了一千五百萬張的照片。接著使用這些照片來訓練機器學習辨認照片中的衣服種類、首飾等等。讓機器學習學會辨認照片中的人是否有穿夾克?圍巾?有沒有戴眼睛?也學會歸類衣服的種類以及穿衣的風格。
世界杯足球賽,巴西跟哥倫比亞都愛上黃色了
使用了訓練完的機器學習演算法後,研究人員發現一些有趣的現象,像是人們穿衣的顏色是有週期性的,黑色及棕色在冬天更常見,夏天則是藍色。至於紅色雖然沒有週期性,但是在十月到十二月會突然飆高,推斷是因為萬聖節和聖誕節的緣故。還有2014年時六月巴西及哥倫比亞穿黃色衣服的比例突然飆高,推測是世界杯的緣故,並且兩國的足球隊隊服都是黃色的。
不過這個演算法當然還有需要改進的地方,由於資料來源是Instagram,因此分析的人口會過於傾向年輕人。還有就是照片都集中在上半身,會很難分析到腿部以下的資訊。但是研究人員對於未來的發展非常樂觀,並表示大數據、機器學習、電腦視覺的結合將會成為非常強而有力的分析工具,應用的領域十分廣泛。