機器學習(Maching Learning)中,主要有幾種常見的學習策略:
- 透過已知標準答案的資料集進行模型訓練的監督式學習、
- 相對於監督式學習,未知標準答案(或不需要以人工來標籤分類)的非監督式學習與
- 與同樣不需要正確答案,透過環境獎勵與懲罰來引導答案的強化學習
2014 年,由 Ian Goodfellow 所發表的生成對抗網絡(GAN, Generative Adversarial Network)是非監督式學習的一種方法。這種方法主要由兩個同時提出的神經網絡模型所組成,一個模型稱做生成神經網絡,一個稱做判別神經網絡。
其中,生成神經網絡的主要任務,是要透過隨機採樣潛在隨機變量來輸出結果,該輸出結果必須要盡量靠近訓練集資料的真實樣本。
判別神經網絡則是分別將真實訓練集資料與生成神經網絡所模擬製造出的資料輸入進行比對。
生成神經網絡負責模擬生產出很靠近真實資料的資料,交由判別神經網絡與真實資料進行比對;透過生成神經網絡盡全力欺騙判別神經網絡,判別網絡盡全力辨認出真假資料,兩個網絡相互對抗、不斷調整各自網絡參數的平衡結果成為模型學習成果。
最終得到的生成神經網絡,常被用於模擬以假亂真的圖片、影像與物體等。而判別神經網絡則可用於辨識或分類。