面對困境，兩個AI會選擇合作還是背叛？Google旗下DeepMind做了一個實驗|數位時代 BusinessNext

面對困境，兩個AI會選擇合作還是背叛？Google旗下DeepMind做了一個實驗

有人說，人類的本性都是自私的。那麼，你有想過人工智慧（AI）在面臨抉擇時會採取合作還是侵略的做法嗎？Google旗下研究AI的子公司DeepMind最近做了一項有趣的實驗。

自私是人類的本性，我們往往多愛自己一點，在面臨需要抉擇的困境時大多選擇對自身有利的做法。在未來社會中，人類社會有許多的層面可能都將由人工智慧（AI）來代勞，但你有曾經思考過這些AI們會彼此合作還是相互廝殺來完成工作嗎？Google旗下研究AI的子公司最近發表了一份相關的研究。

面對困境，AI會謀取私利？還是大局為重？

從小至交通狀況大至國家經濟，未來都可能看見AI的影子，先不管你我手中的工作會不會被取代的威脅，這些將維持社會國家和諧的AI會起衝突嗎？他們會好好完成工作還是一天到晚吵架呢？繼上次AlphaGo擊敗各大棋王後，Google旗下研究AI的子公司DeepMind做了一個有趣的實驗。

DeepMind在部落格貼文中先是解釋了著名的「囚徒困境」（prison's delima），說明一名「理性人」在面臨囚徒困境時的最佳策略是選擇「背叛」。傳統賽局理論的社會困境模型常常是二元式的：合作或背叛，不過在現實生活中，要做出選擇時往往涉及相當複雜的行為，因此DeepMind研究人員以社會學「連續社會困境」（sequential social dilemmas）概念為基礎設計了兩款遊戲，目地是要測試AI在處理一連串的狀況時，是會以大局為重？還是牟取私利？

第一款遊戲名為「Gathering」，玩法是必須採集到越多的蘋果越好，而玩家可以透過發射雷射光讓另一名玩家暫時退出遊戲，來替自己爭取更多採及蘋果的時間從而獲取勝利。

以下是遊戲的影片：

第二款遊戲名為「Wolfpack」，遊戲中兩名玩家必須合作追捕另一隻由電腦系統控制的狼，且不單單是抓到狼的玩家可以獲勝，連帶周遭的玩家也能一起得分。

以下是遊戲的影片：

AI的行為其實是根據面對的狀況而有所不同

研究人員在這項研究中發現了一件有趣的事，AI會因為遊戲規則的不同，而使他們的行為變得更加「合作」或「敵對」。例如在「Gathering」遊戲中，當蘋果供給數量豐富時，AI就不必透過雷射光去干擾對手；反之一但場上蘋果數量銳減，使用雷射光的頻率也會隨之增加。最有趣的是，當運算能力較強的AI進入遊戲時，不論場上的蘋果是多是少，都會傾向使用更多的雷射光制衡其他玩家，換句話說，透過這項研究的結果可以得知，越聰明的AI越會採取侵略性的行為模式，而不是合作。

那是否AI一概會認為「侵略性的競爭」是最好的策略呢？也不全然如此，研究人員表示，雷射光使用的增加只是因為運算能力較強的AI認為這麼做比較具有挑戰性而已，因為要發射雷射光必須追蹤其他玩家的移動位置，這樣的行為較需要強大的運算能力。而在「Wolfpack」遊戲中，聰明的AI傾向與他人合作，研究人員解釋，這是因為學習與其他玩家追捕、跟蹤獵物需要比較強大的運算能力。

這項研究結果顯示，AI行為是依據他們所面對的規則狀況來改變的，一但規則中獎勵侵略性的行為（例如使用雷射光可以獲得較多的蘋果），AI就會變得比較具侵略性，反之合作若對於局勢有利，就會變得更加合作。研究人員在部落格文章中表示，「根據研究的結果，我們能力可以控制及理解的複雜運算系統，像是經濟、交通系統或是地球生態，都跟我們持續的合作努力有關。」也就是說，未來人類要能好好的控制及使用AI，關鍵就在於必須明訂出清楚的規範，以確保對於整體局勢有利，並不會使人類受到傷害。

資料來源：The Verge、Zdnet、Engadget