社群9大違規地雷別踩，Facebook發動「萬人大軍」打擊惡意內容|數位時代 BusinessNext

社群9大違規地雷別踩，Facebook發動「萬人大軍」打擊惡意內容

Facebook內容政策團隊成員已提升至1萬5千人，負責把關平台9種違規內容，除了靠人力審查之外，也透過科技主動偵測違規內容。

自由言論是公民應有的權利，但有些話在Facebook（臉書）上還是不能說。對Facebook來說，如何判斷內容是否被允許發布，是非常具有挑戰性的議題。

在今年五月，Facebook公布最新版本的社群守則執行報告。其中除了先前已發布過違規的8個面向（成人裸露畫面與性行為、霸凌與騷擾、兒童裸露畫面與兒童性剝削、假帳號、仇恨言論、垃圾訊息、全球恐怖主義宣傳、暴力和相關圖像內容）之外，又再增加受管制商品（如毒品、槍械等等）的相關資訊。

為嚴格把關以上9種違規內容，Facebook內容政策團隊成員已提升至1萬5千人，其中包含曾經擔任檢察官、人權律師、安全專家的成員；並駐紮在全球各地，希望所有違規貼文都能在24小時內接受審查。另一方面，除了人力審查檢舉貼文內容之外，Facebook也運用人工智慧以及各類演算技術，透過科技的力量，主動發現更多違規的內容發布。

假帳號攻擊暴增，Facebook用AI主動偵測惡意內容

「在2019年第一季（由於判定為假帳號）被停權的帳號共22億個，但在2018年12月的報告中，會發現那時候的數字只有7億540萬個；我們發現近期透過自動化、事先有腳本的假帳號攻擊越來越嚴重。」Facebook內容政策經理Sheen Handoo這樣說。

正因如此，Facebook不可能單靠人力審查撤下惡意內容，而是得善用科技力量。Handoo也提到，目前針對假帳號貼文檢舉，有9成以上是利用科技偵測；另外，在針對恐怖主義宣傳內容所撤下的640萬筆貼文之中，也有9成以上是透過科技偵測所發現的。

相對而言，由於仇恨語言、霸凌與騷擾這兩種惡意內容，使用的詞彙通常與在地語言情境相關，因此科技偵測的表現相對較差。像是在霸凌與騷擾相關惡意內容中，由科技主動偵測的比例只有14.1%。也就是說，大多數的內容必須仰賴使用者主動通報、檢舉，Facebook才能移除相關內容。

儘管如此，Facebook也持續強化科技主動偵測的能力，根據Facebook提供的數據，在2018年第一季，科技偵測仇恨言論的比例只有38%，但2019年第一季，在全球Facebook移除的400萬篇仇恨言論貼文中，透過科技偵測的比例已提升至65.4%。

語言霸凌內容需真人內容審查員把關

Handoo說，「我們也認知到科技與人還是不一樣，雖然像是血腥影片、成人裸體圖片等等違規內容的判定是科技的強項， 但仍有些領域（像文字為主的內容）對機器來說較困難 。」

由於仇恨語言、霸凌與騷擾這兩種形式的惡意內容上，單純透過人工智慧把關仍有困難，因此，Facebook全球的真人內容審查員扮演相當重要的角色。在使用者檢舉可能的惡意內容之後，審查員必須即時判定內容是否違背社群守則，並即時將惡意內容撤下。

問到目前Facebook如何為台灣使用者把關惡意資訊，Handoo說，儘管現階段台灣本地沒有審查員配駐，但和語言相關的內容審查依然必須透過「以台灣在地中文為母語」的審查員來評估。此外，Facebook內容政策團隊也會定期蒐集台灣專家的意見，例如網路內容防護機構iWin (現為 Facebook 全球安全諮詢委員會成員) 以及台灣展翅協會 (ECPAT)。