社群9大違規地雷別踩,Facebook發動「萬人大軍」打擊惡意內容

2019.06.11 by
程倚華
shutterstock
Facebook內容政策團隊成員已提升至1萬5千人,負責把關平台9種違規內容,除了靠人力審查之外,也透過科技主動偵測違規內容。

自由言論是公民應有的權利,但有些話在Facebook(臉書)上還是不能說。對Facebook來說,如何判斷內容是否被允許發布,是非常具有挑戰性的議題。

在今年五月,Facebook公布最新版本的社群守則執行報告。其中除了先前已發布過違規的8個面向(成人裸露畫面與性行為、霸凌與騷擾、兒童裸露畫面與兒童性剝削、假帳號、仇恨言論、垃圾訊息、全球恐怖主義宣傳、暴力和相關圖像內容)之外,又再增加受管制商品(如毒品、槍械等等)的相關資訊。

為嚴格把關以上9種違規內容,Facebook內容政策團隊成員已提升至1萬5千人,其中包含曾經擔任檢察官、人權律師、安全專家的成員;並駐紮在全球各地,希望所有違規貼文都能在24小時內接受審查。另一方面,除了人力審查檢舉貼文內容之外,Facebook也運用人工智慧以及各類演算技術,透過科技的力量,主動發現更多違規的內容發布。

Facebook社群守則執行報告中,指出惡意內容的9種形式。
程倚華/攝影

假帳號攻擊暴增,Facebook用AI主動偵測惡意內容

「在2019年第一季(由於判定為假帳號)被停權的帳號共22億個,但在2018年12月的報告中,會發現那時候的數字只有7億540萬個;我們發現近期透過自動化、事先有腳本的假帳號攻擊越來越嚴重。」Facebook內容政策經理Sheen Handoo這樣說。

正因如此,Facebook不可能單靠人力審查撤下惡意內容,而是得善用科技力量。Handoo也提到,目前針對假帳號貼文檢舉,有9成以上是利用科技偵測;另外,在針對恐怖主義宣傳內容所撤下的640萬筆貼文之中,也有9成以上是透過科技偵測所發現的。

相對而言,由於仇恨語言、霸凌與騷擾這兩種惡意內容,使用的詞彙通常與在地語言情境相關,因此科技偵測的表現相對較差。像是在霸凌與騷擾相關惡意內容中,由科技主動偵測的比例只有14.1%。也就是說,大多數的內容必須仰賴使用者主動通報、檢舉,Facebook才能移除相關內容。

儘管如此,Facebook也持續強化科技主動偵測的能力,根據Facebook提供的數據,在2018年第一季,科技偵測仇恨言論的比例只有38%,但2019年第一季,在全球Facebook移除的400萬篇仇恨言論貼文中,透過科技偵測的比例已提升至65.4%。

Facebook內容政策經理Sheen Handoo認為,近年來自動化的假帳號攻擊越來越嚴重。
程倚華/攝影

語言霸凌內容需真人內容審查員把關

Handoo說,「我們也認知到科技與人還是不一樣,雖然像是血腥影片、成人裸體圖片等等違規內容的判定是科技的強項, 但仍有些領域(像文字為主的內容)對機器來說較困難 。」

由於仇恨語言、霸凌與騷擾這兩種形式的惡意內容上,單純透過人工智慧把關仍有困難,因此,Facebook全球的真人內容審查員扮演相當重要的角色。在使用者檢舉可能的惡意內容之後,審查員必須即時判定內容是否違背社群守則,並即時將惡意內容撤下。

問到目前Facebook如何為台灣使用者把關惡意資訊,Handoo說,儘管現階段台灣本地沒有審查員配駐,但和語言相關的內容審查依然必須透過「以台灣在地中文為母語」的審查員來評估。此外,Facebook內容政策團隊也會定期蒐集台灣專家的意見,例如網路內容防護機構iWin (現為 Facebook 全球安全諮詢委員會成員) 以及台灣展翅協會 (ECPAT)。

延伸閱讀

每日精選科技圈重要消息