5月18日更新:
馬斯克收購推特的動作持續暫停,當地時間17日,他在推文上指出,「假帳號比例比推特聲稱的小於5%還要高很多,應該有20%甚至更多」、「昨日,Twitter的執行長無法證明帳號比例小於5%,因此這筆交易暫時無法進行,直到他端出證據」。
5月15日消息,美國特斯拉公司執行長伊隆·馬斯克於當地時間週五宣布,在確認垃圾和虛假帳戶占平台總用戶數比重不到5%的更多細節披露以前,將暫時擱置收購推特的計劃。
此條推文,令推特的股價盤前一度暴跌超20%。
僅兩小時後,馬斯克再次發文稱:仍致力於收購推特。但他仍繼續猛烈抨擊推特的虛假帳戶問題,並表示他的團隊將對垃圾和虛假帳戶真實數據進行核實。然而,許多專家認為,馬斯克的抽樣分析方法錯了!
推特自承虛假帳戶不到5%?
在今年第一季度財報中,推特承認,除了合法的、可貨幣化的日活躍用戶(MDAU)外,其平台上還存在許多「虛假、垃圾以及重複帳戶」。該公司報告稱:「我們對帳戶樣本進行了內部審查,估計2022年第一季度虛假帳戶、垃圾帳戶以及重複帳戶的平均數量不到該季度日活躍用戶(2.29億)的5%。」
推特還承認,在過去三年中,該平台多報了140萬至190萬用戶數量。推特透露,該公司在2019年3月推出了一項功能,允許人們將多個獨立帳戶鏈接在一起,以便在不同帳戶之間進行方便的切換。但當時出現錯誤,通過主帳戶執行的操作導致所有鏈接帳戶都被認定為日活躍用戶。
然而研究人員估計,根據2017年的一項早期研究和一家監控在線對話的公司最近發布的研究報告,有9%到15%的推特帳戶都是自動帳戶或機器人操作。以色列科技公司Cyabra的執行長丹·布拉米(Dan Brahmy)說:「顯然,他們低估了這個數字。」該公司利用機器學習來識別虛假帳戶。Cyabra估計,推特虛假帳戶的比例為13.7%。
Facebook和Instagram母公司Meta也估計,根據其2021年第四季度的最新數據,虛假帳戶約佔Facebook月度活躍用戶的5%。Meta還估計,約11%是一個用戶操作多個帳戶的「重複」帳戶,但這種做法在推特上被認為是可以接受的。
推特的規則確實禁止虛假帳戶,這意味著如果公司確定虛假帳戶的目的是「欺騙或操縱他人」,例如參與詐騙、協調濫用活動或人為誇大參與度,它們就會被禁止。
多年來,推特也始終在投資清理虛假帳戶。2018年,推特收購了名為Smyte的公司,後者專門從事垃圾帳戶的篩查和清除。為了改善平台的健康狀況,推特還刪除了「垃圾帳戶和可疑帳戶」,這導致其用戶數量在2018年7月減少了100萬,股價暴跌。
根據研究人員的說法,即使機器人的數量實際上很小,但它們卻可以產生巨大的影響,而且少數幾個機器人可以在塑造在線對話方面產生嚴重後果。卡內基梅隆大學的一項研究分析了2020年新冠肺炎謠言的傳播情況,發現在最具影響力的50名轉發者中,82%是機器人。
隨機抽樣100位粉絲確認狀態
馬斯克表示,他將採取措施來確定推特上到底存在多少垃圾帳戶、虛假帳戶以及重複帳戶。他說:「為了找出答案,我的團隊將對推特長方帳號的粉絲進行隨機抽樣,確認100位粉絲的狀態。我邀請其他人重複同樣的過程,看看他們有什麼發現。」
馬斯克在隨後的推文中澄清了自己的研究方法,並補充道:「選擇任何粉絲眾多的帳號,忽略前1000名粉絲,然後每隔10人抽取1人進行核查。當然,我也希望能找到更好的方法。」
馬斯克還解釋稱,在沒有提供證據的情況下,他選擇100作為其研究的樣本數量標準,因為推特在財報中也使用這個數字來計算粉絲數字。
他說:「任何合理的隨機抽樣過程都可以接受。如果許多人進行獨立研究,然後發現虛假帳戶、垃圾帳戶以及重複帳號佔比的數字相似,那就說明問題了。我之所以選擇100作為採樣基數,因為這也是推特計算出其虛假帳戶、垃圾帳戶以及重複帳戶佔比不到5%的數據。」
馬斯克的分析方法遭批
儘管馬斯克可能有理由對上述數據進行評估,但社交媒體、虛假資訊和統計分析方面的專家表示,他提出的分析方法存在嚴重不足。
當被問及馬斯克的方法是否能得出準確結果時,推特拒絕置評。但Facebook聯合創辦人達斯汀·莫斯科維茨(Dustin Moskovitz)通過自己的推特帳戶就這個問題發表了看法,他指出,馬斯克的方法實際上並非隨機抽樣,使用的樣本也太少,而且留下了大量錯誤的空間。他寫道:「我也覺得『不信任推特團隊幫助提取樣本』是一種危險信號。」
分析服務網站BotSentinel創辦人兼執行長克里斯托弗·布齊(Christopher Bouzy)表示,其公司分析表明,推特上10%到15%的帳戶可能是「不真實的」,包括冒充者、垃圾郵件發送者、詐騙者、邪惡機器人以及「單一目的仇恨帳戶」等,這些帳戶通常針對和騷擾個人,還有其他故意傳播虛假資訊的人。
BotSentinel主要由眾籌支持,它使用機器學習軟體和人類審查員相結合,獨立分析和識別推特上的不真實用戶。該公司目前監控著250多萬個推特帳號,其中主要是英語用戶。布齊說:「我認為推特對『虛假帳號和垃圾帳號』的分類並不現實。」
布齊還警告說,根據討論的話題不同,虛假帳戶的數量可能會在推特的不同角落出現更高或更低的情況。例如,BotSentinel發現,與討論小貓和摺紙等非爭議性話題的帳戶相比,關於政治、加密貨幣、氣候變化等話題的不真實帳戶更多。
華盛頓大學教授卡爾·伯格斯特羅姆(Carl T. Bergstrom)與人合著了一本書,旨在幫助人們理解數據,避免上當受騙。他評論馬斯克的方法稱,對任何推特帳戶的100名粉絲進行抽樣,都不應該被作為進行一筆440億美元收購交易的「盡職調查」。
伯格斯特羅姆說,在研究帳戶真假的問題上,社交媒體研究人員通常會使用大量樣本,而馬斯克隨機抽取100個樣本的規模小了幾個數量級,這種方法將面臨的最大問題是存在選擇偏見。
伯格斯特羅姆寫道:「沒有理由相信推特長方帳號的粉絲是平台上具有代表性的帳戶樣本,也許機器人不太可能關注這個帳戶以避免被發現,也許他們更有可能遵循看起來合法的做法。誰知道呢?但我無法理解馬斯克除了用這個愚蠢的抽樣方案來欺騙我們之外,還有什麼其他的事情可做。」
本文授權轉載自:網易科技
責任編輯:傅珮晴、錢玉紘
好友缺你一個,加入數位時代LINE,科技產業趨勢新聞一次掌握!