造神型的數據分析:解析政府真的降低「兒虐」人數?

2019.01.28 by
邱煜庭
邱煜庭 查看更多文章

小黑,本名邱煜庭,不過還是希望大家稱呼他為小黑,臺灣網路行銷操作者,接觸網絡多年,曾任 MIS、 網站企劃 、網路行銷企劃、行銷顧問以及中國網路行銷經驗。專精於 Google、Bing 及百度白帽 SEO,Inbound Marketing(集客式行銷)推廣者。 著有《網路集客力》一書(臺灣城邦集團 PcUser 出版),是台灣少數可同步經營實體及虛擬的行銷人,目前為帕格數碼總經理,專注於網路廣告技術開發以及電商顧問服務。

Suzanne Tucker via shutterstock
數據有問題通常第一件事情都是原始資料就出了錯。政府對於兒虐,從小燈泡開始嚴格來說沒有太大的積極作為,也就是沒有任何的外力或條件可以減少兒虐人數,難道真的是經濟變好,虐兒的父母良心發現,所以不再虐兒了?

最近虐童案頻傳,部分網友紛紛跳出來罵說:政府真是沒有用,虐嬰比例上升!但這時候某媒體 【圖表】近十年施虐者「樣貌」:兒虐案的主因不只是「小爸媽」 (此文已修正,包含將 2018年的數據移除,以及把「家外」的人數加入)一文中的一張圖出來打了很多人的臉。

從未經調整的原圖來看,政府真的是無限威能,上任隔年開始兒虐案受虐人數瞬間砍半,從每年超過萬人以上,瞬間砍半到不 5,000 ,這實在太神奇了

但是身為一個視數據分析為主要技能的我,看到這種砍半數據只有一個直覺:不可能!對不起,我就是要說:不可能!

任何有點基礎數據分析能力的人都會知道數據大漲或大跌,其背後一定要有原因,而不是看到數據下跌了就說棒棒噠。

可是翻開過去兩年,政府對於兒少受虐,從小燈泡開始嚴格來說沒有太大的積極作為,也就是沒有任何的外力或條件可以減少兒少受虐人數,難道真的是經濟變好,虐待小孩的父母良心發現,所以不再虐兒了?

所以身為一個數據分析者,第一件事情,就要先回頭看還沒被做成圖表原始數據。

數據有問題通常第一件事情都是原始資料就出了錯。

因此我們打開了衛福部統計處的網頁,裡面的資料分類做得相當的好,包含人數、類型都分類的清清楚楚的,但當我下載了 3.5.6 的「 兒童少年保護 - 受虐人數 」時,第一個問題就出現了:

數據統計方式明顯出現了改變

衛福部統計處

從 106 年起,除了時間維度之外,分類的維度從「兒童少年保護 - 受虐人數 Number of Abused Child and Youth」改為了「家內兒童及少年保護案件 - 受虐人數 Intra - family Child and Youth Protection Cases - Number of Abused」(政府還很貼心地加上了紅字,明確的告訴你統計維度的不同。)

統計維度的不同,做成同一張表,自然數據就會有明顯落差,就像如果你看 Google Analytics ,看進站的使用者跟工作階段,擺明就是不同的維度,做在同一張表會是正確的嗎?

數據維度改變的探究

那維度做了什麼改變,能讓破萬掉到不到五千呢? 基本上我是沒有明確地找到相關的說明是如何改變的,但是從 3.5.5 兒童少年保護-受虐類型的分類中找到了原因。

2016年以前的數據應是以「複選」的錯誤統計方式來統計,而 2017 年後應該是以「案件」作為主要類別來做統計。

為什麼這樣的統計方式可能會是錯的?當然受虐方式有很多,假設今天有一個虐兒,他主要是受到身體虐待,但他可能同時也受到了精神虐待甚至性虐待,在複選的情況下就被勾了三次,也就是說同一個虐兒可能被統計兩次以上。(雖然新的表中文「複選」拿掉了,但英文還在)。

這樣也正說明在 2017 年以後,統計回歸以「案件」方式來統計數據砍半的原因,真要說蔡政府作出了什麼貢獻,主要就是讓數據合理化(更正:有朋友指出,馬政府年代就已經做出更正了,不過目前無直接證據先保留)。

但現在也沒有舊有的數據去還原原本 93年至105年錯誤的計算方式正確後的結果,所以無從比較歷史以來蔡政府是不是真的降低了虐童數。

還有麻煩「人次」跟「人數」是不一樣的指標請不要混用。

上半段感謝該媒體修正,但預留一手的查證則要繼續討論了。當然就該媒體代表回應:

「感謝指正,確認2017年至2018的統計數字僅含「家內」人數,故圖表不再列入近兩年統計。

唯「歷年兒虐案受虐人數」一圖,進一步求證衛福部保護司2017年「家內」人數為4135,「家外」為3212,故該年度總人數應為7347人,該圖也已經更正,2018年因沒有完整年度人數故不列入比較。在此也對原本數字誤植導致圖表的錯誤致歉。」

如果我們再打開 3.5.1 兒童少年保護 - 通報處理情形 的檔案就有發現這句話:

衛福部統計處

也就是說 3.5.6 中的人數並非真正受虐人數,而是「有開案的人數」。那時既有開案前的通報案例的數字又是發生了什麼變化呢?

網上盛傳的圖表是成案數,未說明106年是只計家內通報開案、107年只算了前三季。報表看起來才會在現任政府任內看起來特別低,不表示真的低那麼多。

另外只計家內人數也不是為了隱匿情況,而是過去數字有重覆計算人次的問題,而做出調整,還原貼近真實數字 (但也喪失了相同標準數字比較之可能性)。

爬資料可發現,通報數從2010年守護幼苗專案開始逐年攀高,但成案數除了前三年因通報而增加,接下來却是連年下降。

先給大家一個數感,台灣去年的新生兒人數不足20萬人,而去年通報了有近6萬次的兒虐。

一般媒體及兒少團體會報導說是吃案、證據不足而無法成案,但也有檢討說是為了追求通報數而浮報、濫報,造成社工困擾,所以希望改善方法是降低通報數。

本文由邱煜庭授權轉載自其Facebook

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場。)

每日精選科技圈重要消息