造神型的數據分析：解析政府真的降低「兒虐」人數？|數位時代 BusinessNext

造神型的數據分析：解析政府真的降低「兒虐」人數？

數據有問題通常第一件事情都是原始資料就出了錯。政府對於兒虐，從小燈泡開始嚴格來說沒有太大的積極作為，也就是沒有任何的外力或條件可以減少兒虐人數，難道真的是經濟變好，虐兒的父母良心發現，所以不再虐兒了？

最近虐童案頻傳，部分網友紛紛跳出來罵說：政府真是沒有用，虐嬰比例上升！但這時候某媒體【圖表】近十年施虐者「樣貌」：兒虐案的主因不只是「小爸媽」（此文已修正，包含將 2018年的數據移除，以及把「家外」的人數加入）一文中的一張圖出來打了很多人的臉。

從未經調整的原圖來看，政府真的是無限威能，上任隔年開始兒虐案受虐人數瞬間砍半，從每年超過萬人以上，瞬間砍半到不 5,000 ，這實在太神奇了！

但是身為一個視數據分析為主要技能的我，看到這種砍半數據只有一個直覺：不可能！對不起，我就是要說：不可能！

任何有點基礎數據分析能力的人都會知道數據大漲或大跌，其背後一定要有原因，而不是看到數據下跌了就說棒棒噠。

可是翻開過去兩年，政府對於兒少受虐，從小燈泡開始嚴格來說沒有太大的積極作為，也就是沒有任何的外力或條件可以減少兒少受虐人數，難道真的是經濟變好，虐待小孩的父母良心發現，所以不再虐兒了？

所以身為一個數據分析者，第一件事情，就要先回頭看還沒被做成圖表原始數據。

數據有問題通常第一件事情都是原始資料就出了錯。

因此我們打開了衛福部統計處的網頁，裡面的資料分類做得相當的好，包含人數、類型都分類的清清楚楚的，但當我下載了 3.5.6 的「 兒童少年保護 - 受虐人數 」時，第一個問題就出現了：

數據統計方式明顯出現了改變

從 106 年起，除了時間維度之外，分類的維度從「兒童少年保護 - 受虐人數 Number of Abused Child and Youth」改為了「家內兒童及少年保護案件 - 受虐人數 Intra - family Child and Youth Protection Cases - Number of Abused」（政府還很貼心地加上了紅字，明確的告訴你統計維度的不同。）

統計維度的不同，做成同一張表，自然數據就會有明顯落差，就像如果你看 Google Analytics ，看進站的使用者跟工作階段，擺明就是不同的維度，做在同一張表會是正確的嗎？

數據維度改變的探究

那維度做了什麼改變，能讓破萬掉到不到五千呢？基本上我是沒有明確地找到相關的說明是如何改變的，但是從 3.5.5 兒童少年保護-受虐類型的分類中找到了原因。

2016年以前的數據應是以「複選」的錯誤統計方式來統計，而 2017 年後應該是以「案件」作為主要類別來做統計。

為什麼這樣的統計方式可能會是錯的？當然受虐方式有很多，假設今天有一個虐兒，他主要是受到身體虐待，但他可能同時也受到了精神虐待甚至性虐待，在複選的情況下就被勾了三次，也就是說同一個虐兒可能被統計兩次以上。（雖然新的表中文「複選」拿掉了，但英文還在）。

這樣也正說明在 2017 年以後，統計回歸以「案件」方式來統計數據砍半的原因，真要說蔡政府作出了什麼貢獻，主要就是讓數據合理化（更正：有朋友指出，馬政府年代就已經做出更正了，不過目前無直接證據先保留）。

但現在也沒有舊有的數據去還原原本 93年至105年錯誤的計算方式正確後的結果，所以無從比較歷史以來蔡政府是不是真的降低了虐童數。

還有麻煩「人次」跟「人數」是不一樣的指標請不要混用。

上半段感謝該媒體修正，但預留一手的查證則要繼續討論了。當然就該媒體代表回應：

「感謝指正，確認2017年至2018的統計數字僅含「家內」人數，故圖表不再列入近兩年統計。

唯「歷年兒虐案受虐人數」一圖，進一步求證衛福部保護司2017年「家內」人數為4135，「家外」為3212，故該年度總人數應為7347人，該圖也已經更正，2018年因沒有完整年度人數故不列入比較。在此也對原本數字誤植導致圖表的錯誤致歉。」

如果我們再打開 3.5.1 兒童少年保護 - 通報處理情形的檔案就有發現這句話：

也就是說 3.5.6 中的人數並非真正受虐人數，而是「有開案的人數」。那時既有開案前的通報案例的數字又是發生了什麼變化呢？

網上盛傳的圖表是成案數，未說明106年是只計家內通報開案、107年只算了前三季。報表看起來才會在現任政府任內看起來特別低，不表示真的低那麼多。

另外只計家內人數也不是為了隱匿情況，而是過去數字有重覆計算人次的問題，而做出調整，還原貼近真實數字（但也喪失了相同標準數字比較之可能性）。

爬資料可發現，通報數從2010年守護幼苗專案開始逐年攀高，但成案數除了前三年因通報而增加，接下來却是連年下降。

先給大家一個數感，台灣去年的新生兒人數不足20萬人，而去年通報了有近6萬次的兒虐。

一般媒體及兒少團體會報導說是吃案、證據不足而無法成案，但也有檢討說是為了追求通報數而浮報、濫報，造成社工困擾，所以希望改善方法是降低通報數。

本文由邱煜庭授權轉載自其Facebook。

《數位時代》長期徵稿，針對時事科技議題，需要您的獨特觀點，歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw，文長至少800字，請附上個人100字內簡介，文章若採用將經編輯潤飾，如需改標會與您討論。

（觀點文章呈現多元意見，不代表《數位時代》的立場。）