[陳昇瑋] 熱浪研究:用電資料開放的應用潛力

台電資料並不是只能拿來檢驗或監督整體發電量及用電量,事實上,在許多領域,包括國安、經濟發展、產業升級,甚至公民的健康,都可以某種程度透過台電的資料來做更好的分析研究。

小小電表資料,大大用途。chia ying Yang 分享於 Flickr。

小小電表資料,大大用途。chia ying Yang 分享於 Flickr。

舉個例子:氣候變遷下,預期熱浪 (heat wave) 將頻頻發生,且不斷衝高歷史記錄。這幾年台灣亦遭逢異常綿延數日的熱浪,同時也看到熱浪期間呼吸道與心血管疾病死亡率攀升的情況。為了降低熱浪的負面衝擊,必須立即建構前瞻性之脆弱度評估,藉以擬訂熱浪調適策略。

為了降低熱浪的負面衝擊,必須立即建構前瞻性之脆弱度評估,擬訂熱浪調適策略。圖片來源:pixabay

為了降低熱浪的負面衝擊,必須立即建構前瞻性之脆弱度評估,擬訂熱浪調適策略。圖片來源:pixabay

目前全球各國對於熱浪並沒有標準的定義,原因是各地的氣候條件、基礎設施、居民健康狀況、政府及社區的支持度都不同,甚至溫度對於人體的影響某種程度也因人而異。例如,在荷蘭、比利時及盧森堡,熱浪的定義為連續五天最高溫超過 25 度,且其中至少有三天最高溫超過 30 度,但此定義在低緯度國家可能不適用。有了明確的熱浪定義,政府才能據此定義政策,例如說,在熱浪期間,公司不能強制戶外工作者在白天連續在戶外工作超過四個小時等等,以避免以熱浪引發的職業災害。

NASA 地球觀察 製作了 2016 年 4 月的泰國熱浪的圖片。圖片來源:NASA Earth Observatory image by Jesse Allen using data from the Land Processes Distributed Active Archive Center (LPDAAC). Caption by Kathryn Hansen.

NASA 地球觀察 拍下了 2016 年 4 月的泰國熱浪的圖片。圖片來源:NASA Earth Observatory image by Jesse Allen using data from the Land Processes Distributed Active Archive Center (LPDAAC). Caption by Kathryn Hansen.

很可惜的是,台灣目前還沒有熱浪的明確定義。筆者與台灣其他學者正在執行的台灣熱浪脆弱度評估研究計畫中,我們試著要去量化台灣約 8,500 個村里對於熱浪的調適能力。對於高溫的調適能力與經濟能力及教育程度相關,也與性別、年紀、身體狀況、對熱的敏感度以及環保認知等等相關,因此並沒有簡單的量測方式。

傳統的方式是進行大規模的電話及當面訪問,以抽樣的方式訪談幾百個村里的數千個家庭,期望能找到解釋因子來幫助我們量化每個村里對於高溫的調適能力。但是訪談方法費時耗力,且只能訪談全台不到 0.1% 的家庭,能否建立精準的統計模型也是個巨大的挑戰。

法國 Cattenom 核能電廠。Stefan Kühn 分享於 Wikipedia。 CC BY SA 3.0。

法國 Cattenom 核能電廠。Stefan Kühn分享於 Wikipedia。 CC BY SA 3.0。

結果我們發現,台電的資料竟然可以幫助解決這個問題。台電目前公開的是村里等級多年的住宅用電量資料(每兩個月一筆記錄),我們拿來分析,比較每個村里每年最冷的兩個月及最熱的兩個月的用電量差異,就可以量化 8500 個村里每個村里對於高溫的調適能力,與熱疾病的相關,並找出此調適能力與其它所有社經因子的關係。

延伸閱讀:台電智慧電表「用手抄」,這是哪門子的智慧?

聽起來很美好,竟然可以用電力使用的資料幫助我們快速評估全國人民對於溫度的敏感度及調勢能力,這正是我們所謂大數據應用三個 V:(volume 資料大小、velocity 資料輸出入的速度、與 variety 多樣性) 中的 variety 多樣性所說的,讓資料 re-purpose (再應用) 到其它意想不到的領域,正是大數據應用的美妙之處。

往美濃的客運上國道之後看見的景象:高壓電塔,煙囪,高壓電塔,煙囪,高壓電塔,我們的高雄。

往美濃的客運上國道之後看見的景象:高壓電塔,煙囪,高壓電塔,煙囪,高壓電塔,我們的高雄。安比小姐分享於 Flickr

但是,人生就是有這個但是,很可惜的是,每天氣溫都在變化,因為台電的住宅用電仍然是人工抄表,我們只有每兩個月一筆的用電記錄。所以因為資料的時間精確度不足,在分析結果的精準度上有相當大的犧牲。

延伸閱讀:智慧電表錢從哪來?專家:政府先補貼台電,後讓使用者付費

我們瞭解因為智慧電錶尚未普及,因此在家戶等級,每兩個月一筆用電記錄可能已是台電所擁有的最佳資料。但若我們放大空間尺度,例如說在變電所等級,應該會有在時間尺度上更精確的輸電及用電記錄,例如每五分鐘一筆資料等等,若有這樣的公開資料,不會對於個資有任何危害,但對於許多像我們這樣的研究者,卻可以用這些資料來觀察/瞭解/改善這個社會。因此,對於台電(及其它官營事業)的資料公開及公享,只有期待再期待。

代表圖來源:Guian Bolisay 分享於 Flickr,CC by SA 2.0

@@ACTIVITYID:602@@

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長800至1000字,兩天內會回覆是否採用,文章會經編輯潤飾,如需改標會與您討論。
陳昇瑋

台灣資料科學協會理事長、中央研究院資訊科學研究所研究員暨資料洞察實驗室主持人,研究領域為使用者滿意度、多媒體及社群系統及計算社會學等,在使用者/社群意見及感受的淬取及量化方面持續有代表性的研究創見。

堅信資料及資料分析的價值,長期推廣資料科學及其在各領域的應用,發起台灣資料科學協會及[台灣資料科學年會][1],期能將對於資料科學的熱情傳達給大眾,一起來探索資料科學的潛力,並將資料科學引入每個人的專業領域之中。他期待讓資料分析在台灣不再是口號,而是大家真實拿來解決問題及創造價值的工具。

追蹤我們