當心!巨量資料可能正在吞噬我們的隱私

2014.03.24 by
有物報告
當心!巨量資料可能正在吞噬我們的隱私
相傳有種食夢獸叫「貘」。牠可以吃掉人類的噩夢,留下美夢。吃了一百個噩夢之後牠會開始長大。現在急速發展的巨量資料技術也在吃掉人類的美夢,留下惡...

相傳有種食夢獸叫「貘」。牠可以吃掉人類的噩夢,留下美夢。吃了一百個噩夢之後牠會開始長大。現在急速發展的巨量資料技術也在吃掉人類的美夢,留下惡夢;吃到一百個美夢後,牠會以 O(100n)開始長大。

 

big_Data_monster
圖片:默伊

到底多巨量?

  • Google 一秒可搜尋 7 百萬筆資料
  • Dropbox 每天檔案上傳達 10 億個
  • Facebook 全球用戶數 12 億人
  • 全球智慧型手機數量超過 19 億隻
  • Facebook 每天增加 27 億個讚
  • Youtube 每天有 40 億次瀏覽 

    擁護者不斷吹捧巨量分析的好處:它能幫助我們節約資源、分析流感疫情趨勢、治療致命疾病、改善醫療保健、提高氣象預報準確度、加強城市安全等,甚至讓我們免於恐怖主義的憂患。

2012年後big.DATA的熱門程度已經超過人工智慧與BI
圖說:2012年後 big.DATA 的熱門程度超過人工智慧與 BI

躲不了監視

在商業上巨量資料分析的例子已不勝枚舉。新產品的市調、價格分析、營銷活動的投放等,當然也有政治運動。歐巴馬 2012 年競選時就利用巨量分析可能選民,精準籌集競選資金,並獲得選票。

誰在收集資料?信用卡公司企業零售通路稅務局,甚至動物園都有罪。分析資料在商業上的價值無庸置疑,但道德上值得商榷。

會員卡是最傳統的資料蒐集工具。結合會員卡、郵遞區號、臉部辨識攝影機,就可以分析出恐怖的精準資訊。比如日本 Lawson 量販店發行會員卡,實際上是為了記錄消費者居住的距離、商品選擇等,以了解「到店距離」與「購買行為」的關係。

台灣的 7-11 在消費者結帳時,也會由店員將客戶分類並輸入資料庫,來進行客層研究分析。

青男壯女 

Google, Facebook 與電信公司

找一天可以做個小實驗,與朋友一起用同樣的關鍵字Google,看看搜尋結果有何不同。Google search 的演算法已經將你過去點選的網頁加到你的紀錄裡面。

同樣的,你每天按讚跟更新狀態時,Facebook 都在密切記錄。當他知道你每天的使用時間、跟哪些人聯絡、看什麼文章、發表什麼言論、打卡地點,可以說 Facebook 對你比你老婆、你爸媽都還要清楚。更進一步的,Google 與 Facebook 已經開始交換使用者資料了。

但最可怕的、擁有最大資料的其實是電信公司。沒有人能躲開電信公司與世界聯絡,所以不論你用什麼手機、電腦、社群媒體、App,電信公司比 Google、Facebook 更能掌握你的一舉一動。包括你講過的話、發過的訊息、聯絡的對象、去過的地方等等,通通可以被記錄下來。

例如今年春運,百度已經能夠利用巨量分析觀察大陸過年時人類的遷移行為了。

百度遷徙

big.BROTHER

「老大哥」監視人民的慾望,數千年沒有變。從明朝東廠,到現代稜鏡(PRISM),只是手段更加高明了。

為什麼稜鏡計畫PRISM)要找上微軟(2007)、雅虎(2008) 、 Google(2009)、 Facebook(2009)、 Paltalk(2009)、 YouTube(2010)、Skype(2011)、美國線上(2011)以及蘋果(2012)?另外,Dropbox 也被指控「即將加入」這項計劃?因為這些公司加起來,幾乎掌握了地球上大部分的人的行為資料。

在美國政府讓科技公司公佈更多安全要求細節後,Facebook、Google、Microsoft、Yahoo、LinkedIn 紛紛提供自己的透明度報告。從這些報告中,可以看到 NSLS 以及 FISA(外國情報監視法)兩法案容許政府向服務商要求提供用戶的基本資訊、訊息、照片等。big.BROTHER 確實是在使用我們的資料。

文化不同,隱私觀念不同

外國經理人到台灣任職時,第一次面試應徵者時都會被台灣人的履歷嚇一跳。在美國面試,面試官不能問你幾歲、結婚沒、小孩幾個、幾歲?家裏有多少人?在美國問這些通通是違法的!

結果我們自己台灣人,每個人在履歷上把身家清白交代的一清二楚。誇張一點的連身高、體重、家譜全都寫上。但在美國,履歷上你的學歷、經驗,就是全部了!可知國情不同,台灣人對隱私的重視相對微小。

麻省理工學院彭特蘭博士(Alex Pentland)說:「巨量資料是新的資產。人們希望它是流動的,而且能為人所用。對於新的跨越式資料收集的突破,將提高對隱私的侵犯,同時引起人們對於隱私侵犯新的擔憂,也是巨量資料潮流裡最重要的問題。」

「沒有不好的數據,數據的唯一不好的是用途。」微軟高級顧問 Craig Mundie 也公開表示。

例如,美國連鎖賣場 Target 能經由消費者行為模式,分析出哪些客戶可能懷孕了,而寄發懷孕相關的促銷廣告。可是如果收到信件的人是未婚懷孕呢?或是她的家庭原本不知道她懷孕?大家興忡忡的蒐集與利用資料,卻可能傷害個人隱私。

問題是,大家不關心巨量資料帶來的影響。許多人對自己的資料被收集無知或漠視。當其他人在努力反對,或要求數據的使用透明化時,其他人不讀,也不去理解。 

匿名與阻隔逆勢而行

過去的「善良年代」時,資料收集時會有一個「匿名化」的過程,讓資料只能用於大數的行銷分析或科學研究,卻不會洩露個資。這種年代已經結束了。現在在美國,只要有生日、性別和郵政編碼的「三重標識符號」,就可以辨識出 87% 的美國公民。

目前國外興起的匿名技術即是一種反撲。國外開始推行的匿名或「用完即銷毀」(像電影裡的情報人員)應用不少,比如 Secret、Whisper、或 Snapchat 等。傳統的「填假資料」也是一種基本的抵抗。以目前人工智慧的演算法來說,部分資料不全的資料分析精確度會大大降低。但將來可不一定。

巨量資料的蒐集與利用,固然可促進公共利益、創造龐大商機,但它也在吞吃你我的隱私。只能說科技發展慢一點,或許是一件好事。人們很容易只看到眼前的好處;日後發生質變時,或許只能消滅它。

轉自:有物報告

每日精選科技圈重要消息