「行路難,行路難!多歧路,今安在?」 ──李白
這個說法頗令人印象深刻。你不禁跟著想,這是誰說的呢?是真的嗎?如果是的話,那恐怕問題大了。
Quora的討論告訴我們,「最近兩年所創造的資料,占據目前全世界資料量的90%」這個大數據的陳述,是由挪威,也是北歐最大的研究機構 SINTEF的社會心理學家彼得.布蘭采格(Petter Bae Brandtzaeg)2013年所發表在ScienceDaily科學新聞上的一篇報導所指出。
布蘭采格研究員是SINTEF的EU REVEAL計畫的主要參與研究者。REVEAL計畫著重在社群媒體更高階分析所需技術之提升可能性,例如幫助使用者揭露社群媒體當中隱藏的各種「模式」(聲譽、影響力、資訊的信用程度)。
倘若該研究的驚人說法為真,那麼估算國家資源投入資料處理的經濟效益,恐怕會得出一個令人害怕的趨勢:我們對於新型態資料增生速度夠快的領域,投注太少資源,以致於把新領域的主導權全然拱手讓人。以目前資料的增生速度,傳統領域倘若沒有進入「即時」領域來逐鹿中原,競逐資料增生量、資料處理工具的生產、資料產業的專業化、研究人員數量與品質的提升,恐怕在未來的十年內會被快速地邊緣化。
這是一個即時資料對決傳統資料的,不同尺度規模的戰爭。一但進入到即時資料的領域,就像脫離地球大氣層進入無垠的太空一樣,我們便已經跨入到截然不同的生態系統。技術規格決定了行動者所歸屬的區塊叢聚,新的合縱連橫策略聯盟影響著資料工具、商業模式,更決定了應用與發展的未來面貌。
當社群媒體情報資訊已經成為社會裡人與人互動的重要基礎建設,在缺乏研究角度介入、及早審視眾多跨域議題、比較各國脈絡、檢討現況與在地反思的狀況下,只會讓國家力量、市場流動與民眾行動在沒有緩衝的狀況下,直接相撞。國家暴力地收編,或是被動地全面退讓,所帶來的結果都是「多輸」。
人工智慧的基礎在於資料,它的開花結果在於社會大規模的應用。我們想要發展人工智慧產業,但是在底層的資料挑戰上沒有策略,也很難想像放諸全球的應用市場中,怎麼能夠切入承擔關鍵的主導角色。
布蘭采格研究員同時也指出:這些增長快速、份量約九成的資料都掌握在新興的網路公司裡頭。 這導致大部分的資料與知識都掌握在這些網路公司之中。大型機構則是透過Microstrategy公司的Wisdom系統這樣的資料服務公司來取得群體社群媒體資料進行分析,同時避開個人隱私的爭議限制。
擁有這些資料讓新興網路公司可以做各式各樣自動化的工作。除了更加的銳利地分析使用者行為,創造出更具吸引力的商品服務之外,其中也包括聲名狼藉的大數據災難,例如最近才被ProPublica獨立調查報導組織所發現的,自動協助引導客戶針對厭惡猶太人的族群下廣告。
當然,ProPublica的檢視過程也受到大家的關注。在他們的實驗當中,這個可以被勾除的廣告分類只涵括2,300人,Facebook演算法自動建議他們擴大目標群眾的規模,把喜歡擁槍權的民眾納入。而當Propublic在搜尋與「希特勒」相關的分類時,Facebook建議一個「欄位」是「希特勒並沒有做錯」。在這個廣告被審核通過後,Facebook同時也自動地將這個廣告,描述成鎖定在對Antysemityzm(波蘭語的反猶)感興趣的民眾。
我們也不該忘了,最近更為令人喧嘩的是,史丹佛大學人工智慧的論文宣稱能夠更準確地從面相上判斷民眾的性傾向是否為同性戀;雖然這個技術現在還在大學實驗室裡,我們可以猜想在什麼樣的情況下被估算價值,以及多快地會移轉到商業部門。
擁有力量的商業網路公司,掌握了下一個世代的未來科技。這難道不是一個重要的問題嗎?少數的公司找到方法獲致全球性的財富,並且讓全世界的使用者自發性地為他們累積資料。也許最初資料還是一個需要費盡心力,去取得的艱難資產;但是一但這些積累突破了某些門檻,變成一種壟斷式的全球霸權時,我們要怎麼繼續這個場景下去才能夠平衡民粹壓力、不平等競爭的指責與沉默螺旋「站隊靠邊」的問題?
回過頭來看,我們曾經宣稱推動的「兩兆雙星」國家政策,裡頭的數位內容產業,其實缺乏了策略與尺度規模,以及生態系統的脈絡想像。一張張單獨靜態的數位化照片,抗拒被複製,仍舊期待被閉鎖在限制進入的特定空間中,除了在穩定位置的自己人之外,只讓少數進入者得以運用、流通。
無論表演得多麼優雅,那都是一種慢速的滅絕。
這是一個即時資料與傳統資料對決的戰爭, 而技術規格決定了行動者歸屬的區塊叢聚與未來。
李士傑 Shih-Chieh Ilya Li
星輿公司noema.io共同創辦人,網路文化運動者、獨立研究者。前中研院資訊所專案經理、資訊社會學博士研究,過去十年投入開放源碼與數位文化相關計畫。
LINK:EU REVEAL計畫