川普勝選讓你跌破眼鏡？Google Trends呈現的大數據早就有跡可循|數位時代 BusinessNext

本文摘自：《數據、謊言與真相》，商周出版

我是網路數據專家，每天都要追蹤人們在網路上留下的數位足跡。從人們點擊或點按的按鈕或按鍵，我試圖了解我們真正想要什麼、我們真正會做什麼，以及我們的真面目。我先說明一下，我是如何步上這條非比尋常之路。

故事要從2008年美國總統大選和社會科學長久爭議不休的這個問題開始說起：在美國，種族歧視有多麼嚴重？

巴拉克．歐巴馬（Barack Obama）是第一位獲得美國主要政黨提名的非裔美籍總統候選人。他輕而易舉地贏得大選，民意調查顯示，種族不是美國人在投票時會考慮的因素。比方說，蓋洛普（Gallup）在歐巴馬第一次選舉前後進行多次民調，民調結果如何呢？基本上，美國選民並不在乎歐巴馬是黑人。選後不久，加州大學柏克萊分校兩位知名教授利用更複雜的數據探勘技術，鑽研其他以調查為主的數據，他們得出類似的結論。

所以在歐巴馬執政期間，媒體和學界大多抱持這種看法。媒體和社會科學家八十多年來用於理解世界的民調資料告訴我們，絕大多數的美國人在決定該選誰當總統時，並不在意歐巴馬是黑人。

在講到偏見這個問題時，基於我在心理學和政治學所讀過的一切，我讓自己相信明確的種族主義只侷限於一小部分的美國人，而這群人大多是保守的共和黨人，多半居住在美國最南端那幾州。

Google呈現的大數據真相，跟你以為的不一樣

然後，我發現Google搜尋趨勢（Google Trends）。

Google在2009年推出這項工具時，並沒有引起太多關注。這項工具告訴使用者任何字詞或短語在不同地點和不同時間被搜尋的頻率。Google將它宣傳為一項有趣的工具──或許讓朋友之間可以討論哪位名人最受歡迎或哪種時尚突然變夯。

當時Google搜尋趨勢似乎並非「嚴謹」學術研究的適當資料來源。不像一般調查，Google搜尋數據的設計宗旨並非是要協助我們了解人類的內心世界，而是要讓人們可以了解世界。但是，我們在網路上尋求知識時留下的足跡，最後反而揭發驚人的真相。

換句話說，人們搜尋資訊，這種行為本身就是資訊。事實證明人們何時何地搜尋事實、引言、笑話、地點、人物、事情或協助，比任何人可能做的猜測，更能告訴我們許多資訊。由於人們有時不僅僅是在Google上進行搜尋，而是在搜尋欄中吐露真心，譬如：「我討厭我的老闆」、「我醉了」、「我爸爸打我」，所以網路足跡就更有真實性可言。 Google數據的強大之處在於，人們會把自己可能不會告訴任何人的事情，告訴這個大型搜尋引擎。

Google搜尋呈現出的美國概況，跟調查所勾勒的後種族烏托邦截然不同。我記得當我第一次在Google搜尋趨勢上輸入「黑鬼」（nigger）時，我想到這個字詞是如此充滿惡意，因此以為自己會看到的搜尋次數並不多。天啊，我錯了。在美國，人們對於「黑鬼」（nigger，複數niggers）的搜尋次數，竟然跟「偏頭痛」、「經濟學家」和「湖人隊」的搜尋次數不相上下。事實上，帶有「黑鬼」一詞的搜尋中，有20％的比例也包括「笑話」一詞，其他常見的搜尋還包括「愚蠢的黑鬼」和「我痛恨黑鬼」。

每年這類搜尋多達數百萬次，大多數美國人在自己家中私密地進行駭人聽聞的種族主義探索。我愈深入研究，得到的資訊就愈令人不安。

在歐巴馬第一次總統大選勝選之夜，大多數評論都專注於讚美歐巴馬和承認歐巴馬此次選舉的歷史意義。這時，包含「歐巴馬」一詞的Google搜尋，每一百則裡就有一則也包括「kkk」或「黑鬼」等字眼。也許這個比例聽起來不是很高，但想想看，人們有成千上萬的非種族主義理由，在Google上對這個有迷人家庭、大爆冷門勝選、即將接管世上最有權勢職務的年輕人進行搜尋。在某些州，「黑鬼總統」的搜尋次數甚至超過「首位黑人總統」的搜尋次數。

那些搜尋顯示出的社會現況，跟認為種族主義只占一小部分的社會，有著極大的出入。在2012年時，我聽說過唐納德．川普這號人物，主要因為他是商人和實境節目主持人，我跟大家一樣完全沒想到四年後他會成為舉足輕重的總統候選人。

Google搜尋也告訴我們，我們對於哪些地方種族主義較為嚴重的看法其實是錯誤的。一般調查顯示和人們普遍認為，現代種族主義主要聚集在南方，而且有這些想法者大多是共和黨人。但Google搜尋數據顯示，真正的分歧不是南方與北方，東岸與西岸。換句話說，Google搜尋有助於為美國種族主義畫出一張新的地圖，而這張地圖可能跟你所推測的截然不同。南方的共和黨人或許更有可能承認自己有種族主義，但北方有許多民主黨人也有類似的態度。

2012年時，我使用以Google搜尋設計的這張種族主義地圖，重新評估歐巴馬的種族背景能發揮何種作用。數據清楚顯示，在美國針對種族主義進行大量搜尋的地區，歐巴馬的得票率大幅輸給四年前民主黨白人總統候選人約翰．凱利（John Kerry）。跟這些地區有關的任何其他因素，包括教育水準、年齡、教會出席率或槍枝擁有權，都無法解釋這項關係。種族主義的搜尋並未預測民主黨其他候選人的低得票率，唯獨歐巴馬例外。

這項結果意味著一個巨大的影響。單就種族主義這個因素，大概就讓歐巴馬的全國得票率少掉四個百分點，這項數字遠高於依據任何調查所做的預測。歐巴馬當選及連任總統，當然要歸功於一些情勢對民主黨相當有利，但歐巴馬必須克服的事，遠比依靠傳統數據來源者的認知要多得多。在對民主黨不太有利的年度來說，種族主義者的人數已經多到，足以協助贏得初選或決定大選。

現在，我們目睹了川普的總統就職典禮，我的發現似乎更為可信了。

憑藉關鍵字出現順序，Google搜尋還能用來預測人們想投給誰

Google搜尋甚至可能找出人們會投票給誰的相關資訊。我們真的可以只憑人們搜尋了什麼，就能預測出人們會投票給哪位候選人嗎？顯然，我們不能只是研究哪些候選人最常被搜尋。我跟加州大學洛杉磯分校財務金融系教授斯圖亞特．加布利爾（Stuart Gabriel）發現一個跟人們打算如何投票有關的驚人線索。在川普和希拉蕊．柯林頓（Hillary Clinton）爭取2016年總統寶座選舉期間，有些人搜尋「川普　柯林頓　民調」，有些人則從「柯林頓　川普　辯論」中尋找重點。事實上，人們在搜尋「川普」時，其中有12％的搜尋也包括「柯林頓」一詞，而對「柯林頓」所做的搜尋中，有超過四分之一的比例也包括「川普」一詞。

我們發現這些看似中立的搜尋，其實可以提供我們一些線索，了解個人究竟支持哪位候選人。

怎麼做到的呢？關鍵就是候選人出現的順序。我們的研究顯示，在進行包括兩位候選人姓氏在內的搜尋時，人們更可能將自己支持的候選人放在前面。

在前三次選舉中，比較常出現在搜尋順位最前面的候選人獲得最多選票。更有趣的是，候選人的搜尋順序也能預測特定州別可能由民主黨或共和黨勝出。

那麼，Google預測出川普會當選嗎？這個嘛，我們還有很多研究要做，而且我需要更多研究人員加入，才能知道怎樣充分利用Google數據來預測選舉結果。

但是在網路上，在許多時間點絕對有跡象顯示，川普的得票數可能超出民調預測。

在共和黨大選期間，有線索指出選民可能支持川普。非裔美國人接受民調時表示，他們會用選票展現對川普的不支持。但Google搜尋有關非裔美國人密集地區投票的資訊顯示，會去投票的非裔美國人並不多。在選舉當天，希拉蕊就因為非裔美國人投票率低，而流失不少選票。

甚至有跡象顯示，原先表示還沒決定投誰的選民，最後會投給川普。我跟加布利爾發現，在預期希拉蕊會贏的中西部地區關鍵州，「川普　柯林頓」的搜尋比「柯林頓　川普」的搜尋來得多。後來事實證明，川普當選是因為他在這些州的得票率，遠超過民調預期。

但我認為川普從初選開始就被確認是位成功候選人的主要線索，就跟我針對歐巴馬進行研究揭發的那種隱匿種族主義有關。Google搜尋透露出某些美國人的黑暗面及對少數族群的敵意，而且人數多到足以影響大選。多年來，專家們一直沒有察覺此事。搜尋數據顯示，我們所居住的社會，跟仰賴民調的學者和記者所以為的社會截然不同。這透露出一個令人不悅、可怕和廣泛的憤怒，正有待候選人宣洩出來。

資訊透明：讓保險回到能被理解的語言

「保險商品本身就很複雜，很多人買了保險，打開保單還是看不懂。」林蔚安指出，國泰人壽累積 800 萬保戶，團隊在梳理客戶旅程時發現，即使擁有多年的資歷與服務經驗，卻未能讓保戶更清楚自己的保障；大多僅在與業務員討論時略有概念，事後又陷入陌生感。因此，「保險視圖」的構想，就是要讓保戶能在同一平台掌握所有保障與資產資訊。

第一步，是處理「看不懂」這件事。diLab 從資料盤點開始，依照生涯階段與保障屬性，將保單內容重新分為「我的健康照護」、「我的保險資產」、與「我的壽險傳承」三大方向，讓保戶以更貼近日常的邏輯理解保障結構，例如「住院時有哪些保障？」。

「調研時發現，國內幾乎沒有成熟案例可參考，國外雖有概念但差異極大。」林蔚安表示，圖表複雜，反而增加理解負擔，因此團隊反覆推敲呈現方式，「要放什麼、怎麼放、放到什麼程度，光這個架構就討論了數個月！」每一個看似微小的改變，背後都是無數次的反覆測試與訪談，「我們帶著不同版本的草稿詢問保戶，在沒有業務員引導下是否看得懂。」最終，團隊定調以金字塔結構建構視圖基礎，從保戶自己的健康保障，到未來可運用的累積資產，最終到照顧家人的壽險傳承。沒有看似花俏的圖表，只希望讓多數保戶好理解的簡單呈現。

但挑戰不只在前端設計，還有保險條款轉譯。傳統保單以商品邏輯分類，與使用者思考「何時會用到」的方式完全不同。為了讓資訊更貼近生活情境，「保險視圖」不再以條款分類，而以場景情境作為基準。例如保戶生病住院時，介面會按照基礎醫療、意外、癌症、重大疾病、長照與壽險等六大結構分層呈現，先呈現核心，再逐層深化，視覺化整體保障全貌，並同步提供現金價值與現金流資訊，形成一套完整的理解脈絡。

風險洞察：AI協助人們看清保障缺口

當保險資訊透過直覺式的設計變得透明，下一個挑戰就是讓保戶理解「自己目前的保障夠不夠」。

因此「保險視圖」也導入保障目標試算功能，保戶只需回答幾題簡單問題，如：住院希望住單人房或雙人房、對疾病治療的費用承受度等，系統即可推算個人的保障目標。接著，AI 會即時計算保障達成率與缺口比例，將複雜的理賠與條款結構轉換成直覺的百分比。「醫療保障達成率 60％」、「癌症保障達成率 45％」，藉由直觀的數字圖表呈現，讓保戶能一眼看出自己保障的完整程度。

此外，平台不只呈現差距，還會以情境推估可能的支出。例如住院五天、手術一次的費用與實際理賠差異，讓保戶真正感受到風險的具體樣貌。「保戶不再是聽到『癌症住院很貴』這種抽象說法，而是看得到具體數字。」透過以場景為基礎的推算，使保戶終於能對模糊的風險概念有畫面，並對理賠內容有更直觀的理解。

平台也提供「熱門推薦」與「 AI 推薦」兩種建議模式。前者以性別、年齡作為分析基礎，後者則依個人資料與既有保單做更客製化的配置。保戶可在平台初步理解現況後，再與業務員討論，透過數位賦能、與有溫度的人性服務建立互補機制，也讓業務溝通更聚焦、更有效率。

領航轉型：戰情室以創新實踐「以人為本」

保險視圖歷經多次迭代上線，雖仍在推廣階段，但初步成效已浮現。以今年 4 月關稅議題為例，資產型保單查詢需求明顯攀升，保戶登入次數從每週平均 4 萬次提升到 5 萬 6 千次，大幅成長40%。以往查詢保單價值需透過業務員協助或臨櫃辦理，如今登入平台即可取得資訊。

此外，視覺化呈現保障缺口後，有保戶回饋「看到達成率 70％，就想補到 100％」，顯示視覺化真正促進了主動管理的行為轉換。

能完成一份視覺化介面不難，但能把 60 多年累積的保險商品結構、條款邏輯與資料系統重新整合再轉譯，背後極度仰賴組織文化。尤其，保險視圖的誕生，從構想到落地，專案歷時 4 年，期間國泰以「區塊化堆疊」的方式逐步發展服務功能，包括資產總覽、健康與壽險視圖、缺口試算與 AI 推薦，每一步都需要長時間協作與反覆推敲。

林蔚安形容：「戰情室就像加速器。」其角色是串聯商品、數據、數位、UI與UX設計、開發工程與行銷等多個團隊，以使用者中心作為共通語言，讓跨部門能在同一個目標下推進。「大家的專業不同，但只要目標一致，就能共同前進！」

展望未來，透明化只是起點。林蔚安指出，下一步是讓更多保戶願意使用平台，使行為軌跡形成數據基礎，再透過個人化推播與 App 串接，發展國泰人壽保戶更完整的數位體驗。「這條路很難，但值得做。」他分享，有一次泰國人壽數位團隊來台交流，第一眼看到保險視圖就說：「這真的很不容易。」但也因此，更突顯國泰人壽勇於創新、以人為本的服務精神。同時，保險視圖也不會是終點，卻會是打開未來保險模式的一把關鍵鑰匙。國泰人壽以具體行動落實「Better Together 共創更好」，在每一項細節中重塑保險服務的日常價值。