川普勝選讓你跌破眼鏡?Google Trends呈現的大數據早就有跡可循
川普勝選讓你跌破眼鏡?Google Trends呈現的大數據早就有跡可循
2018.03.06 | Google

本文摘自:《數據、謊言與真相》,商周出版

我是網路數據專家,每天都要追蹤人們在網路上留下的數位足跡。從人們點擊或點按的按鈕或按鍵,我試圖了解我們真正想要什麼、我們真正會做什麼,以及我們的真面目。我先說明一下,我是如何步上這條非比尋常之路。

故事要從2008年美國總統大選和社會科學長久爭議不休的這個問題開始說起:在美國,種族歧視有多麼嚴重?

巴拉克.歐巴馬(Barack Obama)是第一位獲得美國主要政黨提名的非裔美籍總統候選人。他輕而易舉地贏得大選,民意調查顯示,種族不是美國人在投票時會考慮的因素。比方說,蓋洛普(Gallup)在歐巴馬第一次選舉前後進行多次民調,民調結果如何呢?基本上,美國選民並不在乎歐巴馬是黑人。選後不久,加州大學柏克萊分校兩位知名教授利用更複雜的數據探勘技術,鑽研其他以調查為主的數據,他們得出類似的結論。

所以在歐巴馬執政期間,媒體和學界大多抱持這種看法。媒體和社會科學家八十多年來用於理解世界的民調資料告訴我們,絕大多數的美國人在決定該選誰當總統時,並不在意歐巴馬是黑人。

在講到偏見這個問題時,基於我在心理學和政治學所讀過的一切,我讓自己相信明確的種族主義只侷限於一小部分的美國人,而這群人大多是保守的共和黨人,多半居住在美國最南端那幾州。

Google呈現的大數據真相,跟你以為的不一樣

然後,我發現Google搜尋趨勢(Google Trends)。

Google在2009年推出這項工具時,並沒有引起太多關注。這項工具告訴使用者任何字詞或短語在不同地點和不同時間被搜尋的頻率。Google將它宣傳為一項有趣的工具──或許讓朋友之間可以討論哪位名人最受歡迎或哪種時尚突然變夯。

當時Google搜尋趨勢似乎並非「嚴謹」學術研究的適當資料來源。不像一般調查,Google搜尋數據的設計宗旨並非是要協助我們了解人類的內心世界,而是要讓人們可以了解世界。但是,我們在網路上尋求知識時留下的足跡,最後反而揭發驚人的真相。

換句話說,人們搜尋資訊,這種行為本身就是資訊。事實證明人們何時何地搜尋事實、引言、笑話、地點、人物、事情或協助,比任何人可能做的猜測,更能告訴我們許多資訊。由於人們有時不僅僅是在Google上進行搜尋,而是在搜尋欄中吐露真心,譬如:「我討厭我的老闆」、「我醉了」、「我爸爸打我」,所以網路足跡就更有真實性可言。 Google數據的強大之處在於,人們會把自己可能不會告訴任何人的事情,告訴這個大型搜尋引擎。

Google搜尋呈現出的美國概況,跟調查所勾勒的後種族烏托邦截然不同。我記得當我第一次在Google搜尋趨勢上輸入「黑鬼」(nigger)時,我想到這個字詞是如此充滿惡意,因此以為自己會看到的搜尋次數並不多。天啊,我錯了。在美國,人們對於「黑鬼」(nigger,複數niggers)的搜尋次數,竟然跟「偏頭痛」、「經濟學家」和「湖人隊」的搜尋次數不相上下。事實上,帶有「黑鬼」一詞的搜尋中,有20%的比例也包括「笑話」一詞,其他常見的搜尋還包括「愚蠢的黑鬼」和「我痛恨黑鬼」。

每年這類搜尋多達數百萬次,大多數美國人在自己家中私密地進行駭人聽聞的種族主義探索。我愈深入研究,得到的資訊就愈令人不安。

在歐巴馬第一次總統大選勝選之夜,大多數評論都專注於讚美歐巴馬和承認歐巴馬此次選舉的歷史意義。這時,包含「歐巴馬」一詞的Google搜尋,每一百則裡就有一則也包括「kkk」或「黑鬼」等字眼。也許這個比例聽起來不是很高,但想想看,人們有成千上萬的非種族主義理由,在Google上對這個有迷人家庭、大爆冷門勝選、即將接管世上最有權勢職務的年輕人進行搜尋。在某些州,「黑鬼總統」的搜尋次數甚至超過「首位黑人總統」的搜尋次數。

Barack Obama
美國總統歐巴馬
圖/ Wikipedia

那些搜尋顯示出的社會現況,跟認為種族主義只占一小部分的社會,有著極大的出入。在2012年時,我聽說過唐納德.川普這號人物,主要因為他是商人和實境節目主持人,我跟大家一樣完全沒想到四年後他會成為舉足輕重的總統候選人。

Google搜尋也告訴我們,我們對於哪些地方種族主義較為嚴重的看法其實是錯誤的。一般調查顯示和人們普遍認為,現代種族主義主要聚集在南方,而且有這些想法者大多是共和黨人。但Google搜尋數據顯示,真正的分歧不是南方與北方,東岸與西岸。換句話說,Google搜尋有助於為美國種族主義畫出一張新的地圖,而這張地圖可能跟你所推測的截然不同。南方的共和黨人或許更有可能承認自己有種族主義,但北方有許多民主黨人也有類似的態度。

2012年時,我使用以Google搜尋設計的這張種族主義地圖,重新評估歐巴馬的種族背景能發揮何種作用。數據清楚顯示,在美國針對種族主義進行大量搜尋的地區,歐巴馬的得票率大幅輸給四年前民主黨白人總統候選人約翰.凱利(John Kerry)。跟這些地區有關的任何其他因素,包括教育水準、年齡、教會出席率或槍枝擁有權,都無法解釋這項關係。種族主義的搜尋並未預測民主黨其他候選人的低得票率,唯獨歐巴馬例外。

這項結果意味著一個巨大的影響。單就種族主義這個因素,大概就讓歐巴馬的全國得票率少掉四個百分點,這項數字遠高於依據任何調查所做的預測。歐巴馬當選及連任總統,當然要歸功於一些情勢對民主黨相當有利,但歐巴馬必須克服的事,遠比依靠傳統數據來源者的認知要多得多。在對民主黨不太有利的年度來說,種族主義者的人數已經多到,足以協助贏得初選或決定大選。

現在,我們目睹了川普的總統就職典禮,我的發現似乎更為可信了。

憑藉關鍵字出現順序,Google搜尋還能用來預測人們想投給誰

Google搜尋甚至可能找出人們會投票給誰的相關資訊。我們真的可以只憑人們搜尋了什麼,就能預測出人們會投票給哪位候選人嗎?顯然,我們不能只是研究哪些候選人最常被搜尋。我跟加州大學洛杉磯分校財務金融系教授斯圖亞特.加布利爾(Stuart Gabriel)發現一個跟人們打算如何投票有關的驚人線索。在川普和希拉蕊.柯林頓(Hillary Clinton)爭取2016年總統寶座選舉期間,有些人搜尋「川普 柯林頓 民調」,有些人則從「柯林頓 川普 辯論」中尋找重點。事實上,人們在搜尋「川普」時,其中有12%的搜尋也包括「柯林頓」一詞,而對「柯林頓」所做的搜尋中,有超過四分之一的比例也包括「川普」一詞。

我們發現這些看似中立的搜尋,其實可以提供我們一些線索,了解個人究竟支持哪位候選人。

怎麼做到的呢?關鍵就是候選人出現的順序。我們的研究顯示,在進行包括兩位候選人姓氏在內的搜尋時,人們更可能將自己支持的候選人放在前面。

在前三次選舉中,比較常出現在搜尋順位最前面的候選人獲得最多選票。更有趣的是,候選人的搜尋順序也能預測特定州別可能由民主黨或共和黨勝出。

那麼,Google預測出川普會當選嗎?這個嘛,我們還有很多研究要做,而且我需要更多研究人員加入,才能知道怎樣充分利用Google數據來預測選舉結果。

但是在網路上,在許多時間點絕對有跡象顯示,川普的得票數可能超出民調預測。

在共和黨大選期間,有線索指出選民可能支持川普。非裔美國人接受民調時表示,他們會用選票展現對川普的不支持。但Google搜尋有關非裔美國人密集地區投票的資訊顯示,會去投票的非裔美國人並不多。在選舉當天,希拉蕊就因為非裔美國人投票率低,而流失不少選票。

甚至有跡象顯示,原先表示還沒決定投誰的選民,最後會投給川普。我跟加布利爾發現,在預期希拉蕊會贏的中西部地區關鍵州,「川普 柯林頓」的搜尋比「柯林頓 川普」的搜尋來得多。後來事實證明,川普當選是因為他在這些州的得票率,遠超過民調預期。

但我認為川普從初選開始就被確認是位成功候選人的主要線索,就跟我針對歐巴馬進行研究揭發的那種隱匿種族主義有關。Google搜尋透露出某些美國人的黑暗面及對少數族群的敵意,而且人數多到足以影響大選。多年來,專家們一直沒有察覺此事。搜尋數據顯示,我們所居住的社會,跟仰賴民調的學者和記者所以為的社會截然不同。這透露出一個令人不悅、可怕和廣泛的憤怒,正有待候選人宣洩出來。

關鍵字: #Google #數位書選
往下滑看下一篇文章
健身產業下一個 20 年靠「數據力」:健身工廠攜手 Teradata、擎昊科技,打造智慧經營新典範
健身產業下一個 20 年靠「數據力」:健身工廠攜手 Teradata、擎昊科技,打造智慧經營新典範

在健身產業競爭日益激烈的今天,品牌之間的差距,早已不再取決於場館規模、器材數量或課程內容,而是誰能更貼近會員需求、誰能運用數據看懂會員的一舉一動,打造更精準、更個人化的服務體驗。

對於這一點,台灣第一家掛牌上市、旗下擁有健身工廠等知名品牌的連鎖運動健身龍頭 —— 柏文健康事業,有著比同業更深刻的體悟。過去 20 年,柏文以「持續創新、重視會員需求」為核心,在台灣健身市場站穩腳步。而面對產業全面走向數位化的新競局,柏文選擇攜手 Teradata 與擎昊科技建置企業數據中台,打破內部數據孤島,將分散在各系統的資訊整合為可以被運用的營運智慧。這不只是一次技術升級,更是從「經驗驅動」邁向「數據驅動」的戰略轉型,為柏文在下一個 20 年持續領跑市場注入關鍵動能。

柏文描繪 20 年健身版圖的 2 大關鍵

自 2006 年在高雄成立第一間健身中心「Fitness Factory 健身工廠」以來,柏文的營運規模就穩步成長,如今健身工廠全台已有 83 間分店、會員數逼近 40 萬大關,躍居台灣前二大健身品牌。柏文健康事業董事長陳尚義認為,深耕在地、持續創新,是柏文能在競爭激烈的市場中持續成長的兩大關鍵動能。

擎昊科技
柏文健康事業董事長陳尚義認為,深耕在地、持續創新,是柏文能在競爭激烈的市場中持續成長的兩大關鍵動能。
圖/ 數位時代

第一是深耕在地、理解使用者的真正需求。柏文非常重視會員體驗,在規劃任何服務與課程時,都從在地使用者的實際需求出發。以團課為例,多數健身場館選擇向國外購買課程授權,健身工廠卻決定推出自有團課品牌 FORCE,由專業團隊設計課程且每季推出不同主題,「雖然成本較高、也比較花時間,卻可以確保課程內容更符合台灣人的體能特性與運動需求,」陳尚義認為,這種重視在地需求的思維,正是柏文與會員建立深度連結的關鍵。

第二是持續創新產品與服務。近年來,柏文以「運動休閒」為核心,不斷推出新的品牌與服務。在場館端,成立各具特色的主題運動場館,例如以彈跳床為主的 Crazy Jump 肖跳、射擊對戰遊戲場 KILL ZONE、保齡球館「滾吧 LET'S ROLL」及 Sklub 運動俱樂部。其中,Sklub 青海店為高雄鼓山區首座全齡運動場館,設有室內頂級羽球場、桌球場、國際級楓木籃球場與多樣化運動課程,而 2025 年 11 月開幕的桃園桃鶯店,更是桃園愛好羽毛球人士的首選。

在服務端,則延伸出協助運動後修復的 SPA 個人工房、運動按摩 Buddy Body 等服務。此外,柏文亦與營養師合作推出營養管理與線上課程,近期更籌備成立電商平台,方便會員與非會員選購運動健康相關商品,逐步擴大「運動 x 生活」的服務版圖。

數位化升級:從服務體驗到營運管理全面轉型

伴隨營運規模的不斷成長,柏文也開始導入各種數位工具,以提升會員服務品質與營運管理效率。舉例來說,會員入場的身份辨識機制,已經從早期的刷條碼會員卡,升級到現在的人臉辨識直接進場。又如,在內部營運流程上,從會員管理、財務到行銷活動等,亦全面透過系統來優化作業效率。

這些數位系統累積的大量數據,成為陳尚義日常決策的重要依據。陳尚義分享,自己經常拿起手機查看當日總營收、來店會員數等營運指標,也會比較各場館的營收與來客數變化。一旦發現某館的數據與預期或平常趨勢不符,便會立即請相關人員說明情況,確認異常原因。

「透過數據定位問題,再及時進行分析與改善,才能確保營運狀況維持在最佳狀態。」陳尚義說,更重要的是,這些數據也成為柏文持續創新的基礎,透過數據掌握會員的行為模式和滿意度,如:會員的運動頻率、續約率等,可以作為發展新產品或新服務的決策依據,使其更貼近會員需求。

擎昊科技
柏文健康事業董事長陳尚義指出,透過數據定位問題,再及時進行分析與改善,才能確保營運狀況維持在最佳狀態。
圖/ 數位時代

導入 Teradata 數據中台,柏文邁向即時決策的關鍵一步

然而,隨著數據應用越來越深,現有系統的限制也逐漸浮上檯面。首先,數據散落在 POS、CRM、ERP 等不同系統,無法有效整合,導致使用者必須在眾多介面間來回切換,相當不方便,也容易影響決策的準確性。其次,系統效能不足,在查詢與分析大量數據時,往往要等候一段時間,導致營運報表無法即時產出,管理層難以掌握最新狀況。第三,報表製作流程高度依賴人工作業,需從多個系統匯出資料再自行整合,不僅耗時費力,也容易出現錯誤。

為克服上述挑戰,柏文決定導入 Teradata AIDW 數據平台,將會員資料、IoT 健身設備、POS 交易資料等數據,全面整合至單一資料庫,徹底解決數據孤島的問題。由於 Teradata AIDW 採用 MPP 架構,可以大幅提升資料整理、分析與查詢效能,再搭配帆軟的報表與視覺化工具,使用者可透過儀表板、動態報表或 API 快速掌握分析結果,讓決策過程更即時、更精準。

柏文資訊長黃靜雯表示,選擇 Teradata 的關鍵原因在於其成熟度與穩定性。「Teradata 的效能非常強大,平行運算能力是經過市場驗證的,而且系統本身具備備援機制,不必擔心單一設備故障的風險。」這讓柏文後續能夠更安心地推動大規模的數據與 AI 應用。

擎昊科技
Teradata 的數據顧問不僅具備扎實的技術能力,更累積了豐富的產業經驗,為柏文的數據應用帶來更多啟發與想像空間。(由左至右)柏文健康事業資訊長黃靜雯、柏文健康事業董事長陳尚義和Teradata台灣總經理陳盈竹。
圖/ 數位時代

除了 AIDW 數據平台,Teradata 亦透過數據整理師服務,協助柏文將不同系統、不同格式的資料進行標準化與模型化,為其推動跨系統的數據整合與應用帶來很大的幫助。黃靜雯補充指出,Teradata 的顧問團隊不僅具備扎實的技術能力,更累積了豐富的產業經驗,能從業務視角提出建議,為柏文的數據應用帶來更多啟發與想像空間。

Teradata 台灣總經理陳盈竹則認為,柏文作為健身產業的龍頭,願意率先導入數據中台並積極擁抱 AI 應用,是極具前瞻性的決策。「面對AI浪潮的快速迭代,我認為柏文做了關鍵決策,透過前期約 6 至 10 個月的時間完善數據建設,作為支撐AI發展的核心競爭力!」陳盈竹強調。

擎昊科技
Teradata台灣總經理陳盈竹則認為,柏文作為健身產業的龍頭,願意率先導入數據中台並積極擁抱 AI 應用,是極具前瞻性的決策。
圖/ 數位時代

數據建設就像是城市的下水道工程,是 AI 應用的發展基礎,而作為 Teradata 原廠授權總代理的擎昊科技,則在這座下水道工程中扮演關鍵角色,負責伺服器運算、儲存架構與網路環境建置等任務,「我們結合 Teradata 的技術與自身的整合能力,為柏文打造更穩定的 IT 基礎建設,確保後續的數據分析能在最可靠的環境中運行。」擎昊科技資深協理杜錦祥說。

陳尚義表示,過去許多決策仰賴現場觀察或管理直覺,但未必能量化決策背後的成本與效益;未來希望透過完善的數據中台,不僅能掌握營運脈動,也能將那些過去難以量化的隱形成本具體呈現,進一步評估每項投入是否帶來實質價值。「以數據與人工智慧取代經驗判斷,將會是柏文邁向下一個 20 年的關鍵競爭力。」陳尚義強調。

圖/ 擎昊科技
圖/ Teradata
圖/ 柏文健康事業

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓