《紐時》記者:我用Google搜尋了一下自己,發現我「死」了

2017.12.20 by
愛范兒 ifanr
愛范兒 ifanr 查看更多文章

愛范兒連接全球創新者及消費者,跨界技術、文化、消費及創新,致力消費科技領域的產業評論、產品報導及社群連接,創造高品質的消費樂趣。

愛范兒
Google一個詞條錯了,把《紐約時報》記者Rachel Abrams的照片配上錯誤的人物資訊,Rachel想改卻求助無門,修改居然難如登天?

Google以為我已經死了。但我想告訴它,我還活著。

這來自《紐約時報》記者Rachel Abrams的一篇「公開吐槽信」。上週的某一天,這位記者驚愕地發現,自己在Google的搜尋結果中,默默地「被死亡」了。

在把自己的名字「Rachel Abrams」鍵入到Google的搜尋框中之後,頁面顯示出了她在《紐約時報》網站上的工作證件照片,但關聯到的人物介紹卻是另一個同名的美國作家。而這位「Rachel Abrams」,已經於2013年去世了。

我的父親很詫異地給我發了一則確認的簡訊,身邊的熟人也提醒我去查看這條顯示我已經「死亡」的信息。我意識到,這個錯誤可能必須得去更正一下了。

於是為了證明「自己還活著」,她開始了「維權」之路。

漫漫「維權」路

由於這個錯誤出現在Google的搜尋結果中,找Google糾錯就成了Rachel能想到的首要解決方案。

但她很快發現,作為全世界最知名的科技公司之一,Google並沒有提供客服熱線這種東西。相反,他們更傾向於使用自助式的「線上回饋」。

我不是很能肯定,在這麼多的「回饋」(Feedback)選項中,到底哪一個才真正適用。

(在Google搜尋結果中點擊「回饋」之後,頁面會出現數量眾多的選項按鈕。)

「他們可能確實在某個地方有提供這樣的電話號碼,但是他們的確更希望大家可以透過網路或者線上的管道來解決問題。」ReputationDefender公司的負責人Rich Matta說道。他的公司,專門幫助用戶修改他們在網路上的不實訊息。

從我多年的經驗來看,這種沒有涉及非常明顯的違法或侵權行為的申訴,往往很難透過提交糾錯申請來達成。大多數人會被過程中的各種複雜狀況或者問題所困擾,他們甚至不知道該從何做起。

這樣的問題就發生在Rachel的身上。

她先是嘗試聯絡了Google的公司聯絡部門,表明了自己的記者身份和遇到的問題。隨後,一位Google發言人回覆給她一個連接,這個連結指向了Google知識圖譜(Knowledge Graph)的幫助頁面。

Google知識圖譜是Google於2012年推出的一個訊息知識庫,透過語義檢索從多種來源中收集信息,以提高搜尋的精確性。包含有她錯誤信息的頁面搜尋結果,就來自Google知識圖譜。

當她按照那位發言人的建議進入知識圖譜的幫助頁面填寫回饋時,問題來了:想要修改詞條需要先確認自己的身份,而在確認自己身份的四個選項中,她陷入了某種「自我認知障礙」。

選項一:你是這個詞條相關的官方網站、YouTube頻道或者Google+頁面的所有者。(好像不太對)
選項二:你是以一個官方、所有者的身份登入Google的。(這個好像也不對)
選項三:你的網站或者app仍然在活躍狀態。(不懂這是什麼意思)
選項四:你被添加進了官方網站的搜尋控制台。(???)

一頭霧水的她決定先隨便選一個。然後在頁面的末尾,她終於找到了一個可以讓她自己填寫申訴緣由的頁面,而這,還是用來回饋前面「自助服務」是否有用、如何改進的地方。

很顯然,這個舉動並不能幫她解決問題。於是,她決定直接給Google總部打個電話。

雖然又經歷了漫長的熱線等待,但她終於找到了一個人類員工接電話。這位Google員工,再次讓她填寫一份線上幫助表格,而且,最好是能在接下來的一段時間持續不斷地反覆提交,盡量使用不同的IP位址,或者讓朋友幫助你提交。只有這樣,才能透過「高關注度」來把申訴頂到前面去,引起重視。這位員工還好心地提醒她,這種修改知識圖譜的操作,可能會花費最短三週、最長三個月的時間。

終於,她真的太生氣了,決定直接寫信給Google CEO Sundar Pichai。同時,好好利用一下自己的記者身份,把整件事寫下來,製造一些「輿論壓力」。

這一次,她的努力終於有了點回報。雖然沒能等來Pichai的回覆郵件,但幾個小時之後,她的照片被從錯誤的頁面上撤了下來。

終於成功「復活」了。

知識圖譜真的靠譜嗎?

整件事情看下來,雖然Rachel吐槽的點集中在Google的錯誤回饋系統,但如果從源頭開始算起,最先出錯的,其實是那個被視為Google新一代搜尋核心的知識圖譜(Knowledge Graph) 。

自從2012年正式發布之後,這個幾乎是海納百川的大型知識信息庫,就成為了Google原來基礎搜尋的強有力的補充。用戶可以省去自己篩選結果的過程,直接看網頁右側由知識圖譜生成的「小百科」。

根據介紹,Google知識圖譜主要有以下幾種數據來源:

  • 以詞條為基礎的大規模知識庫(包括維基百科、Freebase、DBpedia、YAGO 以及其他專業領域知識庫等)
  • 線上連結數據(即在開放互聯的萬維網之中的多個數據連結)
  • 網頁文本數據

在這幾種動態數據源的支援下,知識圖譜所收錄的數據信息在不斷地更新,在2012年剛發布的時候就已經收錄了超過5億個詞條和多達35億條信息量。海量的數據,意味著知識圖譜所帶來的搜尋結果將更加精準。

更為重要的是,知識圖譜並不像傳統的搜尋引擎一樣,只是機械式地提供相關的匹配結果,它利用多種智慧信息處理技術,比如實體鏈指(Entity Linking)、知識推理(Knowledge Reasoning)等,更加「聰明」地為用戶提供他們真正需要的搜尋結果。

負責這個專案的Google高階副總裁Amit Singehal把這種全新的搜尋體驗歸納為三點:找到正確的東西、得到最好的歸納總結、走得更深更遠。在知識圖譜的介紹文章中,他寫道

借助知識圖譜,我們可以透過實體(things)而非字符串(strings),去了解現實世界中的各種事物,以及他們之間的關係。

舉個簡單的例子,當我們搜尋「蘋果」時,加入知識圖譜的搜尋結果,除了會顯示作為水果的蘋果之外,還會自動匹配出科技公司「蘋果」,以及與蘋果公司相關的資訊、商店等信息。這是一個經過篩选和重組的完整知識塊,具有邏輯和條理,所包含的語義也更豐富。

在更進一步的應用中,它還可以實現更加智慧的基於知識庫的自然語言查詢。比如當你直接在搜尋框中輸入「湯姆·克魯斯有多高」時,返回的結果就是「170公分」。

除了Google之外,引入知識圖譜正在成為搜尋引擎界的一個發展趨勢。百度的「知心」,搜狗在娛樂和醫療領域的知識圖譜,都利用了同樣的原理。

但海量數據的加入也意味著,它們之間的邏輯連結會變得更加複雜。知乎上一位從事Google知識圖譜開發的工程師就認為,目前最難也最需要抓緊解決的問題,就是「如何將來自不同數據源的相同實體聚類」,比如電影數據中的「劉德華」,和音樂數據中的「劉德華」,就需要利用自動化的演算法來聚合在一起。

Rachel的這次「被死亡」,正是在這個環節出了問題。她的照片雖然也對應著「Rachel Abrams」,但顯然不是在搜尋那位已故的作家時,應該出現在知識圖譜結果中的正確匹配信息。

除了基於計算機深度學習的自動匹配之外,Google還為知識圖譜加入了人工編輯和校對。但為了盡量避免人工操作所帶來的潛在問題,他們也採取了一系列比較嚴格的審核和糾錯機制。在回覆Rachel的申請時,Google發言人就提到

要在加快修改速度和保證結果的準確性之間尋找一個平衡點,是一件非常重要的事情。

但考慮到用戶的使用體驗,還是希望Google能夠改進一下用戶的回饋機制。畢竟不是每個人都能像Rachel一樣,可以直接在《紐約時報》上發文章喊話。

本文授權轉載自:愛范兒

每日精選科技圈重要消息