科技媒體Mashable創建於2005年7月,其創始人是當時年僅19歲的蘇格蘭人皮特.卡什莫爾(Pete Cashmore)。在那之前皮特沒有任何媒體工作經驗,網站主要從社群網路上追蹤最受使用者關注的科技公司新聞。到現在,Mashable 在全球的Alexa排名已經達到516名,成為世界上訪問量最多的媒體之一。
不走傳統新聞操作,而是根據社群媒體熱門內容挑文章
正是因為Mashable的創始人沒有任何媒體從業經歷,這個科技媒體才沒有從傳統媒體那裡繼承任何過時的新聞操作方式。在Mashable創辦初期,整個團隊20多人每天最重要的工作是在Facebook、Twitter和LinkedIn等社群網路上查看自己關注的大量使用者都在轉發什麼內容,並根據熱門內容撰寫相關的文章。
後來隨著現任CTO羅賓.彼得森(Robyn Peterson)的加入,Mashable開始使用自己開發人工智慧工具來代替團隊每天在社群網路上追蹤內容的工作。羅賓帶領研發團隊設計了一個人工智慧資料分析系統Velocity,透過自然語言理解技術分析社群網路使用者對相關事件的討論,並透過視覺化的圖表向編輯部預測可能會爆發的熱點內容。
開發人工智慧追蹤數據、預測話題熱點
在今年的騰訊網媒體高峰論壇上,羅賓接受了《PingWest品玩》的專訪,並詳細解釋了Velocity系統的工作原理。羅賓表示Velocity會根據社群網路上的分享和討論生成一個熱度曲線,它其實很類似於經濟學中的供求曲線,橫軸代表時間,縱軸代表需求量。相應的,當某一個話題的需求量(熱度)提升時,Mashable就會生產相關的內容進行「供應」。
「舉個例子,透過分析我們預測到接下來一個關於食品比較大的事件有可能是《紐約時報》上所發表的轉基因番茄的故事,現在關於這條新聞的轉發量只有幾十條,但我們的系統可以預測到接下來幾個小時它的轉發量將達到上萬。」羅賓說。
使用自然語言處理等人工智慧技術的基礎是能夠擁有大量資料,Volecity每天能夠分析300萬個不同頁面的連結資料,這些連結包括社群網路貼文、文章、圖片和影片,並從中分析出下一個熱點。
2012年12月,羅賓曾在Mashable上發表了一篇文章稱媒體應該像程式師做產品一樣生產內容。在這篇文章裡,羅賓給了正在衰落的媒體公司四點建議,分別是:社群網路比搜尋引擎更重要、擁抱行動網路、提供個性化的廣告和以產品為主導生產內容。
羅賓認為媒體公司的衰落主要在於工程師幾乎不為媒體公司工作來幫助他們創造更好的資料探勘工具,但換句話來說,就是媒體公司根本就不重視工程師和產品經理的作用。但沒有任何傳統媒體基因的Mashable卻利用資料探勘工具和演算法成為了新媒體裡的佼佼者。
在Mashable的網站上,每篇文章下面都會有一個小小的曲線圖表,讀者可以直觀地看到與這篇文章相關的話題的熱度變化。但羅賓解釋道,這個曲線本來是給編輯作為內部參考的,只是初期將它放在了前臺給一個概念。但後來Mashable的讀者都習慣了這個小圖表,甚至在他們取消掉圖表後發出了抗議,所以這個圖表就被保留了下來,成為了Mashable的一個特色。
在中國,將人工智慧演算法和新聞編輯結合起來的公司同樣有很多,其中最成功的非《今日頭條》莫屬。羅賓表示,自己並不知道《今日頭條》這家公司,但他很贊同《今日頭條》用機器和演算法輔助人類編輯的做法。但他認為在新聞編輯這件事上,人的作用應該比演算法重要,而機器只能起到輔助作用。
「拿Mashable舉例,我們是在這個話題之前收集大量資料進行分析,對這個話題進行預測。這個過程中,我們預測的是人的一些行為。所以我認為我們仍然還是需要人的參與的,我們需要作者和影片製作人員為我們提供有意思的資料,或者說他們來觀看這些資料,來分享這些資料。在這個過程中,可能這些新的分享會給他們帶來一些啟發,給他們帶來一些興奮點,這個過程中他們可以創造更新的東西出來。」羅賓說。
是否擔心過於仰賴演算法造成回聲室?「會盡量做到中立。」
針對演算法和大資料過多的干預編輯是否會造成媒體過於以讀者的興趣為導向,羅賓認為這種情況存在,但最終還是取決於使用工具的人。「你說的這種情況或許在Facebook上是存在的,例如在這次美國大選中,你的資訊流裡幾乎只會出現你支持的觀點,而其他人的觀點是被過濾掉的,我們把這種情況叫做『迴聲室』(echo chamber)。但Mashable是一個面向大量讀者的新媒體,我們認為演算法不能用這種危險的方式來控制人們能夠看到哪些資訊,所以我們會儘量做到中立。」
羅賓認為,人工智慧演算法和大數據能為媒體帶來的最大幫助是效率的提升。「這幾年來媒體公司的日子都不好過了,很多媒體開始大規模裁員。在這種情況下,演算法和資料能夠説明編輯部甄選出值得關注的新聞,並讓他們集中精力在相關領域生產出更深度的新聞,同時也能讓媒體在保持稿件數量的情況下保持品質。」羅賓說。
本文授權轉載自:PingWest