部落格搜尋的專家

2006.04.01 by
數位時代
部落格搜尋的專家
部落格,這個在幾年前還相當新鮮的名詞,已經變成一股巨大的力量,影響著網路產業的發展。在過去,單獨的網路使用者總是處於接受資訊的角色,言論的產...

部落格,這個在幾年前還相當新鮮的名詞,已經變成一股巨大的力量,影響著網路產業的發展。在過去,單獨的網路使用者總是處於接受資訊的角色,言論的產出和主導權掌握在大型組織或媒體的手中。部落格概念出現之後,網路上所有個體得以輕易地自由發聲,表達自己的意見。然而,這樣的改變導致一個結果——部落格數量以前所未見的速度在成長,多到需要專門的搜尋引擎。
Technorati就是這個需求之下的產物,成立於二○○二年,是全世界第一個部落格搜尋引擎,也是目前最大且瀏覽量最多的網站之一,每天吸引超過七十萬人次造訪。

滿足潛在的搜尋需求

和許多網路公司一樣,Technorati的創立也是源於「一時起意」。「二○○二年部落格剛開始起步的時候,我便開始寫部落格了,因為我很討厭電子郵件只能一對一的特性,」Technorati創辦人大衛.賽弗萊(David Sifly)說:「但令人挫折的是,在主流搜尋引擎上居然找不到我的部落格,而且我也不知道是否有其他部落格連到我這裡,於是我決定自己創造一個部落格搜尋引擎。」
事實證明,賽弗萊很有先見之明,搜尋部落格的確是網路應用的潛在需求。Technorati上線一年左右,就已經有九十萬個部落格可供搜尋,接著以每五個月就多一倍的速度壯大。根據最新的統計,目前網站資料庫內已經有大約三千四百萬個部落格,追蹤超過二十二億個網路連結。

與網頁搜尋技術大不相同

一般網頁和部落格的網頁屬性不太相同,因此搜尋部落格的技術也跟一般搜尋引擎不太一樣。傳統的搜尋引擎(如Google)利用一種俗稱spider的軟體,將網路上所有的網頁建立索引(index),以便日後搜尋。但是這個工作非常耗時,通常需要好幾天來作業,因此無法跟上部落格更新的腳步。由於部落格網頁都會有按時間順序排列的固定格式,每一次有新的文章就會送出一種名為「ping」的訊號,Technorati於是和眾多BSP(Blog Service Provider,部落格服務提供者,如無名小站)合作,透過追蹤這些訊號來完成即時且永不間斷的部落格搜尋工作。
另一個關鍵的技術是近兩年很熱門的標籤分類法(Tagging),多數的部落客會在每一篇文章(post)和部落格網頁貼上關鍵字標籤(例如美國總統布希發表演說,就可以加上「president」和「Bush」兩個標籤),Technorati利用這些標籤,就可以輕易地將每一篇文章和每一個部落格分類,方便網友搜尋。

相互串連的個人媒體

除了尋找部落格之外,Technorati最重要的功能是追蹤部落格之間的相互連結,並且會進行排名(ranking)的統計。雖然這些都是搜尋引擎必備的能力,但是在部落格搜尋上卻別具意義,因為部落格骨子裡的媒體性質,這些連結象徵著意見的交流和觀念的引用(reference),而且是具有深度的(要引用別人的部落格文章,至少得先看過,並且在自己的部落格上發表才行)。「部落客都會想知道,誰在看我寫的東西?讀者反應如何?」賽弗萊指出,「傳統搜尋引擎辦不到這件事情,因為它們只能追蹤網頁間的連結。」
為了充分展現社會性,在Technorati上還可以建立自己最喜歡的部落格名單,與他人分享。在Technorati的連結數,甚至已經變成業界衡量部落格影響力的優先考量指標,重要程度可見一斑。

每天吸引約七十萬人次

以使用頻率來看,Technorati還不及Google的百分之一,但目前為止,Technorati算是經營最成功的垂直式搜尋引擎之一,每天約有七十萬人次造訪、追蹤一百二十萬篇新的部落格文章。現階段的商業模式還集中在網路廣告和贊助,不過已經逐漸開始轉移目標,藉由提供企業客戶部落圈(blogsphere)對公司以及產品服務的評價來獲利。
當然,Technorati也並不是完全沒有競爭對手。Google在去年九月推出了部落格搜尋引擎,在網路上也有兩、三家業者提供類似的服務,但是論及服務完整性和市占率,Technorati可說是獨占鰲頭。以目前的時間點來看,全球部落格正處於成長的高峰期,Technorati的成功不僅為垂直式搜尋引擎樹立了良好的典範,也意味著未來部落格搜尋還有許多成長的想像空間。

每日精選科技圈重要消息