這個用上機器學習的學術搜尋引擎,會比Google更好用嗎?

2016.11.14 by
好奇心日報
好奇心日報 查看更多文章

你的頭條新聞可以不只是些無聊事,讓好奇驅動你的世界。所有新聞的報導和解讀均由專業作者原創撰寫,鎖定全球範圍影響你日常的公司變化、新聞事件和產品資訊。

shutterstock
微軟聯合創辦人Paul Allen做的免費學術搜尋引擎 Semantic Scholar涵蓋的學科從電腦科學擴展到了腦科學,計畫在 2017 年前覆蓋生物學科。這個搜尋引擎用上了機器學習的技術,希望減少科學家的檢索論文的時間。

人工智慧已經變成了科技公司談論的熱詞,包括 Google、亞馬遜、微軟等。現在,即便是像 Google 學術這類的學術研究用的小眾搜尋引擎,也開始使用人工智慧了。

簡單來說,學術搜尋引擎跟普通用戶使用的 Google、百度等沒有差別,但檢索結果來自於期刊、學術會議資料或者是學術機構的文獻。

最近的消息是,微軟聯合創辦人 Paul Allen 做的免費學術搜尋引擎 Semantic Scholar 涵蓋的學科從電腦科學擴展到了腦科學,計畫是在 2017 年前覆蓋生物學科。這個搜尋引擎用上了機器學習的技術,希望減少科學家的檢索論文的時間。

為了提升用戶的效率,除了利用作者、出版商標注的關鍵字這種常用的方式外,Semantic Scholar 將機器學習的技術花在了資訊篩選上,例如用電腦視覺等技術搜尋論文發佈的會議名稱、論文發佈的時間,從論文文中篩選出關鍵字句等。這讓搜索結果的資訊看起來更加豐富。

對於科學研究人員來說,Semantic Scholar 看上去最大的用處是有更多資訊篩選的角度,包括論文的影響力,媒體報導(Twitter 資料)、作者等,另外它直接提供圖表預覽,看起來能方便研究人員省下更多篩選的工作。

截圖自Semantic Scholar
Semantic Scholar和Google學術搜尋的結果比較。
截圖自Google

Semantic Scholar 是 Paul Allen 創立的非盈利研究機構 AI2 推出的產品,這個搜索專案背後的團隊有 70 人,Paul Allen 已經為這個機構提供了 2000 萬美元。

從提供的文獻檢索數量、搜尋引擎的性能來看,Semantic Scholar 還在相當早期的階段。去年 11 月份推出這個產品時,AI2 機構的 CEO Oren Etzioni 稱,這個搜尋引擎能檢索到 80% 的免費論文文獻,大約有 300 萬份,在數量上遠不及 Google 學術。

這可能是學術搜尋引擎這個細分市場的趨勢。另一家覆蓋生命科學、醫療等領域的學術搜尋引擎公司 Meta 在去年 11 月拿到了 Google 等投資的 600 萬美元,稱他們用機器學習檢索醫療論文中的人名和物件,並根據使用者此前閱讀的論文推薦相關論文。

當然,專業的學術搜索在搜尋引擎領域也是個比較小的市場,競爭就更加激烈了。搜尋引擎 Bing 早前也有類似的學術搜索,但運營 5 年後宣佈關閉,功能併入 Bing 搜索。現在,能不能用人工智慧這項新技術獲取更多的使用者,是這些搜尋引擎需要考慮的問題。

本文授權轉載自:好奇心日報

每日精選科技圈重要消息