為了讓你體驗如今人工智慧裡的自然語言處理有多強大,Google近日發布了語義體驗網站「Semantic Experience」,其中有一個全新的書籍搜索引擎「Talk to Books」,以及兩個基於機器學習的詞彙關聯遊戲。
相比平常我們搜尋一本書,主要是透過書名、作者等關鍵字進行檢索,在Talk to Books裡,我們可以像平常講話一樣輸入一句話,隨後搜索引擎就會對這句話進行解讀和預判,從而給出搜索結果。
也就是說,你可以用「聊天」的方式找到你想要的書籍。
我在搜尋框輸入了一個問題:
What is the best programming language?(什麼是最好的程式語言?)
排在第一位的搜索結果,是一本用C語言編程的書籍,《C Programming for Arduino 》,作者是Julien Bayle。這本書裡有這樣一句話,在搜尋結果中被加粗:
There is no scientific or universal way to define what is the absolute best style of programming. (目前沒有一個科學的或者廣義的方式去定義什麼是絕對好的編程方式。)
在搜尋結果中,能夠回答這個問題的句子或者段落被加粗顯示,下方還有作者及書籍的信息。給我的體驗就是,我們用聊天的方式向Talk to Books提問,然後它用搜尋結果告訴你,這本書裡的這段話,可以回答你的問題,這些或許就是你想要找的書。
在另一個名為「SEMANTRIS」的頁面中,有兩個基於機器學習的單字遊戲Arcade和Blocks。
(Arcade )
玩Arcade時,需要在一定時間內輸入與某個目標詞語最相關的單詞、短語或者句子,越相關得分越高,同時目標詞語會下移。
(Blocks)
Blocks則像是無時間限制的消消樂遊戲。輸入某個單字、短語或者句子後,遊戲會自動判斷頁面上的哪個單詞與之最相關,然後這個單詞所在的方塊,以及相鄰同色的方塊就會被消除。每一次消除都會有新的方塊掉下來,方塊堆積到達頂部,遊戲結束。
「Semantic Experience」這個專案呈現的是機器學習中「詞向量」的技術,這項技術能讓機器更快、更準確地去理解人類的語言。目前Google已經在自己家的人工智慧開源軟體庫TensorFlow上開源了一個預訓練語義的模塊,開發者可以使用自己的詞彙或語句進行實驗,訓練自己的模型。
本文授權轉載自:愛范兒