Google 免費開放語音辨識API,挑戰Siri、Nuance

2016.03.24 by
網易科技
Google 免費開放語音辨識API,挑戰Siri、Nuance
據TechCrunch報導,Google計畫向第三方廠商開發者開放其語音辨識API,與Nuance及其他的語音辨識公司競爭。為了吸引開發...

圖說明

TechCrunch報導,Google計畫向第三方廠商開發者開放其語音辨識API,與Nuance及其他的語音辨識公司競爭。為了吸引開發者,該API一開始將免費提供。

有關該服務的消息已經傳了好幾週。該公司今天在NEXT雲端用戶大會上正式公佈了該項服務。

Google表示,Google雲端語音API(Google Cloud Speech API)將覆蓋超過80種語言,相容任何即時串流或者批次處理模式的應用程式,它將為應用程式提供一整套API,為它們帶來「看、聽與翻譯」方面的功能。它基於目前驅動Google應用程式的語音搜索和Google鍵盤的語音輸入的神經網路技術。它還有一些其他有趣的功能,例如可在嘈雜的環境運行,支援即時運行。

Google的這一舉措將會對整個行業產生不小的影響——尤其是對Nuance。長期以來,Nuance一直被認為是業界最好的語音辨識技術提供商,它也是該領域最大的一間公司。鑒於Google提供的體驗比現有提供商要好,而且定價較低,包括新創公司在內的眾多Nuance客戶有可能會轉投Google技術的懷抱。

為了引起開發者的興趣,Google的語音辨識API一開始將完全免費提供。未來它將要收費,但價格很可能會比較低。Google可能會在成為該行業的主導者之後再上調服務價格。

截至目前為止,Google在其產品中提供的語音技術存取權限十分有限。該公司在去年的I/O大會上發佈了一款語音互動API,讓Android開發者可以為他們的應用加入語音互動功能。不過,Google尚未直接開放它的語音辨識API。

而語音辨識API的推出,將不僅僅影響到Nuance和其它的語音辨識技術提供商,也將會對蘋果造成衝擊。蘋果虛擬助手Siri的語音辨識功能並不如Google的。蘋果目前也沒有透過提供API讓開發者在他們的應用程式中使用Siri技術。

種種跡象顯示,Google似乎變得更加注重語音技術和眾多的使用案例。例如,該公司在2月宣佈將允許Google Docs使用者透過語音來編輯和設計文字檔案

本文授權轉載自:網易科技

每日精選科技圈重要消息