百度開發語音識識系統DeepSpeech,嘈雜環境下識別率超Google、蘋果
百度開發語音識識系統DeepSpeech,嘈雜環境下識別率超Google、蘋果
2014.12.19 | 科技

不久前,百度的首席科學家吳恩達(Andrew Ng)在接受採訪時曾談到了百度最近人工智慧的進展情況,強調了近期百度重點是攻關語音識別。現在他們已經在這方面取得了突破。

這項成果的名字叫做Deep Speech,是一款採用深度學習技術的語音識別系統系統。其獨特之處在於,它可以在飯店等嘈雜環境下實現將近81% 的辨識準確率。

81%的準確率聽起來似乎不算高。但是同樣環境下,其他的商業版語音識別API,包括Bing、Google以及Wit.AI等的最高識別率也只有65%。相比之下這就算十分突出的表現了。而且按照吳恩達的說法,這樣的結果依然低估了Deep Speech與其他語音識別系統的準確率差異,因為Deep Speech進行比較時還把其他語音識別系統那些返回空白字符串的結果排除在外了。而且Deep Speech跟頂級的學術型語音識別模型(基於流行的數據集Hub5'00建模)相比也高出9個百分點。

百度首席科學家吳恩達稱儘管這還只是一項研究,但是公司正在考慮將它集成到供智慧手機和Baidu Eye之類的可穿戴設備使用的語音識別軟體當中。而且百度還在開發與Amazon Echo類似、集成有語音助理的家電產品,名字叫做CoolBox。除此以外,百度在開發的智慧自行車當然也能利用Deep Speech技術。

Deep Speech 的基礎是某種遞歸神經網絡(RNN),這種遞歸神經網絡經常被用於語音識別和文本分析。

但是Deep Speech 的成功主要得益於一個長達10 萬小時的語音數據訓練集。這是百度人工智慧實驗室團隊用新穎的辦法在嘈雜環境下建立的。其過程大致是這樣的。首先百度收集了7000 小時的語音會話數據,然後再將這些語音文件與包含有背景噪音的文件合成到一起,最後形成約10 萬小時的訓練集。這些背景噪音包括了飯店、電視、自助餐廳以及汽車內、火車內等場景。相比之下,Hub5'00 的數據集總共只有2300 小時。

當然,這麼龐大的數據,大多數系統都不知道如何去處理。吳恩達表示,Deep Speech的成功很大程度上要取決於百度規模龐大的基於GPU的深度學習基礎設施。GPU(圖形處理器)往往是偏數學型計算的首選。許多深度學習系統都採用GPU避免通信瓶頸(不過微軟的深度學習系統Adam卻走了不同的路線),但是像百度這樣大規模的設施卻是少見的。

百度的另一大改進,是對這個龐大的數據集採用了點到點的深度學習模型,而不是標準的、計算代價高昂的聲學模型。傳統上一般都會把語音識別分別為多個步驟,其中一步叫做語音調適,但是百度卻不做這一步,而是給Deep Speech 的算法提供大量的數據,然後讓它去學習所有需要學習的東西。這種做法除了收穫了準確率以外,還顯著減少了代碼庫的規模。

這項研究是吳恩達領導的百度人工智慧實驗室多位研究人員的努力成果,論文發表在康乃爾大學圖書館的arXiv.org網站上,感興趣的可到此處下載

本文出自36氪 / boxi

往下滑看下一篇文章
高端客鎖定北市大安區 一線品牌+千坪基地成為關鍵字
高端客鎖定北市大安區 一線品牌+千坪基地成為關鍵字

台北房市買氣回流至蛋黃區!在台北市土地資源稀缺之下,僅有靠著都更改建才能整合出大面積的基地,也造就台北市大都更時代來臨,因此頂級地段今年以來湧現指標都更潮。舉凡北市中心今年來精華地段皆有大案重磅登場,受惠於海外回流族群、高資產配置需求,以及市中心舊屋換新屋浪潮,高端住宅仍受到買方青睞,成為目前台北市房市指標。

甲桂林
城市中的超級蛋黃區,指標大案是新富菁英關注焦點。
圖/ 甲桂林

大安區都更大案 獲得在地大安人青睞

以近年北市中心都更改建大案齊發的大安區來看,從富邦藝庭、耑岫、吾雙,再到近期由富邦建設整合推出的稀有千坪基地「富藝居」,皆位處超級蛋黃區。不動產業者表示,對於大安區的客層,不論老錢或新貴不約而同都對大安區都有地緣環境上的偏愛,因此區域房市買氣長年呈現溫和穩健態勢,對此類高端客而言,大安區的指標案正是頂級居所首選標的。依目前大安區預售屋單價多數站上「200 萬俱樂部」,對買家來說,只怕產品不夠好、不怕價高不出手。

房市業者表示,今年台股表現突破新高後,市場游資充足,但受限於貸款環境保守,現下房市回歸個案表現,首先,地段仍是不動產身價保證的必要條件,其次,產品規劃仍是高端客的重點考量,最後,品牌建商的推案也成為建案的身價品質保證。對許多菁英族群來說「富藝居」在生活機能上,不僅串連大安森林公園、信義計劃區、忠孝復興站,在交通上位處捷運大安站信義路軸線,是自然與時尚之間的最核心地段。

甲桂林
自然與時尚,「富藝居」帶動高端住宅生活新體驗。
圖/ 甲桂林

新世代高資產客的購屋思維:大基地、大品牌、多元化

有鑑於大安區大面積素地稀有罕見,長年能大規模推案極少,因此區域呈現量少價穩、具備保值條件,在景氣波動時更顯抗跌優勢,加上「富藝居」產品定位為 27 至 45 坪二至三房的中小坪數規劃,不僅符合現下市場剛性需求,更能滿足高端菁英的多元資產配置需求。

甲桂林
「富藝居」產品多元化,讓高端客群資產佈局更靈活。
圖/ 甲桂林

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓