百度開發語音識識系統DeepSpeech,嘈雜環境下識別率超Google、蘋果
百度開發語音識識系統DeepSpeech,嘈雜環境下識別率超Google、蘋果
2014.12.19 | 科技

不久前,百度的首席科學家吳恩達(Andrew Ng)在接受採訪時曾談到了百度最近人工智慧的進展情況,強調了近期百度重點是攻關語音識別。現在他們已經在這方面取得了突破。

這項成果的名字叫做Deep Speech,是一款採用深度學習技術的語音識別系統系統。其獨特之處在於,它可以在飯店等嘈雜環境下實現將近81% 的辨識準確率。

81%的準確率聽起來似乎不算高。但是同樣環境下,其他的商業版語音識別API,包括Bing、Google以及Wit.AI等的最高識別率也只有65%。相比之下這就算十分突出的表現了。而且按照吳恩達的說法,這樣的結果依然低估了Deep Speech與其他語音識別系統的準確率差異,因為Deep Speech進行比較時還把其他語音識別系統那些返回空白字符串的結果排除在外了。而且Deep Speech跟頂級的學術型語音識別模型(基於流行的數據集Hub5'00建模)相比也高出9個百分點。

百度首席科學家吳恩達稱儘管這還只是一項研究,但是公司正在考慮將它集成到供智慧手機和Baidu Eye之類的可穿戴設備使用的語音識別軟體當中。而且百度還在開發與Amazon Echo類似、集成有語音助理的家電產品,名字叫做CoolBox。除此以外,百度在開發的智慧自行車當然也能利用Deep Speech技術。

Deep Speech 的基礎是某種遞歸神經網絡(RNN),這種遞歸神經網絡經常被用於語音識別和文本分析。

但是Deep Speech 的成功主要得益於一個長達10 萬小時的語音數據訓練集。這是百度人工智慧實驗室團隊用新穎的辦法在嘈雜環境下建立的。其過程大致是這樣的。首先百度收集了7000 小時的語音會話數據,然後再將這些語音文件與包含有背景噪音的文件合成到一起,最後形成約10 萬小時的訓練集。這些背景噪音包括了飯店、電視、自助餐廳以及汽車內、火車內等場景。相比之下,Hub5'00 的數據集總共只有2300 小時。

當然,這麼龐大的數據,大多數系統都不知道如何去處理。吳恩達表示,Deep Speech的成功很大程度上要取決於百度規模龐大的基於GPU的深度學習基礎設施。GPU(圖形處理器)往往是偏數學型計算的首選。許多深度學習系統都採用GPU避免通信瓶頸(不過微軟的深度學習系統Adam卻走了不同的路線),但是像百度這樣大規模的設施卻是少見的。

百度的另一大改進,是對這個龐大的數據集採用了點到點的深度學習模型,而不是標準的、計算代價高昂的聲學模型。傳統上一般都會把語音識別分別為多個步驟,其中一步叫做語音調適,但是百度卻不做這一步,而是給Deep Speech 的算法提供大量的數據,然後讓它去學習所有需要學習的東西。這種做法除了收穫了準確率以外,還顯著減少了代碼庫的規模。

這項研究是吳恩達領導的百度人工智慧實驗室多位研究人員的努力成果,論文發表在康乃爾大學圖書館的arXiv.org網站上,感興趣的可到此處下載

本文出自36氪 / boxi

往下滑看下一篇文章
屹立43 年專注標準電源,明緯企業如何以自身優勢並結合創新戰略,實現百年標竿企業的願景
屹立43 年專注標準電源,明緯企業如何以自身優勢並結合創新戰略,實現百年標竿企業的願景

明緯企業(MEAN WELL)成立於1982年,總部位於台灣新北產業園區,是全球少數專注於標準電源供應器的品牌製造商,產品功率含括0.5W~30000W,符合國際安規,被廣泛應用於工控、醫療、資通訊等多種產業;歷經43年的努力,明緯企業不僅在全球各地設立18個銷售辦公室,更設置3個研發中心、5個生產據點、8個物流倉儲、9個技術支援中心,同時,串連全球超過260家經銷夥伴,以「快速交付、安全可靠、隨時可得」的品牌承諾累積服務超過上萬家企業客戶數,穩居全球標準電源市場領導地位。

以客戶需求為核心,明緯企業3策略形塑差異化競爭力

2025年4月,市場研究機構Micro Technology Consultant公布全球電源供應器製造商排名,明緯企業名列第五,與前四名倚賴OEM/ODM模式的電源廠不同,明緯企業是榜上唯一以自有品牌–MEAN WELL–在市場上脫穎而出的企業,背後的三大關鍵策略是:

第一:持續優化標準化產品。明緯企業技服中心課長謝正堂表示:「我們不僅與時俱進的提供多元產品選擇,更專注於精進產品功能與取得最多國際認證,例如今年推出的XDR系列導軌型電源供應器的功率密度便較前一代提升80%以上,目標是讓客戶可以快速取得高性價比的即用型產品。」也因如此,明緯企業不僅提供AC/DC 電源供應器、DC/DC 轉換器、LED 驅動電源、導軌型與基板型電源、電池充電器與逆變器、UPS與電源管理模組、特殊應用電源與周邊配件等標準化產品,更因應工業控制、LED照明、醫療、交通與綠能等跨產業需求取得相應的國際認證,同時,以自動化生產機制進行規模量產以確保成本競爭力。

明緯企業技服中心課長謝正堂
明緯企業技服中心課長謝正堂
圖/ 明緯企業

第二:完善全球經銷網絡與提供在地化支援服務。明緯企業除在全球9個國家設立分公司與辦事處,更與歐、美、亞超過260家經銷商締結深厚的合作關係,由其提供產品銷售、維修與服務,讓企業客戶快速取得所需產品,放心且安心的應用在各個領域。

明緯
明緯企業集團分佈圖
圖/ 明緯

第三:透過虛實整合服務快速回應市場需求。明緯企業除透過官方網站提供完整的產品資訊,如產品型錄與規格書、技術文件、安裝手冊、認證與檢驗資訊,以及產品壽命與相容性資訊等,更於2020年8月推出線上展覽館,讓客戶可以從三大產品範疇、12個展覽館快速找到產品資訊,此外,還可透過線上產品諮詢,大幅提升選購體驗並縮短採購流程,讓企業客戶可以快速因應市場需求變化。

明緯
線上展覽館
圖/ 明緯

「透過可接受少量多樣的標準化產品、全球經銷網絡,以及虛實整合的服務能量,我們不僅形塑品牌信譽,也墊高了同業競爭者的進入門檻,成功以差異化產品服務引領市場發展。」謝正堂如是總結。

不僅提供標準化產品,更協助經銷商轉型為智慧解決方案供應商、滿足客戶創新需求

值得特別注意的是,明緯企業除提供適用於各產業的標準化電源產品,更因應市場需求、攜手經銷商夥伴提供產業所需的解決方案。謝正堂進一步解釋,隨著智慧化產業發展,企業不僅需要標準品,更期望明緯企業與經銷夥伴可以提供完整的解決方案,因此,明緯企業除在廠內實作綠能、儲能系統與智慧燈控等場域,今(2025)年,更進一步協助經銷商夥伴轉型,以協作機器人、智慧自動化工廠、智慧家居、智慧商辦、智慧燈控,以及移動式儲能系統電源等解決方案滿足市場需求。「今年,我們的經銷商–耀毅企業、永鉅電機與中和碁電–將前進2025台灣機器人與智慧自動化展,展示自動化、綠能科技與其他智慧解決方案,協助更多企業智贏未來。」

除透過參展等方式讓全球客戶了解明緯企業與經銷夥伴可以提供智慧解決方案,明緯企業亦積極透過線上展覽館等方式展示以機架式電源(Rack Power)、模組式電源(Modular Power)、系統電源(System Power)三大產品線搭配其他產品,如控制器、智慧管理設備與介面配件等,以「3+N」的概念讓智慧解決方案可以依造客戶需求整合電源模組、控制器、監控與智慧通信等功能。

明緯擁有超過一萬種標準電源機型與全球當地專業技術服務團隊,透過相關技術諮詢服務,可依客戶應用需求提供產品與組合式系統解決方案。

3+N產品涵蓋模組電源、機架式電源、機櫃系統電源等產品,結合數位智能控制器或搭配超過一萬種標準電源機型組合應用,提供多產業應用。

展望未來,明緯企業將持續攜手全球經銷夥伴,以安全可靠、即取即用的高品質電源方案,引領全球標準電源市場潮流,打造共創、共榮、共贏的永續生態系。

了解更多MEAN WELL合作夥伴
立即看線上展覽館

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓