中國智慧音箱的演變混戰史

2019.08.21 by
極客公園
中國智慧音箱的演變混戰史
極客公園
語音互動、語音辨識被視為未來智慧的一大技術,智慧音箱伴隨著此科技的重視,也成為科技巨頭與新創公司們角逐的一塊領域,而在中國這幾年來智慧音箱又經歷了那些重要的變革?

從2017年開始,在中國智慧音箱市場的觀察家眼中,幾乎每一年都是以「爆發元年」的希冀開場,再以「即將真正到來」收尾。在這種起起伏伏的半推半就之中,我們經歷了短暫的「百箱大戰」,繼而一個披沙揀金的新時代在不知不覺中到來。

倘若亞馬遜Lab 126實驗室當初沒有為Echo注入靈魂,過往兩年的智慧音箱大戰也無從談起。語音助手為藍牙音箱提供了AI大腦,而網路公司更在意萬物互聯和智慧家居。無疑,智慧音箱徹底攪動了產業鏈上下游。故事裡,寫盡了網路巨擘間的激烈角逐,也插敘了新創公司的生不逢時,以及各家遭遇圍剿時的羸弱、變通和逆轉。

2017年,中國智慧音箱市場萌發,百餘家公司輪番上陣;競爭在2018年刺刀見紅。語音互動的早期,智慧音箱被寄予了點石成金般的期許。兩年過去,智慧音箱的新時代因為一塊螢幕的存留增減,變得比過往兩年更加有趣又迷離。

儘管業界在智慧音箱的證明與證偽之間的拉鋸從未停止。「傳統音箱+智慧語音助手」的搭配,也曾讓萬千創業者以為風口降臨,人人皆可分羹。可三年過去,市場上的金牌賣家僅剩巨頭。過往參與者的存亡絕續,大多是一部血淚史。

當我們談起智慧音箱新時代,目前出現了三種斷代理論:從無螢幕到有螢幕的物理區隔,從百箱大戰到三足鼎立的格局鎖定,以及從偽智慧到真智慧的華麗蛻變。這三種不同邏輯的劃分,都能自圓其說。

而無論瞄向哪種視角,智慧音箱2.0時代終究還是來了。

搭載語音助手Siri的蘋果智慧音箱HomePod | 視覺中國
極客公園

混戰與鼎足後的各自歸位

過去兩年,巨頭用補貼為代價,在智慧音箱市場培育方面初顯成效。根據全球知名市場分析公司Canalys在2018年5月發布的報告指出,中國已在2018年躍升為全球第二大智慧音箱市場。儘管亞馬遜和谷歌仍是這一領域的雙雄,出貨量分別為2,420萬台和2,340萬台,但起步較晚的阿里巴巴、小米和百度在去年迅速躋身市場前五,截至2018年年底的出貨量年分別為890萬、710萬、360萬。

2017年,中國智慧音箱的市場尚處於早期開墾階段,全年出貨量為150萬台。其中前10個月的銷量只有區區10萬台,其餘140萬的增量幾乎全部來自於小愛同學和天貓精靈。與此同時,「價格戰」成為了關鍵詞。以小米為首的持續性低價策略,為智慧音箱在來年迎來井噴式成長,立了一等頭功。

早在2015年5月,距離Echo正式發售的還差一個月,京東和科大訊飛聯合成立的合資公司靈隆科技,率先在中國推出了叮咚智慧音箱,開啟了中國智慧音箱的篇章。2016年,「叮咚」小試牛刀,10萬台的全網銷量在當時絕對具有里程碑意義。

彼時,普通消費者剛剛搶購到蘋果公司的最新款智慧型手機iPhone6。時代背景是,中國用戶還不習慣開口與Siri你來我往,更沒有察覺到電子產品和語音助手的曖昧關係

京東押下了重註,在科大訊飛語音技術的加持下,叮咚智慧音箱更新又換代,產品把控和市場反響不賴,可後來卻退居二線,淡出消費者視野,令人不解。曾有消息傳出,叮咚內部的動盪和調整反反覆覆,公司缺乏清晰的路線指引,是導致叮咚「落水」的主要原因。

「叮咚」之後,智慧音箱的劃時代事件發生於2017年7月26日——小米正式發布了首款智慧音箱「小米AI音箱」。人民幣299元(約新台幣元)的瞠目低價,擊穿了這一品類當時的價格底線。小米智慧硬體部總經理唐沐曾表示:「智慧音箱作為公司的戰略可以不賺錢,音箱的定價邏輯遵循售價不低於硬體堆料和工廠加工費的總成本價的原則,而研發成本完全由小米自行承擔。」

先於小米AI音箱三週發布的天貓精靈X1,出自阿里之手,其售價比小米高出人民幣200元(約新台幣1,327元)。而在2017年的雙十一購物狂歡夜,天貓精靈自編自導了一場「攻守道」。抹去百位數字,搶購價僅需99元(約新台幣440元),當天8時53分,阿里宣布天貓精靈總銷量突破100萬台。

智慧音箱上演價格戰,產業遭遇透支|視覺中國
極客公園

自此,智慧音箱的價格補貼進入了常態化。當巨頭掌控了智慧音箱定價規則和話語權時,參與團戰的小型玩家潰不成軍。其中,中高價位的智慧音箱品牌受到的衝擊最為明顯。因為恪守產品調性而拒絕向低價位妥協,這類音箱也未能博得消費者的廣泛認可,一些第三方智慧音箱品牌和創業團隊因此折戟沉沙。

在技術啟動期,隨著關注度的提升,資本的湧入助長了智慧音箱的市場泡沫。相關專家曾表示,那些沒有從用戶需求出發的產品,不久後必然會遭到淘汰,恐殃及九成以上的企業

喜馬拉雅副總裁兼硬體事業部總經理李海波在2017年的一次採訪中,曾感慨智慧音箱的虛火過旺。

低價讓利消費者帶來的負面效應很快出現。在一些消費者心目中,智慧音箱似乎淪為低廉的代名詞。百度、阿里、小米在2018年上半年等紛紛推出了mini版智慧音箱,價格從69元(約新台幣307元)到169元(約新台幣750元)不等,靠低價嚐鮮的策略打動那些「可買可不買」的消費者。

可如果沒有低價作為支撐,智慧音箱恐難創造出這樣「加速度」。以補貼、低價為主導的網路策略早已司空見慣,野蠻粗暴,屢試不爽。當然,這條成長通道只配巨頭擁有。

百度早期通過收購渡鴉團隊佈局智慧音箱賽道,但以失敗告終,圖片為渡鴉Raven-H | 視覺中國
極客公園

智慧音箱自此進入了寡頭時代,那些僥倖存活的企業不得不向B端市場轉型。Rokid和出門問問就是兩家典型代表。

例如Rokid參與研發了360今年3月發布的智慧音箱——MAX,提供了Rokid自研的AI晶片KAMINO18和AI開源操作系統YodaOS。此外,研發團隊為MAX定制了雙喚醒詞,並應用了聲紋識別技術。這次的合作代表了Rokid作為技術型產品公司的實力。

2016年12月,Rokid首款智慧音箱Pebble(月石)亮相CES。無論是雙字喚醒「Rokid」的技術攻關,還是在產品設計方面的苛求,Rokid的硬體產品一直走中高價位品牌的定位。Pebble上市售價為人民幣1,399元(約新台幣6,211元),對外數據顯示,Pebble的產品日活超過50%,月活在80%左右,產品複購率達到了80%。

Rokid創始人兼CEO祝銘明在2017年10月的雲棲大會上,宣布攜手阿里雲共同推出全棧語音開放平台,其100%的硬體技術和70%的程式碼免費開源,「(企業)只要拿回去自己包個殼,稍作修改,就是一個新產品,而且只要200-300元(約新台幣888-1332元),成本非常低。」

在Rokid看來,共享自己的技術是一個「正確的決定」,因為在急需教育的早期市場裡,技術和產品的權重不如渠道和市場來得高。

另一家典型的代表是出門問問。公司在進入智慧音箱領域之前,一直專注智慧型手錶,而「智慧可穿戴之於語音互動,肯定不是最好的落地場景」,出門問問AI音樂事業部總經理吳玉錦說道。基於車載後視鏡——問問魔鏡的成功,出門問問開始了家居場景的探索。2016年,出門問問第一代智慧音箱TicHome立項。

吳玉錦坦言,最初接手音箱項目時,內心其實寫滿了問號:「畢竟行業整體的語音技術遠未成熟,缺乏『support domain』,很多領域的問題,智慧語音助手沒法作答。」考慮到這一因素的掣肘,出門問問的首款智慧音箱TicHome向做工和音質側重,投入了大量的研發精力和物料成本。

在不斷開闢新賽道的背後,出門問問尋找「下一代人機互動」的核心目標沒有改變| 極客公園
極客公園

「第一代音箱取得了階段性成功,在淘寶群眾募資平台上的募資金額突破400萬」,不幸的是,TicHome發售不久,巨頭便紛至沓來。

出門問問做智慧音箱的初衷,是希望構建「家庭、路途、可穿戴」的產品金三角,覆蓋語音互動的所有領域。但在整個2017年,出門問問經歷了智慧音箱從百團大戰到巨頭割據的劇變,「沒有人膽敢跟巨頭產生正面衝突,況且價格補貼不是新創公司能夠承擔的。」團隊後來嘗試走垂直細分領域,做了很多調研後發現,兒童是智慧音箱天然的用戶族群,後來便有了第二代智慧音箱——面向兒童的「TicKasaFox」。

如今,出門問問的音箱業務已經轉向ToB市場,並找到了巨大的市場潛在機會。來自電信營運商和酒店品牌的訂單佔絕大多數,他們對智慧音箱打開IoT的潛在機遇同樣看重

能夠認清形勢並抓住ToB市場,新創公司可以過得「相當滋潤」。畢竟,「BAT(註1)不會為某一個行業或企業從頭到尾的專門定制,他們看不上那個量,而輕量型的企業能做好智慧音箱的所剩無幾。有能力做的(企業),還要看它有沒有裝置串連的能力,是不是還得整合進別家的技術才能完成交付」,吳玉錦表示,經歷了C端市場全鏈路的打通和嘗試,出門問問已經具備toB能力輸出的要求。

截止2019年3月31日,小愛音箱累計銷量突破了1,000萬大關|視覺中國
極客公園

註1:即(百度(Baidu)、阿里巴巴(Alibaba)、騰訊(Tencent)三家網際網路公司的統稱;在中國大陸,這三家公司的規模屬於業界前茅,故常用BAT或BAT們指代巨型網際網路企業。

巨頭的生態博弈

在2017年的盛夏,小米AI音箱以299元(約新台幣元)的售價貫徹了小米「不靠硬體賺錢」的一貫作風。採訪中,唐沐絲毫不避諱這一話題,首度承認小米是智慧音箱價格戰的「發起者」。

唐沐帶領的IoT部門負責路由器和智慧音箱兩條業務線,被戲謔為集團「最不賺錢的部門」,沒有之一。他背負的kpi不以盈利為目的,雷軍對他的要求是,「廣開銷路,以量取勝」

「雖然可以不賺錢,但是絕對不能虧錢。」在價格戰時局最激烈的時候,有一次銷售曾主動降價,把售價169元(約新台幣元)的小愛mini音箱向99元(約新台幣元)的天貓精靈逼平,幸虧唐沐及時發現並緊急叫停,沒有造成更大的損失,但那一次的失誤,讓唐沐背負了2萬台左右的虧損。雖然只是區區人民幣140萬元(約新台幣元),但對於近乎零利潤而言的小愛音箱來說,回血時間相當漫長。

儘管阿里、百度和小米佈局智慧音響的想法和切入點不盡相同,但巨頭誓死捍衛智慧音箱戰場的本源殊途同歸,唐沐指出:「比如BAT當年抓網路入口,雖然各有各的切入點,但是他們只要抓到了這個入口,牢牢吸附在這些入口之上的時候,他們就會發展全領域的應用,然後構建閉環。」

2019年1月,小米啟動了「手機+AIoT」的雙引擎戰略。小米2018年財報數據顯示,截至2018年12月31日,小愛同學月活用戶超3,888萬,小米IoT平台已鏈接的IoT設備數(不包括智慧型手機和筆記本電腦)約1.51億,已成為全世界規模最大的AIoT生態圈。

雷軍表示,2018年是小米AIoT「嶄露頭角的一年」,AIoT已被公認為下一個核心機遇,是新時代的超級網路。

來自小米數據中心的統計數據,截止2019年3月31日,小愛音箱累計銷量突破了1,000萬大關。相比於動輒拿出巨額補貼搶占市場份額的友商而言,小米始終都在賽道上奔跑。

在唐沐看來,巨頭以補貼的方式進入音箱市場,看似野蠻,可選之路卻唯有如此。畢竟每家公司在成長路徑上的差異,導致用戶對品牌形象的認知相對固化,很難相信「提供電商服務的公司和提供即時通訊的企業可以做好一款硬體產品」。同理,用戶也很難相信「小米可以做一款很優質的網路服務」。他直言:「企業想要打破這種偏見,就必須付出比別人更大的代價」。在智慧硬體領域,低價仍是打破品牌刻板偏見的有效手段之一

除了阿里,小米口中的友商,還有憑藉小度帶螢幕音箱殺出重圍的百度。作為中國無螢幕智慧音箱的首發者。2018年3月26日,百度聯合小魚在家發布了中國首款帶螢幕智慧音箱——小度在家,李彥宏親臨現場助陣。這家由百度戰略投資的新創公司偏愛螢幕,是基於對智慧音箱的審慎思考。

百度通過發力帶螢幕音箱成為市場翹楚,但價格補貼是不可忽視的增長因素之一| 視覺中國
極客公園

而百度重視智慧音箱的原因,自然與其戰略密不可分。在集團看來,小度肩負著百度搜索和訊息流量的未來。幕後那雙「看不見的手」,來自於百度副總裁、智慧生活事業群組(SLG)的總經理景鯤。他曾負責度秘團隊管理工作,主導了DuerOS的開發,將後者打造成為百度在人工智慧時代最重要的開放平台之一。

今年2月份,百度在京東發布了第二代「帶螢幕影片音箱」小度在家1S。從參數上看,它較第一代「小度在家」相比,性能得到了整體提升。景鯤當場表示,要把智慧音箱業務在2019年第一季度衝刺到市場第一。

3個月後,Canalys與Strategy Analytics分別發布的2019一季度智慧音箱市場報告顯示,百度旗下小度智慧音箱出貨量達330萬台,超越阿里巴巴與小米成為中國市場第一。同時,小度智慧音箱出貨量僅次於谷歌的350萬台及亞馬遜的460萬台,位居全球市場第三。

有趣的一幕發生在中國移動通信6月份舉辦的「千兆引領,生態賦能」大會上,百度和阿里的演講代表都在現場宣稱自家智慧音箱位居中國第一,唯獨小米說小愛音箱是中國第二。結果會後,小米集團副總裁、紅米Redmi品牌總經理盧偉冰收到同事發來的,來自奧維雲網的2019年Q1季度中國智慧音箱市場主要品牌月度銷量份額報告。其中顯示,小米以34%的銷量份額領位列市場首位,天貓精靈和小度分別為33%和24%。

口水戰側面反應了巨頭在音箱賽道的緊咬力度。正如景鯤所說:「智慧音箱這個賽道非常特殊,它是靠拼殺闖出來的一條全新賽道。

在小米看來,雖然阿里和百度在這場「馬拉松」透過持續性補貼,坐擁各自的一席之地,但唐沐堅信「天下沒有賠本的買賣」,更何況企業的每一筆款項都是要有回報預期的。對於小米這種不靠硬體賺錢的企業來說,「放長線釣大魚」的策略,風險性極高

的確,當被問及何時開啟商業化時,小度方面回應稱,智慧音箱仍處於投入期,集團目前沒有商業化的目標。目前能想到的,只有會員一種變現形式,而重心更多地是放在產品體驗和擴大用戶規模方面。

而景鯤則代表了除李彥宏以外、百度對智慧音箱的最高意志。在今年2月發布小度在家1S時,景鯤就公開表示,百度的價格補貼照舊持續,直到終有一日,「普通用戶的家中都有一台可供人機互動的小度系設備」。

今年第二季度,百度在綜藝節目《嚮往的生活》中對小度音箱的軟置入,一方面是觸及與小度高度契合的觀眾作為潛在消費者;另一方面有助於在受眾心目中,樹立智慧音箱代表品牌的形象。

三大智能音箱的品牌溢价能力 |Nielsen
極客公園

比起迫切希望成為國民產品的小度來說,小愛音箱只需要在小米AIoT的戰略之下順勢而為即可。這兩年來,唐沐對於小愛音箱的戰略定位理解得再深一層。他認為,智慧音箱既是IoT的「催化劑」,也是IoT的「收割者」

2018 年10 月25 日,北京故宮,小愛藍牙音箱以49 元的首發價,刷新智能音箱價格底線
極客公園

在語音互動出現之前,小米鼓勵用戶啟動手機APP去控制智慧硬體。智慧音箱發售之後,小米發現,用戶的使用習慣正在從對手機APP的控制遷移到音箱的語音互動。當IoT設備數量和用戶規模越來越龐大,消費者考慮購買智慧音箱,去操控這些設備的概率就會大大增強。一項統計調查顯示,購買小愛智慧音箱的用戶,更傾向購買小米自家的IoT設備。因此,智慧音箱又帶動了IoT產品的銷售,智慧音箱的「催化劑」作用可見一斑。

而對於IoT的「收割者」一角。唐沐透過一個反面假設來說明了重要性:「假設小米躍居為全球最大的IoT平台,但沒有推出自己的智慧音箱。那麼在智慧音箱的戰役內,友商便會獲得絕大多數的市場份額。用戶可以透過其他品牌的智慧音箱,控制小米的IoT智慧設備。」

IoT設備的連接需要有開放協議的授權許可,一旦競爭者可以控制第三方的家居設備,而不支持小米的IoT產品時,消費者很可能再也不會把小米的任何產品添加到購物車裡了。

繼續往下推演,對手收割IoT只是第一步,毀滅是第二部。唐沐說:「一旦友商收割了小米的IoT,難保有朝一日,語音助手會排除掉小米的設備,造成其無法正常使用。更狠的是,當用戶對家中的智慧音箱發出指令後,不排除友商的智慧音箱會推薦用戶使用其他品牌的IoT設備。」

截至2018年第四季度, Google Home Hub出貨量為220萬台|視覺中國
極客公園

一塊螢幕的改變

2018年第四季度,Google Home Hub帶螢幕智慧音箱成為新星,出貨量高達220萬台。根據Canalys的統計顯示,2018年全球帶螢幕智慧音箱的出貨量為640萬台,佔智慧音箱市場總出貨量的8.3%。

在智慧音箱賽道上,亞馬遜和Google作為先行者,一直是中國科技企業開道鋪路的風向標。最善於捕捉國際巨頭蛛絲馬蹟的中國網路巨頭們,也紛紛做起了帶螢幕音箱的生意。

從時間順序上,無螢幕到帶螢幕的產品迭代屬於一種進化。帶螢幕音箱不僅同時滿足音樂收聽和影片觀看的需求,而且使得智慧音箱從單一的語音互動向「語音+視覺」的多型態互動轉變,擺脫了語音互動在功能和內容方面的展示局限,讓智慧設備具備了能聽、能看的感官能力。

出門問問AI音樂事業部總經理吳玉錦認為:「人機互動未來必定是一個多型態的互動。語音互動之後,視覺互動一定會首當其衝,成為家庭場景下人機互動的主流趨勢。」

由於早期的人工智慧不足以賦予機器足夠的理解力,導致人機互動體驗遠未達到所謂「智慧」狀態。不難理解,為什麼有人曾大放厥詞,揚言「智慧音箱就是智障」。

很多時候,用戶互動過程中,至少需要三輪對話才能得到令人滿意的結果。小魚在家CEO宋晨楓提到,多輪互動中,一旦用戶的表述相對複雜,機器很可能無法準確理解語義,導致互動被迫中斷。這種效率低下的互動體驗,通常會讓用戶在搜尋訊息的過程中產生倦怠感。

百度AI互動設計院基於對大量的智慧語音互動產品用戶測試的經驗發現,影響語音喚醒體驗的因素包含兩個維度——輸入和輸出。而產業內也正在形成一種共識,那就是I/O(輸入和輸出)能力的提升,是智慧設備在未來取得突破和發展的關鍵

而智慧音箱加上觸控螢幕,令I/O能力得到加強。從技術層面來看,帶螢幕音箱本身雖不能解決多輪對話的能力,但有了螢幕的加持,觸控操作代替多輪問答,多輪對話的瓶頸因此得到解決。從用戶體驗角度出發,帶螢幕音箱的訊息輸出效率,比單純靠語音播報的無螢幕音箱高得多。例如在螢幕上直接展示未來一周的天氣,或推薦當天的熱點新聞,而無螢幕音箱要花很久才能完成語音播報。這不符合人類以視覺為主、聽覺為輔的訊息獲許習慣。

在商業化方面,帶螢幕音箱比無螢幕音箱顯得更加友好。假如在內容播放的過程中,無螢幕音箱插入了一些廣告,打斷了正在播放的內容,必然會給用戶帶來極其糟糕的體驗,而習慣了影片廣告的觀眾先天的容忍度會更高。

從上述探討中不難看出,由於智慧音箱尚未實現「真智慧」,導致產品對於螢幕的依賴程度。但不可否認的是,螢幕讓產品的邊界和功能變得模糊和冗餘的現象正在發生。所謂「帶螢幕音箱」,或許正在朝著以看為主的方向進化。有觀點認為,未來智慧音箱的演變路徑,大概率是融合進智慧電視之中。帶螢幕音箱或將成為巨頭提前搶占智慧電視生態的工具,這是亞馬遜在Google Home Hub之後,推出了帶螢幕版Echo的大概目的。

百度透過孵化小魚在家,成為中國最早佈局帶螢幕音箱的企業。關於帶螢幕音箱,李彥宏給出了百度版的標準答案。他認為,智慧音箱無螢幕與帶螢幕,正如收音機和電視機的區別:「有了這塊可視螢幕,智慧音箱的功能才能得以更大程度的延展。」

早在去年8月份,出門問問嘗試做出了一款5英吋螢幕大小的帶螢幕智慧音箱。「當時做了很多用戶調研的場景,很多人希望它具備提醒功能,支持鬧鐘,告訴你該吃飯了或天黑了,再或是播放唱一首歌,螢幕上面展示歌詞,平常就是一個電子相冊」,吳玉錦說。

在和客戶溝通的過程中,出門問問團隊意識到,小螢幕音箱的受眾群體「實際非常有限」,企業級用戶更青睞大螢幕,按照他們的需求,所以出門問問在2019年初的CES展上,公開展示了一款8吋帶螢幕音箱。

但是大螢幕意味著更高的成本。唐沐認為,產品的成本結構決定著消費場景。假如在冰箱裝配一塊大螢幕,其成本就占到30%到40%,那麼這款冰箱絕不可能成功,因為白色家電更應具備實用性,消費者不會因為冰箱多了一塊螢幕,再去多掏30%到40%的錢。

同理,帶螢幕音箱不是小電視,為了避免產品的成本結構淪為畸形,就必須要控制螢幕成本,「帶螢幕音箱的螢幕就必須足夠小」。唐沐透露,小米之所以選擇了5英吋小螢幕,是因為這塊螢幕在目前的供應鏈內非常成熟。

「多模態互動是帶螢幕智慧音箱的一次大膽嘗試,視覺也的確需要螢幕支撐,但智慧音箱的螢幕尺寸該多大,是以螢幕為主,還是僅僅作為一項輔助,產品體驗是以語音為主,還是以螢幕操控為主」,業界對於這些疑問沒有統一的答案。

思必馳CMO龍夢竹看過主流的帶螢幕音箱後,沒有在帶螢幕音箱「大螢幕or小螢幕」的問題上糾結,而是對智慧音箱成為「語音+視覺」的合理載體存在懷疑。

從歷史長河來看,半導體的蕭條是因為螢幕的出現,音樂行業的蕭條是因為影片行業的崛起,不過這種此消彼長並非絕對。龍夢竹表示:「過去幾年我們看到了音樂內容行業再度煥發活力。對於智慧音箱來說,無螢幕音箱存在的合理性更高。」

她強調,思必馳最初拓展智慧音箱的業務,一是篤定音箱是天然的音樂載體;二是因為音箱不帶螢幕,語音才會成為必需。基於這兩點,智慧音箱對遠距語音辨識、降噪、麥克風陣列、聲源定位等需求很明確,技術迭代的步伐也大步向前。

可如今,智慧音箱與螢幕的捆綁,既像一台小電視,又有幾分平板的影子。帶螢幕音箱集影片通話、遠程監控、拍照、視聽播放、電子相冊等於一體。「帶螢幕音箱的消費人群是誰,他們都會在什麼場景下使用」,龍夢竹表示看不懂。

縱使AI技術是制約智慧音箱行業發展的最大瓶頸,「可如果加螢幕是為了繞過技術,緩解多輪互動的局限和語音的一些缺失,這個點是不成立的」,龍夢竹直言不諱。畢竟,智慧音箱從一開始就不是近程語音互動的工具,也不是供用戶把玩的掌機。「雖然螢幕的加持,有這樣那樣的好處,但把這些優勢和特色作用於一台音箱上,似乎是不成立的。」

至於客群目標如何確立,這是擺在硬體廠商和產品經理的問題。在智慧音箱市場,不乏「拍腦袋決定」的產品。雖然帶螢幕是不可逆轉的趨勢,但無螢幕音箱未來仍會長期存在。

聲智科技CEO陳孝良指出,帶螢幕智慧音箱在未來擠壓智慧平板市場的可能性更高。儘管目前帶螢幕音箱朝著融合互動的方向發展,但螢幕自然會讓用戶默認為是可觸摸的互動手段,弱化並逐漸遺忘語音互動。在市場培育期,品牌方應該先讓用戶養成語音互動的習慣,再慢慢推出帶螢幕音箱。

2019年第二季度,智慧音箱的全球出貨量飆升至3,030萬台。其中,百度、阿里和小米分別以470萬台、430 萬和340萬的出貨量位居國內前三| Strategy Analytics
極客公園

2.0時代的輪廓

智慧音箱的第一輪競賽已到尾聲。根據Canalys預測,2019年中國智慧音響的出貨量將達到2,960萬台。而景鯤則大膽預估,稱智慧音箱市場將達到四五千萬的規模。唐沐指出,智慧音箱的市場空間不是憑空臆測,而是置換或替代了傳統藍牙音箱市場:「智慧音箱發展的很快,它的市場蛋糕就擺在那,未來在中國一年可能是上億的規模。」

他繼而補充道:「以往大家無論用藍牙音箱也好,還是所謂網路音箱也好,其實都是需要用手機去做操控的,本質上沒有語音操控這麼方便,因為用戶畢竟要拿出手機點開APP,找到合適的內容點擊它,然後音箱才能夠播放,但是語音互動很簡單。」

回顧智慧音箱的1.0時代,主流玩家能做到比較好的語音辨識、自然語言處理水平和大腦查詢機制,而且各家的音樂庫和有聲讀物儲備得比較豐富。因此,總結第一階段的戰役,大多是在對基礎能力的奠定

雖然景鯤堅信螢幕、視覺和語音相結合的互動,是未來必經的發展趨勢。但如果以有螢幕和無螢幕作為1.0和2.0的界定,這樣的劃分或許帶有太強的物理屬性。

對於智慧音箱的2.0時代,是否以帶螢幕和無螢幕來區分,唐沐本人對此深表懷疑。他覺得智慧音箱2.0的階段性標誌,不在於有螢幕或無螢幕,而是真智慧和初級智慧的差別,即第二階段的競爭是基礎智慧升級為真智慧。所謂真智慧,應該是「千人千面的」。

2017年6月20日,喜馬拉雅發布了小雅智慧音箱。一段時間後,李海波注意到後台數據,發現使用「小雅」的用戶有65%是兒童。方得智慧CEO彭黔平也曾對媒體表示:「中國銷量排名前三的智慧音箱中,購買者大多是年輕人,但使用者卻以老年人與兒童為主。業內人士都應該反思,為什麼這樣一款科技含量看似頗高科技的產品,最終只能滿足老年人與兒童的需求。」

無論是巨頭間的撕扯,還是新創公司的賽道轉換,背後反映的是智慧音箱市場新階段競爭的更加殘酷。看似小眾的市場,引得中國外網路巨頭及新興新創公司爭相佈局。尤其在智慧音箱對於消費者來說,不再是陌生概念的今天,這一品類依舊談不上品質與追求。

有人曾設問:消費者買到的是一個僅供消遣的廉價玩具,還是真正富有科技結晶的良心之選

回歸到產品本身,如果說智慧音箱1.0時代,產品更像是一台問答機,把傳統音箱和初級的語音互動相結合,升級成為了所謂的叫智慧音箱;那麼智慧音箱2.0時代,唐沐判斷,音箱是該回歸「智慧」本質,圍繞「真智慧」拉開新一輪的巨頭爭戰的時候了。

2019百度AI 開發者大會,李彥宏現場演示小度全雙工免喚醒能力| 視覺中國
極客公園

無論是智慧音箱還是智慧電視,抑或是其它智慧設備,語音助手都應是千人千面的形態:「比如不同的用戶發出『我要聽歌』的指令,智慧音箱的反應是不一樣的,推薦給你的內容也是應該是不一樣的」,唐沐表示,

不過,距離真智慧的到來,還有賴於聲紋辨識、智慧推薦、情緒辨識等相關技術的就緒

可喜的是,消費者看到了智慧音箱的迭代進化。在今年7月初舉辦的百度AI開發者大會上,李彥宏為現場觀眾演示了小度自研的全雙工免喚醒技術。一次喚醒,多輪互動的使用體驗,或將是音箱走向「真智慧」的第一步。可以明確的是,語音助手和人類自如對話的日子指日可待了。

在上一輪的比拼中,一些專注2B語音技術的新創公司雖然生存了下來,有些玩家還成為了巨頭的合作夥伴,但唐沐放言,當智慧音箱2.0時代來臨,這些B端公司可能會遭遇前所未有的生存挑戰。因為C端的大玩家都會為「真智慧」提高品質標準,很可能不再需要解決方案商作為合作夥伴了。

屆時,巨頭會把ASR(Automatic Speech Recognition,自動語音辨識)、NLP(Natural Language Processing,自然語言處理)、TTS(Text To Speech,從文本到語音)等技術變為自研的基礎能力。

更重要的一點是,經過第一輪競賽的角逐,巨頭掌握了海量的數據,更多的數據意味著更精準的算法。不難推斷,智慧音箱的2.0時代將會是寡頭之間的全方位競爭。

當然,未來2B企業肯定會有其他的機會和生存空間。「可能會向其它產品方向轉型,但是面向消費者的服務,巨頭一定會形成自我閉環」,唐沐表示。

責任編輯:江可萱

本文授權轉載自:極客公園

延伸閱讀

每日精選科技圈重要消息