自從智慧音箱Echo大受歡迎之後,Amazon上月底又推出了一項擴大AI生態體系的舉措,那就是Amazon Lex平台的正式發表。該平台以虛擬助理Alexa底層的自動語音識別與自然語言理解技術為基礎,旨在利用一系列工具為聊天機器人開發者的工作提供便利,同時利用開發者的訓練數據進一步完善Alexa,以及促進Lex在語音運算平台的統治力。
而為了進一步提高其智慧語音服務的吸引力,近日這家電子商務巨頭又宣布已經讓Alexa獲得了新技能:一套新的說話技能,開發者透過利用標準的語音合成標記語言,就能夠調節Alexa的說話模式,讓它產生低聲耳語、停頓深呼吸一下以示強調、調整語速、語調等。一個更加個性化和情緒化的虛擬助理無疑是更加聰明的,也會讓人更加願意去互動。不過目前這項功能僅針對美國和英國開放。
新技能需要透過語音合成標記語言(Speech Synthesis Markup Language,SSML)來運用。這次SSML總共新增了5個標籤:whispered(說悄悄話)、expletive(用嗶嗶聲屏蔽)、Sub(替換說法)、emphasis(強調)以及Prosody(控制語音、語調、語速,但是會有範圍控制)。比方說下面就是一個說悄悄話的SSML例子:
<speak>
用戶名是Boxi Yang,密碼是… 等一下,你湊近一點…
<amazon:effect name="whispered"> 密碼是悄悄話。 </amazon:effect>
</speak>
這樣說「密碼是悄悄話」時Alexa就會壓低聲音。
當然,此前Alexa已經添加了不少個性。比方說她會自問自答,講講笑話,回答「我愛你」等,甚至如果你要求的話她還可以唱歌給你聽。但是之前Alexa的說話時仍然擺脫不了那種千篇一律,而且一旦句子太長就會露出機器發音的痕跡。
而這5個新標籤就可以增加Alexa說話的個性化。為了演示這些說話技巧實際的應用效果,Amazon創建了一個運用了新標籤的謎語遊戲模板,開發者自己也可以對其進行修改來嘗試新的說話技巧。
此外,Amazon還為英國和德國地區引入了「speechcons」功能。這項功能可以讓Alexa利用特殊的單詞和短句以更豐富(更加口語化)的方式來進行互動。
當然,Alexa的繁榮仍然有賴於開發者社群的活躍。這幫人需要的不僅僅是樂子,更重要的是銀子。除了有趣以外,如何幫助他們找到真正有用的商業模式是Amazon搭建語音帝國需要解決的課題。
本文授權轉載自:36 氪
