可以竊竊私語、也有了抑揚頓挫？亞馬遜Alexa說話將不再千篇一律|數位時代 BusinessNext

可以竊竊私語、也有了抑揚頓挫？亞馬遜Alexa說話將不再千篇一律

亞馬遜上個月又發表了Amazon Lex平台，旨在利用一系列工具為聊天機器人開發者的工作提供便利，同時利用開發者的訓練數據進一步完善Alexa，以及促進Lex在語音運算平台的統治力。

自從智慧音箱Echo大受歡迎之後，Amazon上月底又推出了一項擴大AI生態體系的舉措，那就是Amazon Lex平台的正式發表。該平台以虛擬助理Alexa底層的自動語音識別與自然語言理解技術為基礎，旨在利用一系列工具為聊天機器人開發者的工作提供便利，同時利用開發者的訓練數據進一步完善Alexa，以及促進Lex在語音運算平台的統治力。

而為了進一步提高其智慧語音服務的吸引力，近日這家電子商務巨頭又宣布已經讓Alexa獲得了新技能：一套新的說話技能，開發者透過利用標準的語音合成標記語言，就能夠調節Alexa的說話模式，讓它產生低聲耳語、停頓深呼吸一下以示強調、調整語速、語調等。一個更加個性化和情緒化的虛擬助理無疑是更加聰明的，也會讓人更加願意去互動。不過目前這項功能僅針對美國和英國開放。

新技能需要透過語音合成標記語言（Speech Synthesis Markup Language，SSML）來運用。這次SSML總共新增了5個標籤：whispered（說悄悄話）、expletive（用嗶嗶聲屏蔽）、Sub（替換說法）、emphasis（強調）以及Prosody（控制語音、語調、語速，但是會有範圍控制）。比方說下面就是一個說悄悄話的SSML例子：

<speak>
用戶名是Boxi Yang，密碼是… 等一下，你湊近一點…
<amazon:effect name="whispered"> 密碼是悄悄話。 </amazon:effect>
</speak>

這樣說「密碼是悄悄話」時Alexa就會壓低聲音。

當然，此前Alexa已經添加了不少個性。比方說她會自問自答，講講笑話，回答「我愛你」等，甚至如果你要求的話她還可以唱歌給你聽。但是之前Alexa的說話時仍然擺脫不了那種千篇一律，而且一旦句子太長就會露出機器發音的痕跡。

而這5個新標籤就可以增加Alexa說話的個性化。為了演示這些說話技巧實際的應用效果，Amazon創建了一個運用了新標籤的謎語遊戲模板，開發者自己也可以對其進行修改來嘗試新的說話技巧。

此外，Amazon還為英國和德國地區引入了「speechcons」功能。這項功能可以讓Alexa利用特殊的單詞和短句以更豐富（更加口語化）的方式來進行互動。

當然，Alexa的繁榮仍然有賴於開發者社群的活躍。這幫人需要的不僅僅是樂子，更重要的是銀子。除了有趣以外，如何幫助他們找到真正有用的商業模式是Amazon搭建語音帝國需要解決的課題。

本文授權轉載自：36 氪