今年10月,微軟成立人工智慧與研究部門(Microsoft AI and Research Group),集中資源投入人工智慧研究與產品服務研發。40年歷史的微軟,隨著Wintel浪潮退去,未來,要靠人工智慧平台展現昔日風華。
「松鼠陪著核桃在庭院追迷藏,葡萄躲進木桶釀出時光。」2016年6月1日微軟開發者峰會上,Ptt創辦人、來自台灣的Microsoft人工智慧亞太區研究總監杜奕瑾,站在舞台上對著Cortana說,「請播放周杰倫的〈前世情人〉」時,Cortana馬上聽懂了杜奕瑾的指令,隨即並播放周杰倫最新MV〈前世情人〉。不僅如此,Cortana還會訂餐,當用戶的會議日程與用餐時間產生重疊時,Cortana會提前進行詢問是否需要訂餐,並且推薦用戶喜歡的美食。
工作與生活的幫手Cortana
Cortana是微軟開發的虛擬語音助理。「Cortana的研發歷程,不像一般產品,更像是孩子慢慢長大的過程,它先天很聰明資質很好,雖然我們還有很多不滿意的地方,但用戶回饋常給團隊很多驚喜。」微軟亞洲互聯網工程院常務副院長兼產品及開發總經理幺寶剛說。
「我們要打造個性化與客製化的,屬於你的Cortana。讓Cortana非常了解你,提供無縫接軌的服務,幫助你的工作和生活。」幺寶剛說。他舉例,讓Cortana提醒使用者下一個會議和與誰開會;如果會議在城市另外一點,Cortana會提醒使用者早點出發,因為當時交通有些壅塞。Cortana非常了解使用者的日程,喜歡看哪種新聞,喜好哪種食物,並且能在最適合的時機點,提供這些服務。「我們還在做不同的嘗試,看哪種個性的Cortana,哪種聲音的Cortana使用者會喜歡。」
人工智慧助手已經成為科技巨頭的兵家必爭之地,除了微軟,Google、亞馬遜與百度等公司紛紛推出雷同產品,百家爭鳴。不過微軟早在1991年就招攬人工智慧人才,累積研發能量一直到現在。今年3月微軟開發出一款人工智慧聊天機器人Tay,一炮而紅,但才上線一天就因種族歧視暫停使用。
「微軟的人工智慧研究成就都很突出,尤其是在語音辨識和圖像辨識等領域,如果你沒有非常認真的投入這些領域,是很難發展並且轉化成產品的。」微軟執行長納德拉(Satya Nadella)在公開場合曾自豪地說。微軟人工智慧團隊10月就發表了一篇語音辨識系統的論文,報告中指出,微軟語音技術在Switchboard(美國國防高級研究計劃局資助蒐集的電話對話語料庫)對話語音辨識的詞錯率為5.9%,與人工聽寫的錯誤率差別不大。
把AI技術打包成API
單靠語音助理,無法撐起微軟的人工智慧大夢,微軟雲端平台Azure在微軟人工智慧藍圖中扮演更關鍵角色。「微軟要把人工智慧技術民主化(democratize),成為汽車、醫療製造、金融保險等領域企業的賦能者(enabler)……大眾把人工智慧看得太玄了,我們應該要用一種平常心去面對這樣的科技。」微軟全球資深副總裁洪小文說。
為了達成民主化目標,微軟從雲端平台Azure切入,圍繞Cognitive Services核心,把人工智慧所有的技術打包成API,讓開發者使用。「微軟是一個平台公司,讓任何一個公司可以來簡單ㄐ寫用人工智慧,包括了語言、語音與視覺等各種領域,大家都可以用我們的API(Application Programming Interface,應用程式介面),很容易就可以寫程式。」洪小文舉例,以造成轟動的How old.net來說,裡面的代碼不到八行就可以寫出來,因為這個Code是Cognitive Services的API,微軟還陸續推出了新的Cognitive Services,不斷的更新,產生一些新的功能,最近加的Video的功能,也是一個新API,是Aptionbot.ai,也可以上傳任何照片。
為企業應用添加人工智慧
「微軟所有願景的交匯處就是人工智慧。人工智慧提供的是將大數據解析之後產生智慧……我们如何為所有的軟體和應用,比如Cortana、Office 365、Dynamic 365,添加人工智慧因素?這是我們發展人工智慧的角度。」納德拉說。為了人工智慧,微軟也以262億美元收購專業社群網站LinkedIn,是微軟史上最大併購。「擁有再高深的軟體演算法,再強大的硬體,沒有所謂的商業邏輯與資料積累,任何商業的人工智慧都是沒有意義的空盒子。微軟買LinkedIn為的是幫Office 365軟體及客戶關係管理Dynamics注入專業人士的靈魂。」HWTrek創辦人王仁中在Facebook上發文分析。
「LinkedIn全公司都有這樣一種數據文化,以產品部門來說,雖然LinkedIn今天有4億用戶,但是從1萬到2萬5千個用戶的時候就開始用數據分析。」前LinkedIn美國商業分析部高階總監,GrowingIO創辦人兼CEO張溪夢在他LinkedIn中發文。LinkedIn團隊以數據驅動的文化聞名矽谷,這正是微軟導入人工智慧的重要原動力。
除了Cortana,微軟也把人工智慧添加到Office 365與Dynamic 365等產品中。舉例來說,Office 365借助Microsoft Graph,Word與Outlook中的Tap功能將讓使用者輕鬆地把內容整合自己的檔案和信件中;微軟MyAnalytics則是Office 365的一項分析服務,能幫助人們更好地分析工作中時間消耗的情況。
「從投資的衡量角度來看,我覺得人工智慧的價值在於它將被注入我們所有的產品和服務裡。」納德拉說,40年歷史的微軟,要靠著人工智慧平台展現昔日風華。
微軟認知服務範籌
語音
Bing Speech API
雙向轉換語音與文字,從而了解使用者的想法說話者辨識API
使用語音來辨識及驗證說話者
搜尋
Bing 搜尋API
供應用程式使用的Web、影像、影片及新聞搜尋APIBing 自動建議 API
將搜尋用的智慧型自動建議選項提供給應用程式
辨識
人臉識別 API
偵測、分析、組織及標記相片中的臉孔Emotion API
利用表情辨識個人化使用者體驗Computer Vision API
從影像擷取可操作的資訊
語言
Language Understanding Intelligent Service
教導應用程式理解使用者發出的命令Text Analytics API
輕鬆解讀意見與話題,了解使用者需求Web Language Model API
透過網路規模資料訓練,預測語言模型Bing 拼字檢查 API
偵測並校正應用程式中的拼字錯誤
知識
Recommendations API
預測並建議客戶想要的商品Academic Knowledge API
充分利用 Microsoft Academic Graph 中豐富的學術內容
微軟
領域:AI雲端平台
人工智慧三大特色:
・以機器學習建構智慧雲端平台Azure
・開發智慧助理Cortana與微軟小冰
・語音辨識與圖像辨識領域表現突出