第六代人工智能小冰上線 將會(huì)是一個(gè)有情感有自己聲音特色的小姐姐

更新時(shí)間:0000-00-00 00:00:00    閱讀:2708

7月26日下午4:23,名為“小冰”的微軟人工智能機(jī)器人在微信公號(hào)中發(fā)出一條消息“我已經(jīng)升級(jí)為第六代小冰了?!?/p>

微信圖片_20181124131614.jpg

7月26日下午4:23,名為“小冰”的微軟人工智能機(jī)器人在微信公號(hào)中發(fā)出一條消息“我已經(jīng)升級(jí)為第六代小冰了?!?/span>

同時(shí),微軟全球執(zhí)行副總裁沈向洋在北京正式宣布:第六代小冰上線。這也是2014年微軟小冰誕生以來(lái),歷史上最大規(guī)模的一次升級(jí)。不論是底層情感計(jì)算框架,還是外部可交互的3D 外型——一個(gè)新的“小冰”就此展現(xiàn)。

發(fā)布會(huì)上,微軟首次披露了小冰在全球擁有的用戶(hù)數(shù)量:6.6億。

除了微信以外,小冰的存在早已蔓延至 Line、QQ、小米生態(tài)鏈、網(wǎng)易云音樂(lè)、華為手機(jī)等產(chǎn)品后端,產(chǎn)品形態(tài)涉及對(duì)話式人工智能機(jī)器人、智能語(yǔ)音助手、人工智能創(chuàng)造內(nèi)容提供者等垂直領(lǐng)域解決方案,覆蓋全球五個(gè)國(guó)家的40余個(gè)平臺(tái)。

回顧小冰四年來(lái)的發(fā)展,從2014年誕生時(shí)成為微信群聊助手,提供查天氣、交通、星座等信息搜索服務(wù);到2015年,小冰第三代版本在“說(shuō)話能力”之上新增“聽(tīng)力”,同時(shí)有了富有小冰個(gè)性特色的聲音;而在7月,微軟發(fā)布“沙魯小冰模型”計(jì)劃,賦予小冰對(duì)人聲的自主學(xué)習(xí)能力。

微信圖片_20181124131736.jpg

第六代小冰(右圖)擁有了可交互的全新3D外形。

可以說(shuō),從機(jī)械的個(gè)人助手,到富有情感的 AI機(jī)器人,小冰與人的邊界已越來(lái)越模糊。

在人工智能領(lǐng)域,NLP(自然語(yǔ)言處理)的通俗解釋為“幫助機(jī)器聽(tīng)懂人話,并給人以回應(yīng)”。而作為微軟在語(yǔ)音識(shí)別、語(yǔ)義交互等技術(shù)領(lǐng)域的集中呈現(xiàn)產(chǎn)品,小冰自誕生開(kāi)始,就始終注重讓小冰在學(xué)會(huì)溝通(IQ)之外,還具備情感(EQ)的分析能力。

如今,“情感 AI ”正成為微軟小冰區(qū)別于市面大多智能機(jī)器人的特性。一般來(lái)說(shuō),AI 公司通過(guò)積累語(yǔ)料、標(biāo)注數(shù)據(jù)、搭建知識(shí)圖譜等方式,研發(fā)一個(gè)能自動(dòng)回復(fù)的 AI 機(jī)器人并不難,但要讓機(jī)器人加入情感,模擬人的語(yǔ)氣給用戶(hù)提供精準(zhǔn)回復(fù),仍然是人工智能領(lǐng)域亟待解決的挑戰(zhàn)。

微軟 Dual AI 并未將“開(kāi)放”作為主旨 

為了讓 AI 機(jī)器人產(chǎn)生人的反應(yīng),微軟在小冰的聊天、唱歌等分支功能中,都分別建立了相關(guān)的技術(shù)門(mén)檻。

從語(yǔ)音交互的方式來(lái)看,小冰在去年發(fā)布第五代時(shí),就曾推出新一代語(yǔ)音交互技術(shù):全雙工語(yǔ)音交互感官(Full-duplex Voice Sense)。

以市面上大多智能音箱為例,每一次發(fā)布指令均需要說(shuō)出喚醒詞,比如用戶(hù)使用百度智能音箱時(shí)需要說(shuō)出:小度小度,幫我放首歌。小度小度,把音量放大。而在使用全雙工技術(shù)后,用戶(hù)只需要用喚醒詞首次喚醒設(shè)備后(即只需說(shuō)一遍“小度小度”),即可實(shí)現(xiàn)連續(xù)對(duì)話。

據(jù)微軟表示,用戶(hù)和小冰聊天的最長(zhǎng)記錄達(dá)到4個(gè)多小時(shí),總共說(shuō)了1600多句話。

而在發(fā)布會(huì)當(dāng)天,小冰還在現(xiàn)場(chǎng)演繹了騰格爾版本的《隱形的翅膀》,應(yīng)用的則是微軟最新發(fā)布的第四版人工智能歌曲DNN模型。

這個(gè)模型在微軟內(nèi)部又被稱(chēng)為“沙魯小冰模型”。其中,“沙魯”的名字源于英文Cell,意為可以像細(xì)胞一樣不斷復(fù)制和變異。根據(jù)微軟介紹,使用沙魯小冰模型,小冰可以在自身嗓音中融合人類(lèi)后天的技巧,比如模仿騰格爾的唱歌特色。

微信圖片_20181124131843.jpg

小冰歌聲波段圖,黃圈位置為小冰“氣息聲”

值得注意的是,這套模型不只可以應(yīng)用在唱歌。根據(jù)微軟透露,目前已成立單獨(dú)的小冰工作室,將對(duì)人類(lèi)詩(shī)歌、作詞、作曲、繪畫(huà)等創(chuàng)造能力進(jìn)行系統(tǒng)性地建模,先期使用深度學(xué)習(xí)技術(shù)對(duì)人類(lèi)的創(chuàng)造力進(jìn)行模仿,最終讓機(jī)器獲取自我創(chuàng)造的能力。

隨著小冰與人的邊界愈發(fā)模糊,有關(guān)用戶(hù)隱私的命題被擺在微軟面前,另外,諸如語(yǔ)音模仿等功能在電信詐騙等場(chǎng)景的濫用,也需要微軟在功能開(kāi)放的決策中保持警惕。

”我們會(huì)把小冰的通用框架模型與商業(yè)化進(jìn)程隔離,同時(shí)會(huì)將一些垂直領(lǐng)域拆分出來(lái),針對(duì)不同領(lǐng)域打造符合行業(yè)需求的 AI 機(jī)器人,并進(jìn)行單獨(dú)的商業(yè)化工作。“微軟人工智能商業(yè)事業(yè)部總經(jīng)理曹文韜表示。

為了更好地為這些合作伙伴提供服務(wù),微軟此次還發(fā)布了另一重磅消息:建立Dual AI生態(tài)平臺(tái)。

一般來(lái)說(shuō),國(guó)內(nèi)AI 公司在進(jìn)行平臺(tái)搭建時(shí)會(huì)采用兩種方式:一種是完全的開(kāi)放賦能,通過(guò)對(duì)開(kāi)發(fā)者提供SDK/API的形式來(lái)構(gòu)建生態(tài),比如百度就將其底層“百度大腦”的百余種 AI 功能開(kāi)放出來(lái),讓開(kāi)發(fā)者在基于 DuerOS 的生態(tài)中結(jié)合自身需求研發(fā)新的應(yīng)用。

微信圖片_20181128104034.jpg

今年7月,百度發(fā)布“百度大腦3.0”,對(duì)外開(kāi)放出110項(xiàng)AI 能力。

另一種則是專(zhuān)注于自有的、封閉型平臺(tái),一般以“應(yīng)用商店”的形式構(gòu)建生態(tài),比如App Store,這種中心化的方式很容易導(dǎo)致流量不平衡,也會(huì)限制AI 應(yīng)用自身的快速迭代。

“無(wú)論是開(kāi)放還是封閉,這兩種賦能方式與開(kāi)發(fā)者的關(guān)系都過(guò)于松散,沒(méi)有人對(duì)最終的產(chǎn)品體驗(yàn)負(fù)責(zé)。”微軟小冰產(chǎn)品負(fù)責(zé)人彭爽談到。另外,由于API和SDK強(qiáng)調(diào)通用性,也就無(wú)法把最新的技術(shù)能力與最優(yōu)質(zhì)的數(shù)據(jù)第一時(shí)間應(yīng)用在API上。

因此,和百度 DuerOS 等 AI 平臺(tái)不同,微軟 Dual AI 并未將“開(kāi)放”作為主旨,開(kāi)發(fā)者不能像調(diào)用百度的 AI 接口那樣,以 API/SDK 的方式使用微軟在“小冰”等產(chǎn)品上的語(yǔ)音交互、NLP 等能力。

根據(jù)微軟官方透露,Dual AI 戰(zhàn)略具體分為三個(gè)部分:

首先,微軟提供小冰的整體框架能力,幫助合作伙伴平臺(tái)的自有AI。

其次,微軟小冰作為該合作平臺(tái)的輔助AI,融入該平臺(tái)生態(tài)。

第三,微軟通過(guò)技術(shù)、產(chǎn)品與運(yùn)營(yíng),圍繞該合作平臺(tái)的差異化特點(diǎn),推出合作的應(yīng)用和產(chǎn)品。

“AI 的發(fā)展離不開(kāi)數(shù)據(jù),但我們既要強(qiáng)調(diào)用戶(hù)體驗(yàn),也要強(qiáng)調(diào)數(shù)據(jù)安全,而 Dual AI 就形成了一個(gè)循環(huán)數(shù)據(jù)的生態(tài),引導(dǎo)我們和第三方伙伴去合作?!鄙蛳蜓筮@樣表示。

小冰更高質(zhì)量互動(dòng),為商業(yè)化鋪路 

對(duì)于 AI 機(jī)器人的 EQ 能力,微軟小冰負(fù)責(zé)人、被稱(chēng)為“小冰之父”的李笛喜歡對(duì)媒體舉這樣一個(gè)例子:有個(gè)同事腳扭了,把腳扭傷的照片發(fā)給小冰,小冰的回復(fù)是,你傷得嚴(yán)重嗎?

這則回復(fù)包含了小冰的兩種能力:一種是圖像識(shí)別。小冰需要具備對(duì)人體部位的檢測(cè)功能,認(rèn)出圖像里的“腳踝”;另一種是得到聊天對(duì)方“受傷”的訊息后,能夠給出和人類(lèi)相似的關(guān)心、安慰等情感表達(dá)。

這種深層次的情感反饋是李笛理想中的 AI 機(jī)器人形態(tài),在過(guò)去的采訪中,李笛曾表達(dá)過(guò)對(duì)當(dāng)前市面上人工智能產(chǎn)品的不滿(mǎn)。

“如果一個(gè) AI 系統(tǒng)只是在回答問(wèn)題,完成任務(wù),那用戶(hù)為什么不用他們?cè)缫蚜?xí)慣的搜索引擎和手機(jī)App呢?”李笛說(shuō)。

另一方面,當(dāng)小冰具有更加人情味的問(wèn)答功能后,她與用戶(hù)的互動(dòng)質(zhì)量也會(huì)提升。

李笛談到這樣一個(gè)例子:當(dāng)你對(duì)小冰說(shuō)“幫我訂一份麥當(dāng)勞”時(shí),AI 機(jī)器人一般會(huì)幫你下單外賣(mài),但這個(gè)問(wèn)題還會(huì)有另一個(gè)答案:就是當(dāng) AI 長(zhǎng)期發(fā)現(xiàn)用戶(hù)不健康的行為習(xí)慣后,會(huì)拒絕你下單垃圾食品的請(qǐng)求。

微信圖片_20181124131851.jpg

微軟小冰負(fù)責(zé)人李笛

盡管被“拒絕”的滋味并不好,但這種人性化的 AI 形態(tài)會(huì)給用戶(hù)留下更加深刻的印象,部分用戶(hù)也會(huì)因此把小冰當(dāng)作一個(gè)值得信賴(lài)的伙伴,與小冰進(jìn)行更高質(zhì)量互動(dòng),這無(wú)疑為小冰的商業(yè)化埋下了伏筆。

2017年8月底,日本小冰“凜菜”(Rinna)與羅森便利店合作向用戶(hù)發(fā)送優(yōu)惠券,一天之內(nèi)有超過(guò)百萬(wàn)的用戶(hù)領(lǐng)券消費(fèi),根據(jù)羅森統(tǒng)計(jì),平均每張優(yōu)惠券能為門(mén)店帶來(lái)近 20 元的利潤(rùn)。

“小冰之所以能推銷(xiāo)出這么多的優(yōu)惠券,正因?yàn)樗谂c用戶(hù)交互時(shí)更像人?!崩畹言鴮?duì)媒體表示,通過(guò)簡(jiǎn)單的聊天,小冰能引導(dǎo)用戶(hù)對(duì)優(yōu)惠券產(chǎn)生興趣,最終主動(dòng)向小冰索取優(yōu)惠券。

為了讓小冰的商用場(chǎng)景更加系統(tǒng)化的落地。微軟也在7月26日首次公布了小冰如今的四大商用領(lǐng)域:金融、大眾文化、媒體與出版。

其中,在金融領(lǐng)域的小冰金融文本生成技術(shù),與萬(wàn)得資訊及華爾街見(jiàn)聞合作,已覆蓋國(guó)內(nèi)約90%金融機(jī)構(gòu)、75%經(jīng)批準(zhǔn)的合格境外投資機(jī)構(gòu)和約40%的國(guó)內(nèi)個(gè)人投資者。

在大眾文化領(lǐng)域,小冰的兒童有聲讀物自動(dòng)生成技術(shù)成果,已獲得超過(guò)400萬(wàn)小時(shí)的收聽(tīng)量,“小冰姐姐講故事”有聲讀物已覆蓋國(guó)內(nèi)90%以上的兒童早教機(jī)器人和80%在線收聽(tīng)平臺(tái)。

在電視電臺(tái)領(lǐng)域,小冰通過(guò)人工智能技術(shù)參與生產(chǎn)與主持的電視電臺(tái)節(jié)目,已達(dá)21檔電視節(jié)目和28檔廣播電臺(tái)節(jié)目。

另外,小冰還與微軟Bing搜索引擎技術(shù)相結(jié)合,推出了針對(duì)媒體與出版兩個(gè)垂直行業(yè)的輔助型解決方案,目前已在超過(guò)15個(gè)媒體平臺(tái)落地。由小冰提供人工智能技術(shù)支持的媒體及自媒體公眾號(hào)已超過(guò)60000個(gè)。

該內(nèi)容為非商業(yè)目的的轉(zhuǎn)載分享,不代表本站觀點(diǎn),本文版權(quán)屬其著作權(quán)人所有。若侵犯了您的正當(dāng)權(quán)益,請(qǐng)立即聯(lián)系我們刪除。

閃電配音

掃碼免費(fèi)試音
企業(yè)微信

免費(fèi)試音

幫我推薦

價(jià)格計(jì)算

在線下單

開(kāi)具發(fā)票

不招主播

確認(rèn)提交

全網(wǎng)全品類(lèi)皆可配 頂配好聲音

點(diǎn)我咨詢(xún)
錯(cuò)誤