【這很AI】又一全新交互技術?

更新時間:0000-00-00 00:00:00    閱讀:2067

先想象這樣一個場景:當你看到一個畫面時,通過一個小應用,能隨時配上一首契合圖像意境的音樂,是不是看起來更酷?

先想象這樣一個場景:當你看到一個畫面時,通過一個小應用,能隨時配上一首契合圖像意境的音樂,是不是看起來更酷?

微信圖片_20181113181046.jpg


有這樣一種假象:當音樂響起,結合畫面圖景,會讓你產(chǎn)生一種遠離辦公室或臥室,坐在森林旁邊的潺潺流水中,甚至分身到暴露的山坡上的情景感。


日本研究人員的一個新項目就利用了這種想象力的潛力,并將其與AI算法結合,實現(xiàn)了這種奇妙的效果。


具體說來,是通過一款叫“Imaginary Soundscape” 的網(wǎng)絡應用程序,使用機器學習來將您上傳的任何圖片和最符合的音頻配對。

微信圖片_20181113181051.jpg




上圖為這款產(chǎn)品的首頁,簡單明了,你要做的就是上傳一張圖片,然后進入另外一個頁面,顯示你上傳的圖片同時,同時就會放出經(jīng)過AI算法匹配后的背景音樂。


例如,上傳日本的漁船木刻,這個系統(tǒng)會匹配波浪和水聲;加載一幅抽象的夜鶯畫作,人工智能會給你搭配一首風鈴和鳥叫的音景音樂。


微信圖片_20181113181056.jpg


再比如上傳上面這個畫面,系統(tǒng)匹配的音樂就是一首相當古典的交響樂。

通常來說,結果正如你所期望的那樣,畫面什么樣,匹配的音樂也近乎切合。但更有意思的是,當系統(tǒng)接收到你上傳一些稀奇古怪的元素時,系統(tǒng)反饋的配音也會帶來驚喜,比如將擎天柱與拖拉機聲音配對。

微信圖片_20181113181100.jpg


所有這些都是一個相對簡單的AI算法的產(chǎn)物。它使用物體識別來識別圖像中的元素,然后將這些元素與超過52,000個聲音文件的數(shù)據(jù)集進行匹配。


這個產(chǎn)品的研究人員,東京大學的Yuma Kajihara,Shoya Dozono和Nao Tokui多年來一直在研究這種“交叉模式”模型。 


Imaginary Soundscapes的早期版本于1月份推出,旨在將音頻與Google街景視圖中的圖像進行匹配。


這是一個有趣的小應用程序,也是AI支持的新型創(chuàng)意表達的絕佳示例。該系統(tǒng)并不完美,比如模糊識別會造成錯誤,而聲音數(shù)據(jù)庫無可避免地不完整,但這也是其魅力和神奇所在,你永遠不知道它會給你匹配什么美妙的音樂。


如果有的話,它產(chǎn)生的偶然和意想不到的音樂背景比“正確”的匹配更有趣。



________________


“閃電配音”是內(nèi)容與媒體首選的配音服務商,平臺可實現(xiàn)7*24小時在線、最快15分鐘實現(xiàn)千字配音且達到FM音質標準的實際要求,每百字僅需2-10元,通過產(chǎn)品驅動滿足了對時效性要求高的自媒體等行業(yè),實現(xiàn)了配音行業(yè)生產(chǎn)方式的變革?,F(xiàn)階段,平臺已簽約主播1萬多名,平均每天有2千~3千筆訂單,已服務累計服務客戶超過3000家。行業(yè)覆蓋新聞媒體、自媒體、知識付費、短視頻、出版社有聲書業(yè)務等;包括故宮、知識分子、見字如面、吳曉波頻道、極客公園;磨鐵、郵電出版社、喜馬拉雅等。

閃電配音

掃碼免費試音
企業(yè)微信

免費試音

幫我推薦

價格計算

在線下單

開具發(fā)票

不招主播

確認提交

全網(wǎng)全品類皆可配 頂配好聲音

點我咨詢
錯誤