新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 開(kāi)發(fā)深度學(xué)習(xí) 谷歌運(yùn)用AI獨(dú)立音軌

開(kāi)發(fā)深度學(xué)習(xí) 谷歌運(yùn)用AI獨(dú)立音軌

作者: 時(shí)間:2018-04-18 來(lái)源:人工智能服務(wù)網(wǎng) 收藏

  在未來(lái)會(huì)需要更多的硬件來(lái)支持,認(rèn)為人工智能的領(lǐng)域還只是一個(gè)初期階段,它帶來(lái)的只是智能硬件設(shè)備上的一個(gè)核心算法,通過(guò)智能設(shè)備上的核心在進(jìn)一步的提升該技術(shù),并且改善硬件設(shè)備上的一個(gè)核心點(diǎn),讓這項(xiàng)技術(shù)通過(guò)做的更加完善。

本文引用地址:http://butianyuan.cn/article/201804/378555.htm

  

blob.png

 

  目前在開(kāi)發(fā)一種深度學(xué)習(xí)算法,這項(xiàng)算法可以提升音頻的環(huán)境范圍,想象一下,在非常嘈雜的環(huán)境中如果能聽(tīng)到音頻是一件非常不容易的事情,但通過(guò)AI算法它可以解決這樣的問(wèn)題。

  

blob.png

 

  此外,這樣的解決方法,主要用于識(shí)別一個(gè)獨(dú)立系統(tǒng),打算通過(guò)這個(gè)AI系統(tǒng)獨(dú)立出來(lái)一個(gè)音軌,這也就是說(shuō)可以分某一個(gè)人的聲音,谷歌公司內(nèi)部團(tuán)隊(duì)可以區(qū)分某一個(gè)人的聲音。

  

blob.png

 

  據(jù)了解,這項(xiàng)技術(shù)可以使用于單軌視頻,在通過(guò)算法分離出視頻中不同人的音頻內(nèi)容,也可以讓用戶手動(dòng)選取視頻中的人臉,專門收聽(tīng)此人的聲音。尤其是在多個(gè)聲源中可以成功過(guò)濾掉其他聲音,只保留一個(gè)核心的聲音。但問(wèn)題還是存在的,在實(shí)驗(yàn)效果的時(shí)候表現(xiàn)的并不是非常理想,可能AI技術(shù)上還有一些殘留,目前AI上可以做到保留一個(gè)核心,并去掉其他聲音來(lái)解決嘈雜的環(huán)境音,日后還會(huì)慢慢加強(qiáng),未來(lái)若將此項(xiàng)技術(shù)運(yùn)用到監(jiān)聽(tīng)和間諜工作當(dāng)中那將是很大的問(wèn)題。



關(guān)鍵詞: 谷歌 AI

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉