新聞中心

EEPW首頁 > 消費(fèi)電子 > 業(yè)界動(dòng)態(tài) > 智能音箱讓情感重新有了溫度:還是那個(gè)熟悉的聲音

智能音箱讓情感重新有了溫度:還是那個(gè)熟悉的聲音

作者: 時(shí)間:2018-04-19 來源:鈦媒體 收藏

  有人說,人會(huì)經(jīng)歷三次死亡:第一次是身體停止運(yùn)轉(zhuǎn)導(dǎo)致的生理上死亡;第二次是舉行完葬禮代表你社會(huì)位置的消失;第三次是當(dāng)世界上沒人再記得你的時(shí)候,真正意義上的死亡。

本文引用地址:http://butianyuan.cn/article/201804/378617.htm

  當(dāng)你某天將要離開這個(gè)世界的時(shí)候,你是否想過要嘗試科技的方式,將自己身上獨(dú)有的特點(diǎn)化身為情感寄托,換一種形式陪伴在家人和朋友身邊呢?

  今天故事的主角王先生就是一個(gè)敢為人先的科技愛好者,身患肺癌的他在叮咚的幫助下,通過語音合成技術(shù)記錄下了自己的聲音,有了自己專屬的TTS發(fā)音人,并將一整套語音交互對話定制在了中。

  一位特殊的用戶

  “不管怎么說,用我的聲音,能陪伴他們更長的時(shí)間。”

  3月12日,王先生第三次來到北京完成了所有的錄制內(nèi)容,除了一些日常交互場景下的對話,他還特別準(zhǔn)備了給孩子們十八歲的成人禮祝福,以及給父母和妻子的一些日常留言。

  隨著人工智能技術(shù)民主化進(jìn)程的加快,它的應(yīng)用正在覆蓋我們生活中的各個(gè)場景,智能音箱是其中一個(gè)很大的品類,不過王先生只是一位普通的智能設(shè)備用戶,他是如何吸引到叮咚的呢,這就要從去年底一個(gè)不經(jīng)意之間的留言談起。

  當(dāng)時(shí),叮咚智能音箱的微信公眾號(hào)后臺(tái)收到了一位用戶的留言,這位用戶的疑問并不是關(guān)于產(chǎn)品使用上的困惑,也不是任何對于企業(yè)的吐槽,他問了一個(gè)讓整個(gè)叮咚團(tuán)隊(duì)都非常驚訝的問題——叮咚智能音箱可以專屬定制嗎?

  雖說消費(fèi)升級的趨勢下誕生了很多專屬定制的服務(wù),但是智能音箱說到底還是一款標(biāo)準(zhǔn)化的產(chǎn)品,專屬定制就意味著對發(fā)音人系統(tǒng)進(jìn)行全新的規(guī)劃與設(shè)計(jì)并長期運(yùn)維。

  雖然沒有這種標(biāo)準(zhǔn)服務(wù),但是本著對每個(gè)用戶都負(fù)責(zé)的態(tài)度,叮咚與這位留言的用戶取得了聯(lián)系,緊接著一個(gè)生動(dòng)又真實(shí)的故事才呈現(xiàn)到我們眼前。

  王先生來自河南,是一個(gè)從事電梯銷售工作的80后,他原本有著自己幸福美滿的家庭、穩(wěn)定的生活狀態(tài)和對未來的無限期待,卻沒想到一場意外的疾病如噩夢般打破了原本平靜的一切。

  2017年11月,他在醫(yī)院查出了肺癌。隨后他辭去了工作,一邊積極接受治療、一邊在家安心陪伴父母,并開始思考關(guān)于人生的終極問題——如何才能在有限的時(shí)間給世界留下更多痕跡。

  一直以來,王先生對人工智能相關(guān)的話題都非常感興趣,也因此成為了智能叮咚智能音箱的早期用戶,在長期的使用過程中,每天與音箱之間的交互對話場景早已成為了王先生和他的家人生活的一部分。

  于是他就在想,能不能把智能音箱交互對話的聲音換成自己的,用這種方式來陪伴家人,也算是為身邊的人留下一點(diǎn)念想。

  利用語音合成技術(shù)定制專屬聲音

當(dāng)一個(gè)智能音箱有了感情:AI式人文關(guān)懷

  王先生在錄制自己的聲音

  一套語音交互錄制的流程并不簡單,它首先需錄制用戶數(shù)小時(shí)的干聲,對錄音開展數(shù)據(jù)標(biāo)注,隨后進(jìn)行特征訓(xùn)練和技術(shù)優(yōu)化,才使得韻律、音色、音質(zhì)及自然度更加貼近,最終達(dá)到可媲美真人的播報(bào)效果,看似簡單的需求,卻要需要技術(shù)、產(chǎn)品和平臺(tái)的全面支持。

  接到消息后,京東、科大訊飛、叮咚團(tuán)隊(duì)馬上進(jìn)行緊急溝通,鎖定科大訊飛專門負(fù)責(zé)語音合成業(yè)務(wù)的訊飛智聲團(tuán)隊(duì)尋求技術(shù)幫助。溝通后訊飛智聲當(dāng)即決定為這位用戶提供免費(fèi)技術(shù)支持。

  據(jù)介紹,語音合成技術(shù)的主要原理就是根據(jù)韻律建模的結(jié)果,從原始語音庫中其突出相應(yīng)的語音基元,之后再利用特定的語音合成技術(shù)對語音基元進(jìn)行加工和調(diào)整,機(jī)器進(jìn)行語音合成時(shí),往往并沒有這些文本的人聲錄音,而是通過音節(jié)拼接與參數(shù)調(diào)整來合成盡可能接近人聲的完整語音。

  在叮咚官方做出決定后一周,他們在京東奶茶館第一次見到了來北京復(fù)診的王先生。

  王先生首先對叮咚的做法表示了感謝,起初還覺得不可思議的他如今成為了故事的主角,對于病情的話題他也沒有絲毫回避,表示當(dāng)前的身體狀態(tài)應(yīng)該能夠完成長時(shí)間的錄音。

  通過充分的溝通后,相關(guān)工作人員也做好了準(zhǔn)備,等待王先生前去錄制。但是,王先生的病情突然發(fā)生了變化,來北京進(jìn)行聲音錄制的工作一直被延后,從雙方第一次見面到今年3月錄制完畢,王先生已經(jīng)經(jīng)過了四次化療。

  錄制完成后就是緊張的研發(fā)工作,經(jīng)過技術(shù)團(tuán)隊(duì)的不斷努力下項(xiàng)目已盡基本接近完成,兩周后,王先生專屬的TTS發(fā)音人將正式上線到他的專屬智能音箱里。

  科技發(fā)展應(yīng)以人為本

  人類歷史上推動(dòng)社會(huì)變遷的因素當(dāng)中,科技是一個(gè)重要的驅(qū)動(dòng)力,它帶來了生產(chǎn)關(guān)系的進(jìn)步,提升了人的幸福感,即使是工業(yè)革命百年之后的今天,科技的發(fā)展仍是以人為本。

  比如英特爾的創(chuàng)始人戈登·摩爾見到霍金后,就決定開始將他使用的電腦升級至搭載英特爾處理器的設(shè)備。從那以后,英特爾保持著每兩年一次的頻率向霍金提供輔助設(shè)備,并免費(fèi)提供技術(shù)支持。再后來,英特爾實(shí)驗(yàn)室專門選一批專家組建“人機(jī)交流研究團(tuán)隊(duì)”為霍金研發(fā)輔助情境感知工具。

  曾經(jīng)有一次在微軟Build大會(huì)上,微軟盲人程序員Saqib Shaikh在臺(tái)上展示了搭載Seeing AI的智能眼鏡,這款設(shè)備可以通過傳感器來幫他感知并理解這個(gè)世界,這一充滿人文關(guān)懷的時(shí)刻,也得到了很多人的稱贊。

  類似科技公司以人為本的案例不勝枚舉,而叮咚為特殊用戶定制聲音的這個(gè)故事在于,它讓讓普通用戶的數(shù)據(jù)有機(jī)會(huì)參與到了AI的應(yīng)用當(dāng)中來,并且通過自己的數(shù)據(jù)還能為家人帶來一些變化,這種方式已經(jīng)超越了產(chǎn)品本身的意義,已經(jīng)從基礎(chǔ)的功能需求上升到了到價(jià)值傳遞、甚至是人文關(guān)懷的層面。

  人工智能這個(gè)方向還有很多技術(shù)等待著我們?nèi)ヌ剿鳌⑷ソ鉀Q,但“技術(shù)不是目的,技術(shù)只是手段”,通過技術(shù)來突破一些限制,幫助人們創(chuàng)造更美好的生活,并承擔(dān)一些社會(huì)責(zé)任,這才是技術(shù)和產(chǎn)品的最終目的。

  或許,科技本身不存在所謂的人文關(guān)懷,科技的本質(zhì)是探索未知的過程,它充滿著不確定性和真理優(yōu)先的原則,人文關(guān)懷更多的是存在于從事科技行業(yè)的人、與之相關(guān)的企業(yè)、甚至背后的社會(huì)制度當(dāng)中。



關(guān)鍵詞: 智能音箱

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉