未來人機交互是啥樣:手勢控制技術(shù)路線的三個新樣本
前些天,法蘭克福車展上的一則信息讓我們對手勢控制有了一點期待。
本文引用地址:http://butianyuan.cn/article/201612/332514.htm參展的零部件供應商德爾福展示了自家的手勢控制技術(shù),通過使用攝像頭發(fā)射和接收紅外光線,系統(tǒng)可以從反射光線的變化判斷手勢操作。目前確定搭載這項技術(shù)并且量產(chǎn)的車企是寶馬,今年10月24日在國內(nèi)上市的新7系上,購買者就能享受這項頗具未來感的人機交互技術(shù)。
可是,每一項新技術(shù)產(chǎn)品都要經(jīng)歷前瞻試驗、市場調(diào)研、樣品展示、測試校驗等多個階段,最后才能抵達最終量產(chǎn)。目前有關(guān)車內(nèi)手勢控制的前瞻試驗天馬行空,行業(yè)內(nèi)放言量產(chǎn)的新聞還只是捕風捉影。技術(shù)尚未規(guī)?;怯赡男┰?qū)е?,前瞻到量產(chǎn)的中間階段有遇到了哪些阻礙和瓶頸?似乎是個值得說道的話題。
三個天馬行空的手勢控制案例
在車云菌看來,那些未必量產(chǎn)的技術(shù)往往指向了新的可能。在現(xiàn)有的手勢控制案例中,車云菌就發(fā)現(xiàn)了三則有趣的案例。捷豹路虎最為科幻,福特展現(xiàn)出了較高精度表現(xiàn),而微軟的項目可謂輕便有趣。
捷豹路虎和Ultrahapatics:摸得著、看不見
這是距離我們不遠的一則新聞,原來捷豹路虎投資了一家非常年輕的英國創(chuàng)業(yè)公司——Ultrahapatics,這家創(chuàng)業(yè)公司研究出來的手勢觸控技術(shù)名叫ULT003 Mid-air touch,實現(xiàn)的效果非常炫酷。最有趣的一點在于,當你在空中做出觸控操作,手可以感受到類似操控物理按鈕的觸覺反饋。
這背后的技術(shù)原理在于,在觸控區(qū)域會有一個超聲波發(fā)射設(shè)備,通過氣壓變化,在某個特定位置匯聚幾個聲波高壓點,就能生成一個“摸得著、看不見”的界面。只要手在一個有效范圍內(nèi)運動,設(shè)備就會追蹤到你的手部位置變化,在合適的位置憑空“捏造”出一個一個虛擬的三維立體物件,也可以是一個“旋鈕”或者“按鍵”。
ULT003 Mid-air touch展示樣品
和一般觸控操作相比,按鈕會根據(jù)你手的位置同步移動,沒有傳統(tǒng)手勢控制中看著屏幕尋找觸控點位的需要。而且使用者能夠通過觸摸獲得具體信息,你的手部可以真實感受到按鈕的按鍵力、觸摸到平面的質(zhì)感,對操作效果的判斷會因為實在的觸覺反饋,顯得篤定很多。
整個交互過程好比你在聚精會神地閱讀一本小說,順手拿過桌邊的水杯喝水,而視線不需要從書本上挪開,并且水杯會自己“跑到”手邊。曾經(jīng)有不少人質(zhì)疑,手勢觸控仍然要留意觸控位置是否在合適范圍,操作是否成功也要掃一眼屏幕確認,Ultrahapatics的這項“手到擒來”技術(shù),就一次性打消了這兩項顧慮。
福特和英特爾:復雜的面部識別
福特和英特爾合作的手勢控制隸屬于名叫Mobii的項目,原理上使用攝像頭識別手勢,車云菌已經(jīng)在早前的文章中有過介紹,使用到的是結(jié)構(gòu)光技術(shù)。簡單來說,仍然是紅外光反射判斷物體位置、輪廓和運動變化的原理,只不過這種光源具有點線面屬性,尤其擅長3D重建一個立體圖像。
在功能呈現(xiàn)上,手勢控制搭配簡單的語音命令組合,可以在開車時單用手勢調(diào)節(jié)溫度或開關(guān)天窗。這項功能在上述視頻展示中戲份不多,并非技術(shù)上存在限制或瓶頸,而是因為結(jié)構(gòu)光技術(shù)在手勢控制上顯得有些“大材小用”,福特和英特爾瞄準的是更加復雜的面部識別。
利用駕駛員前方的攝像頭對駕駛位的人臉掃描,判斷是否為認證車主,有沒有啟動車載系統(tǒng)的權(quán)限。陌生人在做出進一步操作時,車主手機會收到車內(nèi)人的正面圖片,可以在手機端授權(quán)。已經(jīng)獲得認證的駕駛者除了可以開啟車機系統(tǒng)等一系列功能,還可以調(diào)用系統(tǒng)中保存的個性化設(shè)置。
從面部識別技術(shù)的展示中,我們也可以從側(cè)面發(fā)現(xiàn)這項技術(shù)的兩點優(yōu)勢。首先,刷臉驗證身份的方式可以佐證這項技術(shù)的精細程度。畢竟“看清”人的臉部五官和分清手部形態(tài)變化相比,達到了一個更高的精準層級。其次,資料顯示,如果系統(tǒng)檢測到車內(nèi)還有其他乘客,就會關(guān)閉透露個人隱私的頁面,僅僅對導航界面露出。某種程度上反映了用于識別的系統(tǒng)可支持多線程作業(yè)。
豐田和微軟:四種手勢姿勢
微軟關(guān)于手勢控制的思考看起來很有意思。這家互聯(lián)網(wǎng)公司曾經(jīng)考慮把手勢控制引進汽車內(nèi)部,用到的設(shè)備僅僅是咱們手機上的內(nèi)置攝像頭。和前兩個案例相比,這是一個適用車內(nèi)環(huán)境的“后裝”方案。
這個動向之所以被人發(fā)現(xiàn),是因為一則來自2012年微軟的專利申請。專利內(nèi)容中,三位研究人員搭建了汽車娛樂信息系統(tǒng)的手勢控制系統(tǒng)。但這些控制動作和我們常見的抬手、滑動、旋轉(zhuǎn)完全不同,他們是下面圖片這個樣子。
食指抵住嘴唇表示調(diào)低手機外放音量,手張成喇叭狀表示使用手機撥打電話,類似思考著的攥下巴動作則表示“我想檢索信息”,而點贊動作代表“同意”操作。
使用這個系統(tǒng)的時候,你需要把智能手機擱在儀表盤上方,用到手機的內(nèi)置設(shè)想頭來捕捉車內(nèi)人的手勢和體態(tài)動作,車云菌合理推測一下,背后支持這項功能的應該是圖像識別技術(shù)。軟件層面,三位研究人員對系統(tǒng)的設(shè)定是手勢控制搭配語音識別一起使用,后者在車內(nèi)人機交互中更為常見。
這個手勢控制方案最終還沒有看到落地案例,你還沒法目睹人們在車里的這些奇奇怪怪的控制手勢。信息還顯示,微軟2013年和豐田合作的概念車Smart Insect的項目中,已經(jīng)用車內(nèi)前裝攝像頭實現(xiàn)了前裝版本的手勢控制功能。所有手勢恢復了常規(guī)的抬起落下,多數(shù)用來操作車內(nèi)的二級控制功能,例如娛樂信息系統(tǒng),導航或者撥打與車機連接的手機。
手勢控制為何遲遲不能落地
上述三則案例的想法比較天馬行空,對于最終的商業(yè)化時間,各家也沒有給出確定的日期。捷豹路虎投資Ultrahapatics的新聞發(fā)生在本月,福特和豐田的技術(shù)展示雖然早在數(shù)年之前就掀起波瀾,但遲遲未見落地的最新信息。在相當一段時間里,這三種技術(shù)還停留在“只能看不能買”的展示階段。
其實關(guān)于手勢控制,除了干干脆脆亮出產(chǎn)品面世時間的寶馬,瞄準量產(chǎn)目標的車企還有多家。今年年初的CES上,大眾也用一輛Golf R Touch 展示了基于TOF的手勢控制技術(shù),和寶馬新7系的技術(shù)同宗,但是據(jù)稱首款量產(chǎn)車型是2018年的奧迪A8。奔馳早在2012年就率先展示了手勢控制系統(tǒng)DICE(Dynamic & Intuitive Control Experience),雖然樣品上有誤判情況,在幾年內(nèi)改良到了最新版本,但是搭載隨著新一代奔馳E級和S級車的未來上市,或許可以期待。
除了ABB陣營的Demo展示,其他企業(yè)對手勢控制技術(shù),自始至終都表露出了濃厚興趣。據(jù)稱過去幾年間,福特、本田、現(xiàn)代都就手勢控制申請了專利。通用也聯(lián)合高校研究人員,想在這個方面搞出些名堂。但是目前看來,這項技術(shù)落地方面,還只有寶馬一家獨大。
從絡繹不絕的案例展示來看,技術(shù)層面似乎已經(jīng)不存在絕對門檻,現(xiàn)有的手勢控制技術(shù)多數(shù)使用紅外線技術(shù)、雷達探測和圖像識別等方式來實現(xiàn)功能。于是,一個值得思考的問題是,手勢控制為何遲遲未能落地,這項人機交互技術(shù)在未來車上,會處于何種地位?在車云菌看來,原因可能有以下兩點:
1.安全前提下的表達可能性有限,阻礙了手勢控制技術(shù)進入量產(chǎn)車型。一個明顯趨勢是,手勢控制常常會和其他人機交互功能配合使用。例如福特和英特爾的項目中,手勢控制就需要搭配語音控制來操作,在車云菌看來,這一設(shè)定的目的是簡化操作流程,確保行車環(huán)境的安全。
這則案例中,語音和手勢控制搭配的出發(fā)點在于,用手勢控制來直觀指示出動作的目標物,這部分功能在語音控制中的分析階段,往往需要耗費復雜的分析資源。而讓目標物做些什么,自然不是一個手勢可以說的明白的。
2.功能執(zhí)行精度欠缺、過度不夠平滑,也在一定程度上制約了手勢控制普及。如果對上述案例和現(xiàn)階段出現(xiàn)的手勢控制做個總結(jié),不難發(fā)現(xiàn)手勢控制在車內(nèi)的應用主要集中在二級控制,集中在娛樂信息系統(tǒng)和諸如天窗、空調(diào)等車內(nèi)設(shè)施的操控,并不會涉及駕駛操控。
一則相關(guān)聯(lián)的兩個操作之間,很可能會因為車內(nèi)空間局限,導致控制目標的判斷錯誤。你只是想把音量調(diào)低幾格,卻不小心打開了雨刮器。另外,同一目標物的不同指令動作間,需要建立明顯區(qū)隔,起止動作的設(shè)置也存在復雜的邏輯關(guān)系。車云菌發(fā)現(xiàn)奧迪在CES上展示手勢控制中,會把控制區(qū)內(nèi)的右手平放下壓動作設(shè)置為操作功能起點。不過一旦右手離開有效區(qū),就需要重新執(zhí)行下壓動作喚醒功能,這在實際應用中,就是個不得不保留的冗余操作。
車云小結(jié)
人與車的交互目標,是盡量接近日常生活的交流形式,甚至讓人與車之間的交流變得不易覺察。因此,手勢控制也要講究化繁為簡的策略,用自然流露的手勢和體態(tài),在最具優(yōu)勢的方面發(fā)揮作用。量產(chǎn)不能盲目,把力用在刀刃上才是正經(jīng)事。
評論