機(jī)器人產(chǎn)業(yè)的前途取決于人工智能關(guān)鍵技術(shù)的發(fā)展
03關(guān)鍵技術(shù)與挑戰(zhàn)
本文引用地址:http://butianyuan.cn/article/201801/374104.htm可以預(yù)見,未來服務(wù)機(jī)器人有不少有趣的應(yīng)用,但從技術(shù)實(shí)現(xiàn)的角度看還存在諸多挑戰(zhàn)。
前面提到過機(jī)器人的三大技術(shù)領(lǐng)域,包括感知、認(rèn)知和行為控制。其中行為控制技術(shù)相對來說,已經(jīng)有不少技術(shù)積累。而對于在不久的將來可以實(shí)際大規(guī)模應(yīng)用的服務(wù)機(jī)器人,將會(huì)更偏向于發(fā)展低成本的機(jī)器人。諸如機(jī)械結(jié)構(gòu)比較簡單的輪式機(jī)器人(只有輪式移動(dòng)平臺加上一個(gè)可活動(dòng)的頭,一般沒有手臂或者手臂比較簡單),由于其控制部分較為簡單,因此在感知和認(rèn)知方面的技術(shù),顯得尤為重要。根據(jù)以往機(jī)器人領(lǐng)域的研究進(jìn)展和對應(yīng)用的初步分析可以認(rèn)為如下的感知、認(rèn)知技術(shù),將是實(shí)現(xiàn)應(yīng)用的關(guān)鍵。
1.三維導(dǎo)航定位技術(shù)。不管什么機(jī)器人,只要可移動(dòng),即需要在家庭或其他環(huán)境中進(jìn)行導(dǎo)航定位。其中SLAM(Simultaneous Localization and Mapping)技術(shù)可同時(shí)進(jìn)行定位和建圖,在學(xué)術(shù)研究方面已經(jīng)有不少技術(shù)積累。但對于實(shí)際系統(tǒng),由于實(shí)時(shí)性低成本(比如無法采用比較昂貴的雷達(dá)設(shè)備)的要求和家庭環(huán)境的動(dòng)態(tài)變化(物品的擺放),因而對導(dǎo)航定位技術(shù)提出了更高要求,仍需進(jìn)一步研發(fā)。
2.視覺感知技術(shù)。其中包含人臉識別、手勢識別、物體識別和情緒識別等相關(guān)技術(shù)。視覺感知技術(shù),是機(jī)器人和人交互的一個(gè)非常重要的技術(shù)。
3.語言交互技術(shù)。其中包含語音識別、語音生成、自然語言理解和智能對話系統(tǒng)等。
4.文字識別技術(shù)。生活中有不少文字信息,如書報(bào)和物體的標(biāo)簽信息,這也要求機(jī)器人能夠通過攝像頭來進(jìn)行文字識別。與傳統(tǒng)的掃描后識別文字相比,其可通過攝像頭來進(jìn)行文字的識別。
5.認(rèn)知技術(shù)。機(jī)器人需要逐步實(shí)現(xiàn)規(guī)劃、推理、記憶、學(xué)習(xí)和預(yù)測等認(rèn)知功能,從而變得更加智能。
從目前的研究現(xiàn)狀看,服務(wù)機(jī)器人面對的關(guān)鍵技術(shù)均有了長足進(jìn)步,但還有相當(dāng)多的問題要解決。
04推動(dòng)技術(shù)的研發(fā)與實(shí)際應(yīng)用結(jié)合
英特爾中國研究院的一個(gè)重要研究方向是服務(wù)機(jī)器人,研究范圍主要包括魯棒的三維導(dǎo)航定位、人和環(huán)境的視覺感知以及人-機(jī)器人交互(包含感知、認(rèn)知、行為控制的結(jié)合)等領(lǐng)域,致力于為英特爾的合作伙伴提供先進(jìn)的服務(wù)機(jī)器人技術(shù)。
研究方法以特定的目標(biāo)應(yīng)用領(lǐng)域?yàn)槌霭l(fā)點(diǎn),并以此來推動(dòng)技術(shù)的研發(fā)和在實(shí)際應(yīng)用中的測試。前面提到的助手類應(yīng)用、少兒教育應(yīng)用、老人看護(hù)應(yīng)用,是研究重點(diǎn)。
為了進(jìn)行應(yīng)用測試,英特爾中國研究院建立了實(shí)際的機(jī)器人硬件原型,圖3是平板機(jī)器人原型。左邊是其內(nèi)部結(jié)構(gòu),由一個(gè)帶有英特爾Realsense攝像頭的電腦來控制一個(gè)全向移動(dòng)底盤和頭部的轉(zhuǎn)動(dòng),其高度可調(diào),以便適應(yīng)成人與兒童的互動(dòng)要求。
目前研究院已經(jīng)在視覺感知等領(lǐng)域取得了階段性成果。如圖4中,顯示了利用Realsense攝像頭和SLAM技術(shù)生成家庭環(huán)境地圖,這在后續(xù)就可用來定位導(dǎo)航。研究院還開發(fā)了魯棒的跟蹤技術(shù),可在多人同時(shí)出現(xiàn)的情況下,長時(shí)間正確地跟蹤一個(gè)特定用戶。在未來還會(huì)研發(fā)出更多相關(guān)技術(shù)和應(yīng)用,這些技術(shù)也將服務(wù)于業(yè)界的合作伙伴助力開發(fā)出先進(jìn)的服務(wù)機(jī)器人產(chǎn)品。
05推動(dòng)技術(shù)的研發(fā)與實(shí)際應(yīng)用結(jié)合
對于機(jī)器人技術(shù),大家關(guān)心的一個(gè)問題是,是否需要采用專用的人工智能芯片。
目前探索的一個(gè)方向被稱作混血計(jì)算(Hybrid computing),其是指用通用處理器和其他架構(gòu)一起合作來進(jìn)行計(jì)算。不過,還處于早期探索的階段。
一個(gè)架構(gòu)是否能成功地應(yīng)用于服務(wù)機(jī)器人,需要看性能是否滿足應(yīng)用的需求,功耗等是否合適,這是一個(gè)考慮多種因素平衡的選擇。
可以說現(xiàn)在的通用處理器與已有的一些其他計(jì)算單元(如向量處理單元、GPU),已經(jīng)可以為服務(wù)機(jī)器人提供一個(gè)理想的硬件架構(gòu),尤其是多功能的具有感知、認(rèn)知功能的服務(wù)機(jī)器人。目前機(jī)器人主要的瓶頸,還是在應(yīng)用需求的開發(fā)和感知、認(rèn)知技術(shù)上。當(dāng)然,未來的架構(gòu),也會(huì)隨著對應(yīng)用的深入開發(fā)而不斷創(chuàng)新。硬件設(shè)計(jì)面臨的挑戰(zhàn)越來越大,需要不斷地適應(yīng)未來發(fā)展的演變。同時(shí)也可以考慮用FPGA架構(gòu)來為一些比較專門的應(yīng)用提供加速,這樣在應(yīng)用發(fā)生變化的時(shí)候,將具有更多的靈活性。
評論