讓機(jī)器人真正去“看見”世界還有多難?
很快,我們可能就會(huì)在某些地方看到機(jī)器人,但實(shí)際上,短期內(nèi)我們不會(huì)看到機(jī)器人穿行于街道,也不會(huì)看到它們游走在辦公室。一個(gè)重要的原因就是機(jī)器人至今無法真正“看見”世界,在談?wù)摍C(jī)器人未來如何看見世界前,我們先要討論一下“看見”的真正意思。
本文引用地址:http://butianyuan.cn/article/284895.htm“我看見你”
大多數(shù)人有兩只眼睛,它用來收集物體反射的光線。眼睛將光線轉(zhuǎn)化為電信號,傳送到視神經(jīng),大腦瞬間對信號進(jìn)行處理。根據(jù)電脈沖和人的體驗(yàn),大腦判斷我們身邊的物體是什么。它向我們呈現(xiàn)世界的模樣,我們用它來導(dǎo)航,來撿起東西,用它來看見別人的臉,做其它無數(shù)的事。
研究人員發(fā)現(xiàn),大腦最多會(huì)有50%參與到視覺處理中去。幾乎世界上所有的動(dòng)物都有眼睛,都能以某種方式觀看。大多動(dòng)物(尤其是昆蟲)的大腦比人簡單得多,但它們的視覺功能很好。
這說明一個(gè)事實(shí):即使沒有人腦一樣強(qiáng)大的運(yùn)算能力,以其它形式 “看見”仍然是可以的。在進(jìn)化的過程中,“看”能力的出現(xiàn)無疑是一個(gè)重要的里程碑。
機(jī)器人視覺
許多機(jī)器人研究者預(yù)測,如果機(jī)器人能“看見”,它就可以迅速普及并最終成為人類的幫手,這恰恰是許多人期待的。
自從20世紀(jì)70年以來,機(jī)器人視覺工程師就一直在研究圖像的特點(diǎn),比如說角落和紋理可能就是線或者有趣的點(diǎn)。于是工程師編寫算法去找到這些特征,從視頻一幀一幀的圖像中去追蹤它。
一張圖片有幾千萬像素,采用這種方法可以將海量的數(shù)據(jù)大幅削減,只需要掌握幾百或者幾千個(gè)特征就行了。
不久之前,計(jì)算能力還受到限制,現(xiàn)在有了很大的進(jìn)步。工程師們開始思考機(jī)器人到底想看見什么,想做什么。他們編寫軟件建立識別世界的模式,幫助機(jī)器人理解它身邊的一切。
本地環(huán)境
當(dāng)機(jī)器人運(yùn)行時(shí),軟件可能會(huì)為環(huán)境建立基本模式,它可能會(huì)將自己找到的特征和特征庫匹配,最終找到自己想要的。
遺憾的是這樣的系統(tǒng)仍然不太可靠,它無法防止機(jī)器人碰撞,無法投入到實(shí)際使用中去。最近媒體談?wù)摰臒o人駕駛汽車就是用激光或者雷達(dá)來補(bǔ)充視覺系統(tǒng)的。
在過去5到10年里,一個(gè)新的機(jī)器人視覺研究社區(qū)開始形成。研究人員沒有采用編程的方法展開研究,而是要讓機(jī)器人學(xué)會(huì)如何自己觀看。
他們開發(fā)了機(jī)器人視覺系統(tǒng),其架構(gòu)構(gòu)思來自于科學(xué)家對動(dòng)物視覺的認(rèn)識。他們使用了一個(gè)名叫“神經(jīng)元層”的概念,它和動(dòng)物的大腦相似。工程師為系統(tǒng)架構(gòu)編程,但沒有開發(fā)運(yùn)行系統(tǒng)的算法。算法交給機(jī)器人自己去解決。
這門技術(shù)就是所謂的“機(jī)器學(xué)習(xí)”,我們現(xiàn)在只要用付出合理的成本就能得到強(qiáng)大的計(jì)算力,正因如此“機(jī)器學(xué)習(xí)”技術(shù)才開始變得流行起來。大家對這門技術(shù)的投資正在加速。
分散學(xué)習(xí)
機(jī)器學(xué)習(xí)之所以重要,首先是因?yàn)樗梢宰寵C(jī)器人輕易分享學(xué)習(xí)成果。機(jī)器人沒有必要像新生動(dòng)物一樣從頭學(xué)起,將其它機(jī)器人的學(xué)習(xí)體驗(yàn)植入到新機(jī)器人中就可以了,在此基礎(chǔ)上再提高。
某個(gè)機(jī)器人也許學(xué)會(huì)了觀察貓,知道它是什么樣的,它可以將自己的認(rèn)知傳授給其它機(jī)器人。例如,可以讓一千個(gè)機(jī)器人觀察不同的貓,彼此通過互聯(lián)網(wǎng)分享數(shù)據(jù),一起學(xué)習(xí)如何給所有貓分類。這就是分散學(xué)習(xí)的好例子。
實(shí)際上,未來的機(jī)器人分享、分散學(xué)習(xí)會(huì)造成深遠(yuǎn)的影響,它嚇壞了一些人,也讓一些人興奮。
很可能你的信用卡現(xiàn)在正在被數(shù)據(jù)中心自動(dòng)學(xué)習(xí)機(jī)器調(diào)查,它想看看你是不是騙子。系統(tǒng)可以發(fā)現(xiàn)人類發(fā)現(xiàn)不了的蛛絲馬跡。此時(shí),蜂群思維被用來做好事。蜂群思維是一種集體思維,是指由許多獨(dú)立的單元高度連接而成的一個(gè)活系統(tǒng)。
真正的機(jī)器人進(jìn)化
機(jī)器人的應(yīng)用范圍廣闊,在我們的生活中幾乎沒有它不可以幫上忙的地方。它首先可能會(huì)用在勞動(dòng)力短缺的行業(yè),如建筑業(yè),或者是天生就不討人喜歡的行業(yè),如危險(xiǎn)行業(yè)。它還可以用于災(zāi)后搜救,可以將人撤離危險(xiǎn)場所,或者用在受到限制、人難以進(jìn)入的空間。
人很難保持長時(shí)間的注意力,在一些需要長時(shí)間保持高度注意力的地方,機(jī)器人可以派上用場。如果機(jī)器人可以看見我們,未來家庭式機(jī)器人伙伴將大有用武之地。
在手術(shù)室,會(huì)觀看的機(jī)器人能成為助理外科醫(yī)生。機(jī)器人擁有超級視力,操作超級精準(zhǔn),手臂和手掌穩(wěn)定,外科醫(yī)生只要做好決策就行了。
當(dāng)機(jī)器人醫(yī)生的蜂群思維形成,人的決策能力也可能被替代。機(jī)器人將可以完全代表人做手術(shù)。
評論