機器視覺——為人工智能產(chǎn)業(yè)化加速配上“眼睛”
美國制造工程師協(xié)會(SME)視覺分會和美國機器人工業(yè)協(xié)會(RIA)自動化視覺分會對機器視覺的定義為:是通過光學裝置和非接觸式的傳感器,自動的接受和處理一個真實物體的圖像,以獲得所需信息或用于控制機器人/機械運動的裝置。
本文引用地址:http://butianyuan.cn/article/202003/411228.htm機器視覺最a早被提出來是在20世紀60年代,直到20世紀80到90年代,機器視覺才迎來了蓬勃發(fā)展,而在21世紀之后,機器視覺技術(shù)才步入成熟期。
有公開數(shù)據(jù)顯示,在2018年,全球用于工業(yè)自動化領(lǐng)域的機器視覺技術(shù)市場規(guī)模達44.4億美元,預(yù)計2023年將達122.9億美元,其年復合增長率高達21%。
相較于全球機器視覺行業(yè)而言,中國的機器視覺相關(guān)產(chǎn)業(yè)起步較晚,但發(fā)展速度很快。自2011年到2019年,我國機器視覺市場從10億元躍升到百億級,每年都維持著兩位數(shù)的增速。目前,中國已成為僅次于美國和日本的世界第三大機器視覺市場。
而2020年新冠疫情的爆發(fā),雖然對整個行業(yè)有一定的沖擊影響,但卻成為了機器視覺最大的“練兵場””——無人機噴灑消毒、機器人無接觸式配送等,加速了大眾對機器人的認知,長期來看,這無疑會加速機器視覺行業(yè)的發(fā)展進程,各行各業(yè)將會對機器視覺的功能特性運用更加多元化,助推行業(yè)的全面升級。
從目前的行業(yè)發(fā)展來看,機器視覺在功能上的應(yīng)用主要表現(xiàn)在四個方面:
一、導航和定位
對于人眼而言,導航和定位,實則就是通過雙眼來目標物體的判定相對位置和絕a對位置。于機器而言,則需為其造一雙“眼睛”——3D視覺來實現(xiàn)的。
談到3D視覺,首先說說3D視覺的測量原理。目前市場上主流的有四種3D視覺測量技術(shù):雙目視覺、TOF、結(jié)構(gòu)光和激光三角測量。
1、雙目技術(shù),是目前較為廣泛的3D視覺系統(tǒng),它的原理就像我們?nèi)说膬芍谎劬?,用兩個視點觀察同一景物,以獲取在不同視角下的感知圖像,然后通過三角測量原理計算圖像的視差,來獲取景物的三維信息。
雙目視覺對于硬件要求低,因而能一定程度上控制成本。但它對于環(huán)境光照非常敏感,光照角度變化、光照強度變化等環(huán)境因素的影響,拍攝的圖片亮度差別會比較大,這無疑加大了對算法的要求。另外相機基線(兩個攝像頭間距)限制了測量范圍,測量范圍和基線關(guān)系很大:基線越大,測量范圍越遠;基線越小,測量范圍越近。
雙目視覺優(yōu)劣勢決定了它更適合于制造現(xiàn)場的在線、產(chǎn)品檢測和質(zhì)量控制。當然也有一些產(chǎn)品也會用此技術(shù)原理,如基于slam算法導航定位的終端產(chǎn)品、體感攝像頭等。
2、TOF(全稱:TimeOfFlight)飛行時間法成像技術(shù),它的原理是通過給目標物連續(xù)發(fā)送光脈沖,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行時間來得到目標物距離。
TOF的核心部件是光源和感光接收模塊,它不需要類似雙目視覺算法來計算,通過特定的公式即可直接輸出物體的深度信息,因而具有響應(yīng)快、軟件簡單、識別距離遠的特點,而且由于不需要進行灰度圖像的獲取與分析,因此不受外界光源物體表面性質(zhì)影響,不過TOF技術(shù)的缺點是,分辨率低、不能精密成像。
這就決定了TOF技術(shù)更適合遠距離的3D信息采集,我們最a常見的就是自動駕駛領(lǐng)域的激光雷達,但由于自動駕駛行業(yè)的發(fā)展特點,從而導致在該領(lǐng)域的激光雷達公司并不多,市場份額都已被頭部企業(yè)占領(lǐng),后入者的市場門檻就因此變得很高。近幾年來,隨著ToC市場掃地機器人市場份額的不斷壯大,很多企業(yè)都在考慮運用TOF技術(shù)進入該領(lǐng)域,在這里分得一杯羹。但擺在以TOF技術(shù)企業(yè)眼前最a主要的問題是如何降低成本,我們拭目以待。
3、由于雙目和TOF都有各自的缺點,所以就有了第三種方式——結(jié)構(gòu)光技術(shù),它通過一個光源投射出一束結(jié)構(gòu)光,打到想要測量的物體上,因為不同的物體有不同的形狀,這就會因一些條紋或斑點發(fā)生不同的變形,有這樣的變形之后,就需要通過算法可以計算出距離、形狀、尺寸等信息,從而獲得物體的三維圖像。
結(jié)構(gòu)光技術(shù),既不需要用很精準的時間延時來測量,又解決了雙目中匹配算法的復雜度和魯棒性問題,所以具有計算簡單、測量精度較高的優(yōu)勢,而且對于弱光環(huán)境、無明顯紋理和形狀變化的表面,同樣都可進行精密測量,所以越來越多的行業(yè)應(yīng)用采用結(jié)構(gòu)光技術(shù)。最a為常見的就是手機的面部識別。
4、激光三角測距技術(shù),也是一種幾何測量方法,本質(zhì)上講,是在利用物體之間的三角幾何關(guān)系進行測距。一個典型應(yīng)用就是利用激光作為光源的測量方案,它也是基于光學幾何原理,根據(jù)光源、物體和檢測器三者之間的幾何成像關(guān)系,來確定空間物體各點的三維坐標。
這種方法通常用激光作為光源,用CCD/CMOS相機作為檢測器,具有結(jié)構(gòu)光3D視覺的優(yōu)點精準、快速、成本低的優(yōu)點。根據(jù)幾何原理計算,被測物體越近,在CCD/CMOS上的位置差別就越大,分辨率和精度就越高,所以這種測量法在中近距離下的精度很高,特別適合中近距離測距,所以成為了室內(nèi)機器人測距定位的首a選方案。
二、外觀檢查
外觀檢查是通過圖像處理技術(shù)來完成的,圖像處理其實是計算機對圖像信息進行處理。
對圖像進行處理的主要目的有三個方面:提高圖像的視感質(zhì)量、提取圖像中所包含的某些特征或特殊信息、圖像數(shù)據(jù)的變換、編碼和壓縮,以便于圖像的存儲和傳輸。而這些正是生產(chǎn)線上檢查產(chǎn)品是否存在質(zhì)量問題最a好的應(yīng)用,這個環(huán)節(jié)也是取代勞動力最a重要的部分。
除此,它還在其它的一些領(lǐng)域有應(yīng)用,如生成原圖的預(yù)覽圖、在小車或無人飛行器上裝載攝像頭,利用圖像處理技術(shù)處理攝像頭拍攝的畫面。
三、識別
識別,從字面上就可以看出,這是一個認識加辨別的過程,需要機器有類人的判斷。因此識別主要是通過圖像處理和深度學習的融合來實現(xiàn)這個功能。
圖像處理把外部物體信息轉(zhuǎn)換成機器語言,然后過視覺感知來完成信息的輸入,這一過程實質(zhì)就是機器學習的過程,兩者疊加融合,從而使得識別功能變得智能。最a為常見的應(yīng)用就是人臉識別和無人駕駛。
四、高精度檢測
高精度檢測其實和第一個導航定位功能原理相同,不同的是,它可能會把多個測量技術(shù)融合在一起,形成高精度的檢測系統(tǒng)。
因為運用到高精度檢測的行業(yè)一般都是在精密加工型產(chǎn)業(yè)與高端工業(yè)制造領(lǐng)域等高要求的行業(yè),檢測精度要求達到um級,這些都是人眼無法檢測到,必須用機器完成的。而這也成為了工業(yè)4.0時代,工業(yè)自動化的關(guān)鍵應(yīng)用。
人工智能和中國制造2025戰(zhàn)略的深入下行,勢必帶來機器視覺需求的不斷提升。
機器視覺屬于技術(shù)密集型行業(yè),核心技術(shù)的積累和持續(xù)的技術(shù)創(chuàng)新是企業(yè)取得競爭優(yōu)勢的關(guān)鍵因素之一,我們期待行業(yè)有更多的優(yōu)秀者出現(xiàn),一起為整個行業(yè)的發(fā)展添磚加瓦。
評論