關 閉

新聞中心

EEPW首頁 > 工控自動化 > 設計應用 > 圖像傳感器的發(fā)展可滿足新興的嵌入視覺需求

圖像傳感器的發(fā)展可滿足新興的嵌入視覺需求

作者: 時間:2012-10-10 來源:網絡 收藏
要點

本文引用地址:http://www.butianyuan.cn/article/159810.htm

1.隨著處理器、、存儲器和其它半導體器件的性能提高、成本下降與功耗減小,開發(fā)人員正針對各種系統(tǒng)形狀因數(shù)和價格點,評估為它們增加功能的情況。

2.傳統(tǒng)基于的設計可以支持很多實現(xiàn),但對于深度識別要求,通常需要一個3D子系統(tǒng)。

3.深度映射的常見方法是立體傳感器陣列,它將兩個攝像頭“固定”起來;結構光法是將一個預設的光模式投射到屏幕做分析;而飛行時間法則是通過投射光經過的時間(從源到物體,再返回傳感器)計算出距離。

看一下你正在做的設計,或者更省事一點,看一下你的周邊,你很可能會發(fā)現(xiàn)攝像機正在盯著你,甚至不止一臺。圖像傳感器和它配套的圖像處理器正在各種電子產品中日益普及。

例如,現(xiàn)在幾乎不可能買到一款不帶攝像頭的筆記本電腦,而越來越多的一體機、專用計算機顯示器,甚至電視機中都包含了攝像頭。智能手機與平板電腦也更多地配上了圖像傳感器,通常前后都有,有時甚至采用“立體”配置以獲取三維圖像。甚至在便攜媒體播放器和汽車內也能看到攝像頭的存在。

豐富的應用

設計中增加攝像頭的基本理由一般是實現(xiàn)基本的圖像捕捉,尤其是靜像、錄像以及視頻會議。但由于已經有很多圖像構建塊,軟件與系統(tǒng)開發(fā)者也充分將它們用于更多新的用途,如根據內容識別含義,根據判讀的信息采取動作。

例如在汽車應用中,先進的分析系統(tǒng)并不是簡單地將后視攝像頭捕捉的視頻送到LCD屏幕上,它還會警告駕駛員在車后探測到了某個物體,更先進的系統(tǒng)甚至能緊急剎車以避免撞車的發(fā)生。

在汽車兩側和周圍很多位置還可以安裝更多的攝像頭,用以提醒駕駛者,先進的實現(xiàn)還會采取措施,以避免無意的變道或與前方物體的碰撞。它們還可以解析出道路標志的含義,對駕駛者提出超速或可能發(fā)生碰撞的警告。攝像頭能夠實現(xiàn)對收音機和其它汽車子系統(tǒng)的手勢界面控制,從而減少駕駛者的分心,它們可以發(fā)現(xiàn)正在打盹、發(fā)短信或做著其他分神的事的駕駛者,讓他們把全部注意力放回道路上。

智能手機、平板電腦、計算機和電視用前置攝像頭可完成不同功能。它們可以警告用戶距離顯示器過近或過遠,或姿勢不好。它們可以確保有人坐在顯示器前時,顯示屏背光一直亮著,而當人走開時,顯示屏背光自動關閉。在這些例子和其它消費電子應用中,手勢界面扮演著越來越重要的角色(如在游戲機中),它為傳統(tǒng)的按鈕按鍵、觸摸板或鼠標的操作提供了一種補充(雖然不是替代)。

正面的攝像頭可以用于監(jiān)控呼吸,它量度胸腔的起伏節(jié)奏,并且通過探測血流引起的面部顏色微小的周期性變化測出心律。它可以監(jiān)控眼球的移動,警告一個人喝酒過多了。它可以判斷出一個出現(xiàn)在系統(tǒng)前的人是授權用戶,自動為其登錄,并裝入特定賬戶的程序與設置。而后置攝像頭則可以采用增強現(xiàn)實的手段,為某個物體或場景的普通視圖提供額外的信息。

這些是的典型例子,這個迅速的應用類型已擴展到專用功能設備,如監(jiān)控系統(tǒng)和生產線檢查設備等。有些情況下,過去是由運行PC操作系統(tǒng)的計算機執(zhí)行視覺分析工作,但這種方法成本高、笨重、功耗大,并且不可靠。在其它一些情況下,任一或所有這些因素都會導致不可能實現(xiàn)視覺功能。

現(xiàn)在,由于處理器、圖像傳感器、存儲器和其它半導體器件的性能提高、成本下降及功耗減小,開發(fā)人員可以針對各種系統(tǒng)規(guī)模和價格點,評估嵌入視覺的能力,這也提升了對越來越強健的圖像子系統(tǒng)的

距離還是分辨率

多年來, 消費數(shù)碼相機市場的動力一直是“像素越多越好”的心態(tài),由于這些圖像傳感器有大規(guī)模的批量,因而價格較低,所以也進入了很多嵌入視覺系統(tǒng)。但近年來,這種過分簡單化選擇策略的局限性已經越來越明顯。

首先,消費者日益發(fā)現(xiàn),除非他們要把照片放大打印到一整面墻那么大,或對源照片做嚴格的剪裁,否則根本不需要高分辨率的圖像,高分辨率照片要占用龐大的存儲空間。另外,現(xiàn)代相機拍出的高噪聲照片或經人為修補的照片,揭示出了越來越高的分辨率的缺陷。

傳感器尺寸必須保持很小以維持性價比,這是消費電子系統(tǒng)的一個重要特性。當制造商硬性在傳感器中塞入更多像素時,可想而知,必須縮小單個像素的尺寸。在確定的時間量下,越小的像素獲得的光子數(shù)越少,因此降低了光敏感度。這樣不僅降低了相機的低光性能,同時也對系統(tǒng)動態(tài)范圍產生了負面影響。后處理工作只能部分地補償這種損失,通常是只采用運動修補和其它折中方法。

諷刺地是,嵌入視覺應用的傾向于采用較通用攝影更低的分辨率。例如,微軟公司Kinect中使用的紅外和可見光圖像傳感器都是VGA(640×480像素)分辨率的類型,而視覺外設只將QVGA(320×240像素)的深度圖像傳送給連線的游戲機或PC。

鑒于現(xiàn)代傳感器中可用像素已經過剩,有些供應商轉而采用非傳統(tǒng)Bayer RGB模式的濾波器陣列方案,將多余像素用于提高光靈敏度和彩色精度(圖1)。額外的(和改變的)濾波器顏色據說能提高全譜段上的單像素插值結果,而單色(或無濾波器)像素可以進入更多光線,付出的代價是沒有了彩色識別能力(參考文獻1)。

圖像傳感器的發(fā)展可滿足新興的嵌入視覺需求

圖1,Bayer傳感器模式以一位柯達圖像科學家的名字命名,它保留了數(shù)字影像應用中的

濾波器陣列方法(a)。更多現(xiàn)代方案則以一種隨機方式增加了綠色光譜像素,以提高可見光頻譜中這一最重要部分的細節(jié)(b),使用減色(代價是需要更多的后期處理),以提高濾波器的光傳輸能力(c),甚至為像素混合體增加無濾波器的單色像素(d)。

萊卡相機公司的最新數(shù)碼相機將濾波器的變通做到了極致,它用自己的無濾波器單色圖像傳感器,僅捕捉黑白圖像(圖2a)。但即使在高ISO設置下,其照片銳度也獲得了評論家們的支持。

圖像傳感器的發(fā)展可滿足新興的嵌入視覺需求

圖2,Leica公司的M Monochrom要價8000美元,只能捕捉到黑白圖像,但評測者們都盛贊該相機的清晰度與低照度下的性能(a)。諾基亞808 PureView智能手機包含有一個超強的4100萬像素圖像傳感器,用于實現(xiàn)數(shù)字變焦,以及集簇像素的光學收集能力(b)。索尼開發(fā)的名為背照的傳感器設計技術,它將像素互連接線改到光電二極管背后,從而改善了每像素填充因素比(c)。

同時, 諾基亞公司的8 0 8PureView智能手機嵌入了一只4100萬像素的圖像傳感器, 但缺省情況下只輸出800萬像素或更低分辨率的圖像(圖2b和參考文獻2)。808PureView會根據數(shù)字變焦設置,將多個像素組合成為不同尺寸的簇,從而省掉了復雜、昂貴和笨重的光學變焦結構,并將實際的單像素光子收集能力提高了很多倍,改善了低光照下的性能。

索尼公司開發(fā)了一種稱為背照的傳感器設計技術(圖2c)。撇開實現(xiàn)細節(jié)不談,該技術是將像素間的連線布放到像素光電二極管的后面,從而改善了傳感器單像素的填充因數(shù)(即感光面積占總面積的百分比),因此也提高了低光照性能。

深度識別

基于傳統(tǒng)圖像傳感器的設計可以支持很多嵌入視覺實現(xiàn)。例如,它可以幫助解析基本手勢,以及處理基本的面部探測與識別工作,通常也適用于光學字符識別功能。但是,它可能無法明確地探測出復雜的手勢,如針對攝像頭的進退運動(3D),因為手勢被嚴格限制在垂直和水平面上(2D)。更常見的是,它不能完全分辨一個物體的整體,即深度;例如,它無法輕松區(qū)分出是真臉還是該人的照片。對于這類深度識別的,通常需要有一個3D圖像傳感器子系統(tǒng)(參考文獻3)。

無論哪種3D傳感器實現(xiàn),常見的輸出就是深度圖,這是一個圖像陣列,其中每個像素數(shù)據項(有時為了人類判讀目的而要做附加的彩色編碼)都代表著傳感器與傳感器前方某點之間的距離(圖3)。每個深度圖幀通常都配合一個由普通2D圖像傳感器捕捉的相應幀,兩個幀要相互做視差校正,因為兩臺攝像頭所處位置不同。

圖像傳感器的發(fā)展可滿足新興的嵌入視覺需求

圖3,無論采用哪種3D攝像頭技術, 都能給出一個物體的深度圖(a)。像HTC EVO 3-D智能手機這樣的設備也可以用于3D嵌入視覺用途,該手機的立體傳感器陣列主要用于捕捉3D靜像和頻圖像(b)。微軟的Kinect(c)采用的是結構光方法,測深的方法是在投影儀的前方投射一個知的紅外光模式,然后分析它所看到橢圓的形狀與方向(d)。

有一種常用的判斷深度方法是使用一個立體傳感器陣列,它是按照類似一對人眼的結構,布放兩個圖像傳感器。圖像SoC像人類的大腦和眼睛一樣,處理傳感器從不同視點對一個物體的視圖,從而評判出物體與傳感器陣列之間的距離。在多視圖幾何應用中,可以將雙傳感器擴展至多傳感器。雙傳感器方案通常有最低的成本、最小的功耗、最小的外形,如果設計中已經有多個傳感器用于3D靜像攝像和視頻捕捉,則這種方案更有吸引力。

有一種立體影像實現(xiàn)是分立的“雙眼”方案,實現(xiàn)方法是將兩個攝像頭“拴”在一起。雖然從硬件角度看,這是最直接的概念,但所需要的軟件支持則比較復雜。打個比方,把兩輛摩托車用一個公共軸連接起來,也成不了一輛汽車。攝像頭需要做校正才能得到可靠的圖像配準,經常有這種情況,攝像機陣列或物體在運動,此時必須做幀的同步。

還有一種方法,可以將兩只圖像傳感器裝在單只SoC或多片芯封裝內,通過一個總線輸出聯(lián)合數(shù)據流。這種完全集成化方案的優(yōu)點是便于控制和幀同步。更緊密的集成改善了校正工作,從而獲得更好的立體影像結果,即增強的深度感知能力和更快的圖像處理速度。

投影方案

結構光(Structured light)是第二種常見3D傳感器方法,也是微軟Kinect中使用的技術,它是將預設的光模式投射在一個屏幕上,以供分析之用。結構光方法的3D傳感器方案采用一個投影儀來建立光模式,并有一個攝像頭用于探測結果。

Kinect的投影儀是采用的紅外光,使用的是x和y方向上不同焦距的散射鏡。鏡片后的一個紅外激光器將一個包含大量點的圖像投射出去,圖像變換成橢圓,其特定的形狀與方向取決于每種情況下物體離鏡片的距離。

結構光的優(yōu)點在于,它有精密的細節(jié)分辨率和高精度,尤其是在暗光環(huán)境下,此時主要針對可見光譜的傳感器就很難捕捉到恰當?shù)膱D像。與立體傳感器方案相比較,結構光的軟件算法也更簡單,雖然光點云的處理可能會有接近于立體視覺的大計算量。

不過,結構光技術依賴于紅外光,至少Kinect證明了這點,這意味著該技術在室外工作會有問題,室外環(huán)境下,太陽光中的紅外輻射將破壞性地干擾投影儀的光線。另外,投影儀既昂貴又笨重,消耗功率可觀, 并大量發(fā)熱; 事實上,Kinect專門為此而做了一個風扇(參考文獻4)。必要的定制投影鏡片又增加了總的物料成本。

飛行時間(Time of flight)是第三種常見的3D傳感器實現(xiàn)方法。與結構光一樣,飛行時間攝像頭包括一個圖像傳感器、一只鏡片和一個有源發(fā)光源。但采用飛行時間方法時,攝像頭會根據投射光從光源到投影儀,再回到圖像傳感器的時間,得出范圍或距離(參考文獻5)。發(fā)光源一般可以是一只脈沖激光器或調制光束,具體取決于設計采用的圖像傳感器類型。

集成了數(shù)字時間計數(shù)器的圖像傳感器通常帶有脈沖激光束,正如包括快門的距離選通傳感器。對于后者,快門以投影儀投射脈沖光束的速度開閉。因此,每個圖像傳感器像素所“看到”的光通量就與脈沖傳輸?shù)木嚯x有關,這就是從傳感器到物體的距離。帶相位探測器圖像傳感器的飛行時間設計則采用了調制波束源。波束的強度隨時間而改變,因此測量進入光的相位,就間接地得到了“飛行時間”的距離。

飛行時間攝像頭在汽車應用中很常見,例如行人探測和駕駛員輔助,并且在機器人產品中也很普遍。它們還在軍事、國防與航空領域有較豐富的應用史。所需要的圖像處理軟件比較簡單,因此要比立體攝像頭結構的必備軟件更有實時能力,雖然飛行時間技術對環(huán)境照射干擾和多次反射的敏感性多少會使算法復雜化。

飛行時間方案的幀速率可以非常高,達到每秒60幀,用立體影像設置難以達到這個速度,但其分辨率通常相對較低。并且與結構光技術相比,需要的時間飛行光投影儀帶來了成本、功耗(及散熱)、尺寸以及重量上的缺陷。

聯(lián)盟促進設計成功

嵌入視覺技術能夠讓電子產品更加智能且有響應能力,因此對用戶比以往更有價值。該技術能為現(xiàn)有產品增加有助益的特性,為硬件、軟件、半導體和系統(tǒng)制造商提供了嶄新的市場。

嵌入視覺聯(lián)盟(The EmbeddedVision Alliance)是去年夏天組成的一個全球技術開發(fā)人員與供應商的組織,它為工程師提供各種必要的工具,以加快這種潛能向實際的轉化。該聯(lián)盟的使命是提供實用教育、信息及洞見,幫助工程師們將嵌入視覺功能加到產品中。

風速傳感器相關文章:風速傳感器原理
電流變送器相關文章:電流變送器原理


評論


相關推薦

技術專區(qū)

關閉