影像感測無所不在全局快門賦能計算機(jī)視覺應(yīng)用

—— 成像效果更準(zhǔn)確

作者：時間：2022-09-25 來源：CTIMES

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

大多數(shù)人每天都正在使用計算機(jī)視覺。舉個例子來說，一個是智能型手機(jī)上的臉部辨識。如果消費(fèi)者手機(jī)上有這一項功能，平時也可以用于解鎖屏幕或是電子支付，這表示你正在使用計算機(jī)視覺。另一例子，是當(dāng)平時去超市或者超商付款時，收銀員會掃描所購買的產(chǎn)品條形碼，這類日常生活情境都會用到計算機(jī)視覺。

計算機(jī)視覺與光學(xué)感測
全局快門一次可以拍攝整幅影像，而且拍攝時間非常短，成像效果非常準(zhǔn)確，因此完全可以用于計算機(jī)視覺領(lǐng)域。
意法半導(dǎo)體亞太區(qū)影像事業(yè)部技術(shù)營銷經(jīng)理林國志指出，計算機(jī)視覺是人工智能的一個分支，能夠讓計算機(jī)和系統(tǒng)從數(shù)字影像、視訊和其它的視覺所輸入的數(shù)據(jù)中，提取出有意義的信息，并根據(jù)這些信息采取行動或提出分析建議。

在臉部辨識應(yīng)用中，具有意義的信息就是臉，系統(tǒng)會對臉進(jìn)行影像采集，然后進(jìn)行信息處理，得出的結(jié)果就是驗證使用者身份，接著解鎖手機(jī)。在一般的情況下，計算機(jī)視覺都會產(chǎn)生信息輸入和輸出，就以條形碼掃描機(jī)來說，掃描條形碼即是信息輸入，透過鏡頭采集條形碼的影像，并由系統(tǒng)讀取，最后加以辨識產(chǎn)品和價格。

一般來說，光學(xué)影像傳感器分為兩種主要的架構(gòu)。除了全局式快門之外，還有卷簾式快門，總共分為這兩種鏡頭架構(gòu)。卷簾快門的設(shè)計目的，是為了捕捉靜態(tài)影像和視訊拍攝，因此需要非常高的分辨率和色彩處理能力。目前大多數(shù)鏡頭都屬于卷簾快門，例如智能型手機(jī)的主鏡頭、自拍鏡頭、建筑中的監(jiān)控鏡頭，甚至數(shù)字相機(jī)等，都是采用卷簾快門技術(shù)。因為這些應(yīng)用情境都需要捕捉彩色影像，因此需要相當(dāng)高的分辨率。

唯一的問題在于，采用卷簾快門的計算機(jī)視覺技術(shù)，都是逐行拍攝影像。照片采用卷簾快門逐行拍攝的話，整個影像只有一幀。如果拍攝對象是車輛這樣的快速移動物體，影像可能會扭曲，無法顯示拍攝對象原本的樣子。如果影像扭曲就無法顯示物體的真實狀態(tài)，也就不能用于計算機(jī)視覺，無法判斷影像中的是不是另一輛車。因此，卷簾快門沒有被應(yīng)用于計算機(jī)視覺技術(shù)中。然而，全局快門的原理完全不同，一次可以拍攝整幅影像，而且拍攝時間非常短。只要被拍攝的對象不是快速移動的物體，成像效果就會非常準(zhǔn)確，因此完全可以用于計算機(jī)視覺。

計算機(jī)視覺應(yīng)用情境

圖片.png

圖一 : 全局快門傳感器的適用情境（source：st.com）

計算機(jī)視覺的應(yīng)用都會使用到全局快門感測技術(shù)。實際上，計算機(jī)視覺的應(yīng)用情境無處不在，可以將其歸為四大類。第一類叫做深度感測，這項應(yīng)用時間比較久。透過使用兩個全局快門傳感器搭建一組立體視覺系統(tǒng)，或者是使用一個全局快門傳感器搭建結(jié)構(gòu)光鏡頭系統(tǒng)。通常深度感測可以用于臉部辨識和3D掃描這類的應(yīng)用情境。

第二類叫做生物辨識，這項應(yīng)用可以采集人體各個部位的信息，并將其用于身份辨識。人臉信息可以用于臉部辨識或者2D智慧解鎖，體形信息可以用于人的存在偵測，除此之外還有手勢偵測、掌紋辨識、虹膜辨識等。這些人體信息都是獨(dú)一無二的，包括人臉、掌紋和虹膜等，皆可用于身份辨識。另外還有駕駛與車室內(nèi)監(jiān)視，采集司機(jī)與乘客的行為信息進(jìn)行分析，產(chǎn)生的結(jié)果就是系統(tǒng)發(fā)出的各類警示。

第三類就是擴(kuò)增實境（VR）、虛擬現(xiàn)實（AR）和混合現(xiàn)實（MR），這類應(yīng)用涉及了元宇宙的概念。當(dāng)戴上VR頭部顯示設(shè)備之后，使用者看不見周圍環(huán)境，只能依靠光學(xué)傳感器才能知道環(huán)境的變化。通常VR頭戴式顯示設(shè)備在內(nèi)部和外部分別有一個鏡頭，內(nèi)建鏡頭用于眼球追蹤，并透過兩個全局快門傳感器進(jìn)行眼球觀測，因為在實際應(yīng)用情境中需要感知你的眼睛看哪個方向，透過眼球追蹤得到的信息將提供不同的反饋。外置鏡頭則用于外部環(huán)境的追蹤，主要感知外部環(huán)境而非使用者眼球的變化。

這里有兩類重要的應(yīng)用情境。一類叫做6DoF，針對的是頭部行為。當(dāng)使用者戴上VR頭戴式顯示設(shè)備后，就會獲得6D感知能力。頭部可以做出左右、上下、前后六個角度的動作，因此被稱為「6DoF」（六個自由度追蹤）。另一類稱為「SLAM」（同步定位與地圖構(gòu)建），例如使用者需要掌握所處房間的狀況，墻壁在哪里、沙發(fā)在哪里、自己所處在哪個位置，戴上VR頭戴式顯示設(shè)備走動的時候，如何避免撞墻等。因此在使用AR／VR裝置的過程中，手勢偵測、掌紋辨識、臉部與情緒追蹤等功能是非常重要的。

除此之外，使用VR/AR裝置還可以進(jìn)行生物辨識，例如手勢偵測或者手勢追蹤。通常在這種情境下，裝置可以透過用戶一個手勢來辨識這是哪種行為目的。例如使用者進(jìn)行一場演講，透過一個手勢就可以自動翻到下一頁簡報或者翻回到首頁，又或是透過手勢告知助理單擊或雙擊鼠標(biāo)。這些應(yīng)用都是透過手勢偵測來加以實現(xiàn)，裝置無需揣測用戶想表達(dá)的信息，只需追蹤手勢即可。

最后一類應(yīng)用是機(jī)器人與工業(yè)控制。例如無人機(jī)和掃地機(jī)器人在使用過程中需要避免相撞，所以要有物體偵測和情境分析能力，而這些都需要使用全局快門傳感器。此外，前文所提到的條形碼辨識，也屬于工業(yè)控制中的計算機(jī)視覺應(yīng)用一環(huán)。

圖片.png

圖二 : 全局快門與卷簾快門的技術(shù)差異（source：st.com）

車內(nèi)傳感器
至于汽車領(lǐng)域的應(yīng)用，車內(nèi)傳感器主要包括四大類：包括車內(nèi)鏡頭，ADAS鏡頭、觀測鏡頭和售后鏡頭等，主要用于行車記錄器。意法半導(dǎo)體亞太區(qū)影像事業(yè)部資深技術(shù)營銷經(jīng)理張程怡表示，2021年底車內(nèi)鏡頭的市場滲透率約為10％，而到2024年就會達(dá)到50％。因此這一新興市場發(fā)展是十分迅速的，產(chǎn)業(yè)生態(tài)中的相關(guān)廠商正紛紛涌入。

車內(nèi)鏡頭并不只一種，Euro NCAP為車輛評估標(biāo)準(zhǔn)體系，曾經(jīng)對車內(nèi)監(jiān)控系統(tǒng)分為兩類：一類叫做駕駛監(jiān)控系統(tǒng)DMS，另一類叫做車內(nèi)乘客監(jiān)控系統(tǒng)CMS或者OMS。駕駛監(jiān)控系統(tǒng)的觀測對象就是司機(jī)，主要監(jiān)控司機(jī)是否注意力集中，是否有分神或是打瞌睡，因為這些現(xiàn)象會嚴(yán)重危及行車安全。而車內(nèi)乘客監(jiān)控系統(tǒng)則主要觀測乘客狀況，特別是兒童，因為有些粗心的使用者下車后會將孩子遺留在車內(nèi)。

駕駛監(jiān)控系統(tǒng)DMS鏡頭安裝在駕駛員面前，觀測對象主要是臉，鏡頭必須做得很大，大概50～60度，分辨率約100～230萬畫素。重點(diǎn)之一在于這里必須采用NIR鏡頭，因為不僅需要白天對駕駛員進(jìn)行監(jiān)控，晚上也是需要，因為很多人會在夜里開車。在這種漆黑的環(huán)境下，必須要有光源投射在駕駛員臉上，但肯定不能使用可見光，所以需要NIR技術(shù)。

車內(nèi)乘客監(jiān)控系統(tǒng)觀測的是車內(nèi)所有乘員，但不同之處在于，因為這里需要物體探測和辨識，所以需要彩色影像，而且觀測范圍比較寬廣，因此鏡頭視角需要更大，分辨率需要更高，才能獲取觀測領(lǐng)域內(nèi)所有細(xì)部信息。

車內(nèi)乘客監(jiān)控與駕駛監(jiān)控二合一系統(tǒng)，是將CMS、OMS和DMS結(jié)合。而車內(nèi)乘客監(jiān)控需要RGB彩色影像，駕駛監(jiān)控則需要NIR影像，因此僅需單一鏡頭就可以同時支持RGB和NIR，這些都是車內(nèi)鏡頭的設(shè)計要點(diǎn)。

結(jié)語
全局快門傳感器的應(yīng)用范疇十分廣泛，除了前文所提及的工業(yè)與車用之外，對于智慧家庭和智慧大樓也是非常適合的應(yīng)用范疇。智慧家庭的應(yīng)用需要考慮周全，使用者不希望家里有個鏡頭全天候監(jiān)視自己，與此同時又想要鏡頭和傳感器帶來的益處，因為很多輔助功能可以讓用戶的生活變得更加舒適，全局快門傳感器的優(yōu)勢就是能夠?qū)崿F(xiàn)這一點(diǎn)，而透過計算機(jī)視覺開發(fā)的功能，還能透過追蹤技術(shù)來達(dá)到人機(jī)互動的目的。

至于筆電和個人計算機(jī)鏡頭，也是全局快門傳感器的應(yīng)用范疇。筆電和PC應(yīng)用全局快門技術(shù)的意義，可以進(jìn)行臉部辨識、手勢控制、眼動追蹤、舒適度監(jiān)測和隱私保護(hù)。ToF和ALS（環(huán)境光傳感器）則可進(jìn)行存在偵測、電池續(xù)航、屏幕亮度自動調(diào)整和隱私保護(hù)。以目前各廠商像是意法半導(dǎo)體所提供的影像產(chǎn)品，都可涵蓋上述的所有應(yīng)用，包括全局快門產(chǎn)品、ToF、ALS等等，以及各種參考設(shè)計。