新聞中心

EEPW首頁 > 設(shè)計(jì)應(yīng)用 > 基于SPCA563B芯片的圖象識別系統(tǒng)設(shè)計(jì)

基于SPCA563B芯片的圖象識別系統(tǒng)設(shè)計(jì)

——
作者:上海交通大學(xué) 李文昊 時(shí)間:2007-01-26 來源:《單片機(jī)與嵌入式系統(tǒng)應(yīng)用》 收藏

單片機(jī)spca563b是凌陽科技公司推出的一顆用于圖象識別領(lǐng)域的ic,不僅具有一般單片機(jī)的控制功能,而且具有圖象識別與處理能力,本圖象識別系統(tǒng)就是以它為核心進(jìn)行數(shù)據(jù)處理與控制,該系統(tǒng)已實(shí)現(xiàn)的功能有:物體顏色和形狀識別,字符識別以及手勢識別等,利用這些識別的結(jié)果,可以開發(fā)游戲、趣味教學(xué)、智能玩具、文字輸入以及智能識別等應(yīng)用系統(tǒng)。

本文通過介紹整個(gè)系統(tǒng)以及在整個(gè)系統(tǒng)上實(shí)現(xiàn)的簡單的手勢識別,使大家更好地了解此系統(tǒng)在圖象識別和文字識別方面的強(qiáng)大功能和易用性。

1 系統(tǒng)硬件架構(gòu)

如圖1所示,圖象識別硬件系統(tǒng)主要由spca563b單片機(jī)、usb控制器、圖像傳感器、存儲器控制器和語音輸出控制器等組成。

本文引用地址:http://butianyuan.cn/article/21559.htm

1.1 spca563b單片機(jī)

spca563b單片機(jī)的硬件特征如下:提供320×320的8位cmos圖像傳感器接口,具有自動白平衡和獲得參數(shù)控制功能,具有圖像顏色校正和圖像gamma校正功能,具有7種顏色過濾功能,具有良好的減小噪聲和濾波器,能夠在一張圖片中檢測到21個(gè)目標(biāo)物體的大小和位置,并將其結(jié)果存放于嵌入在cpu內(nèi)部的ram中;16位μnsp cpu內(nèi)核,內(nèi)嵌1k×16位的ram和32k×16位的rom;具有可選擇的外部ram和rom接口,具有usb1.1的接口;3.3v電壓供電,128/64腳lqfp封裝(其中128腳有可選擇的并行接口,48腳則沒有)。此系統(tǒng)采用48腳的lqfp封裝,其硬件電路如圖2所示。

1.2 usb控制器

spca563b內(nèi)嵌usb1.1的控制器,利用usb接口可以與pc進(jìn)行通信,結(jié)合pc端軟件來實(shí)現(xiàn)isp及在線調(diào)試程序,此外可以利用usb來為系統(tǒng)供電,其電路如圖3所示。

1.3 圖像傳感器

本系統(tǒng)采用spca3010a cmos圖像傳感器,圖像輸出為qvga(320×240)大小的rgb格式,spca563b通過i2s接口來控制spca3010a cmos圖像傳感器,此cmos圖像傳感器支持stand by省電模式,其電路如圖4所示。

1.4 存儲器控制器

外擴(kuò)spr4096a flash存儲器,主要用來存儲系統(tǒng)需要的語音數(shù)據(jù),spr4096a flash具有如下特征:512k×8位的存儲空間;內(nèi)嵌4k×8位的sram;外部cpu可以通過串行接口或8位并行接口來訪問flash/sram;i/o接口的電壓范圍為2.25-3.6v,并支持stand by的省電模式,在數(shù)據(jù)存儲量比較小的情況下,用spr4096a可以大大降低系統(tǒng)的成本,電路如圖5所示。

2 系統(tǒng)軟件設(shè)計(jì)

本圖象識別系統(tǒng)的識別功能主要通過軟件系統(tǒng)來實(shí)現(xiàn),為了提高程序的可移植性。為將來該系統(tǒng)功能擴(kuò)展預(yù)留空間,整個(gè)軟件系統(tǒng)采用分模塊、分層次的方法編寫程序,采用匯編語言實(shí)現(xiàn)對寄存器的讀/寫以及對中斷的控制,并為上層的開發(fā)提供靈活的接口,上層采用c語言編寫,通過調(diào)用底層函數(shù)來間接對硬件資源進(jìn)行操作,這樣編寫程序使整個(gè)系統(tǒng)結(jié)構(gòu)清晰,程序可移植性和可擴(kuò)展性增強(qiáng),而且占用硬件資源少,為系統(tǒng)功能的擴(kuò)展和進(jìn)一步開發(fā)預(yù)留充分的空間。

整個(gè)軟件系統(tǒng)由主程序,圖象識別功能模塊子程序、中斷服務(wù)子程序和語音輸出子程序等組成,主程序負(fù)責(zé)整個(gè)系統(tǒng)的協(xié)調(diào)和控制工作,通過調(diào)用不同的子程序來實(shí)現(xiàn)不同的功能,主程序流程如圖7所示。


為突出系統(tǒng)的特點(diǎn),下面通過手勢識別的實(shí)例來重點(diǎn)描述圖象識別原理,手勢識別包含兩個(gè)步驟:手形的輪廓跟蹤,提取其輪廓的相關(guān)數(shù)據(jù),手勢的識別,在上一步得到的數(shù)據(jù)的基礎(chǔ)上進(jìn)行分析判斷而得到結(jié)果。

2.1 輪廓跟蹤算法實(shí)現(xiàn)

輪廓跟蹤的目的是獲得圖像的外部輪廓特征(包括目標(biāo)物體邊緣點(diǎn)的坐標(biāo)和方向),為圖像的形狀分析做準(zhǔn)備,spca563b的dsp針對膚色有一系列的顏色處理,這樣系統(tǒng)就可以方便圖像轉(zhuǎn)化為膚色與非膚色的二值圖像,通過對暫存在sram中的二值圖像進(jìn)行數(shù)據(jù)分析,來提取手形的邊緣輪廓。

輪廓跟蹤算法步驟如下:

1)按從上到下,從左到右的順序掃描圖像,尋找第一個(gè)非白象素作為邊界起始點(diǎn)a[0],記錄a[0]點(diǎn)的坐標(biāo)(a[0],x,a[0],y)。a[0]是具有最小行和列值的邊界點(diǎn),再定義一個(gè)掃描方向變量dir。該變量用于記錄上一步中沿著前一個(gè)邊界點(diǎn)到當(dāng)前邊界點(diǎn)的移動方向,其初始化取值為a[0],dir=7;掃描方向定義如圖8所示。

假設(shè)當(dāng)前的坐標(biāo)為(x,y,則其8個(gè)鄰域坐標(biāo)如下:

方向0:(x+1,y);方向1:(x+1,y-1);
方向2:(x,y-1);方向3:(x-1,y-1);
方向4:(x-1,y);方向5:(x-1,y+1);
方向6:(x,y+1);方向7:(x+1,y+1)。

2)按逆時(shí)針方向搜索當(dāng)前象素的3×3的鄰域,其起始搜索方向設(shè)定如下:

若a[n-1],dir為奇數(shù),則?。╝[n-1],dir+7)mod 8;

若a[n-1],dir為偶數(shù),則?。╝[n-1],dir+6)mod 8。

在3×3鄰域中搜索到的第一個(gè)與當(dāng)前象素相同的象素便為新的邊界點(diǎn)a[n],同時(shí)更新記錄從上一點(diǎn)搜索到邊界點(diǎn)a[n]的方向變量a[n].dir,記錄新的邊界點(diǎn)的坐標(biāo)(a[n],x,a[n],y)。

3)如果邊界點(diǎn)a[n]等于第一個(gè)邊界點(diǎn)a[0],即(a[n],x==a[0],x&&a[n],y==a[0],y)。停止搜索,結(jié)果跟蹤,否則重復(fù)步驟2。

由邊界點(diǎn)a[0]、a[1]、a[2]、…、a[n]構(gòu)成的邊界便為要跟蹤的邊界。算法中步驟1的作用是找出第一個(gè)邊界點(diǎn),步驟3的作用是找出所有的邊界點(diǎn),如圖9所示,左邊為原始圖像,右邊是用該算法仿真的結(jié)果。

2.2 手勢識別算法實(shí)現(xiàn)

我們的主要目的是找出伸出手指的個(gè)數(shù),開使用行掃描的方法通過行內(nèi)從0→1或1→0黑白象素變化的次數(shù)來確定伸出手指的個(gè)數(shù),但這種算法對于傾斜一定角度的手指數(shù)目判斷存在一定問題,因此轉(zhuǎn)而采用"提取指尖點(diǎn)算法"。

提取指尖點(diǎn)的方法著眼于從手勢輪廓中搜索出指尖點(diǎn),一個(gè)指尖點(diǎn)對應(yīng)于一根手指,最后根據(jù)得到指尖點(diǎn)的個(gè)數(shù)來判定手指數(shù)目,判斷是不是指尖;

分析手的形狀,手指的兩邊基本上是平行的,一直按逆時(shí)針方向前進(jìn),每經(jīng)過一次指尖,手形輪廓的走向發(fā)生反向的變化,由于手形輪廓的邊緣存在一定的毛刺,因此可以用多點(diǎn)方向的平均來減小毛刺的影響,這里取36點(diǎn)方向的平均,表示為average_dir[i]。是否經(jīng)過指尖的判斷條件1:126<=|average_dir[i-1]-average_dir[i+1]|<=162,(說明:兩點(diǎn)方向相反,其方向值差4,3.5×36=126,4.5×36=162。)

再分析手的形狀,兩手指之間邊緣輪廓的走向也滿足判斷條件1,故必須添加判斷條件,如圖10所示,當(dāng)沿著一個(gè)方向搜索手的邊緣輪廓時(shí),經(jīng)過指尖走向一定與手指間缺口走向相反,因此,必須假設(shè)判定條件2:

is_fingervertex(dir0,dir1,dir2);

這個(gè)函數(shù)是用來通過連續(xù)3點(diǎn)的方向來判斷這3點(diǎn)是否為逆時(shí)針走向,由于是沿著逆時(shí)針方向搜索邊緣輪廓的,故在判定條件1成立的前提下加上

is_fingervertex(average_dir[i-1],average_dir[i],average_dir[i+1]就可以判斷是否為指尖,從而判定手指的數(shù)目,順序3點(diǎn)是否為逆時(shí)針走向,具體在程序中可以構(gòu)造一個(gè)循環(huán)隊(duì)列來實(shí)現(xiàn),測試結(jié)果表明這種算法非常穩(wěn)定。

結(jié)語

spca563b內(nèi)部嵌入功能強(qiáng)大的圖像顏色處理的dsp,用它來做圖象識別系統(tǒng)的主控芯片十分方便、快捷。同時(shí)該系統(tǒng)具有語音輸出提示功能,操作更加人性化,并且可以通過usb1.1接口與pc進(jìn)行通信,配合pc端的調(diào)試工具,還可以大大縮短圖象識別功能開發(fā)的周期。



關(guān)鍵詞:

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉