數(shù)字可視對講技術(shù)探討
引言
20世紀60年代,電視改變了人們的生活,出現(xiàn)了“電視一代”;80年代,電腦改變了人們的工作方式,促成了“電腦一代”;90年代,互聯(lián)網(wǎng)改變了人們獲取信息的方式,誕生了“網(wǎng)絡一代”。
進入21世紀,數(shù)字化的生活方式將無處不再,最終會全面進入每個人的家庭,數(shù)字家庭的浪潮已經(jīng)洶涌澎湃。
傳統(tǒng)的數(shù)字家庭中心之爭:PC中心論、TV中心論及SetBox中心論,其優(yōu)勢和劣勢都很明顯,就單一產(chǎn)品而言都難以獨自承擔數(shù)字家庭的重任。近年來市場上出現(xiàn)了另一產(chǎn)品逐漸承擔了數(shù)字家庭越來越多的功能和責任,這就是數(shù)字可視對講。傳統(tǒng)的樓宇可視對講產(chǎn)品逐漸往數(shù)字化,網(wǎng)絡化、智能化的方向發(fā)展,可視對講產(chǎn)品除了擔當可視對講、遙控開鎖、報警等功能外,還實現(xiàn)了遠程視頻監(jiān)控、異動報警、門禁、三表抄送、信息發(fā)布、智能家居控制、上網(wǎng)及視頻點播甚至手機聯(lián)動等增值服務。這類產(chǎn)品大多內(nèi)置了性能強大的Soc處理器和觸摸TFT顯示屏,尤其標配的網(wǎng)絡功能,給產(chǎn)品帶來了更多的想象空間,將越來越多的融合PVR、DPF數(shù)碼相框、可視電話、媒體播放器等數(shù)字媒體功能。數(shù)字可視對講悄悄地充當了數(shù)字家庭另一中心的角色。
可視對講發(fā)展趨勢
可視對講經(jīng)歷了從模擬黑白、彩色到數(shù)字化的歷程,向著網(wǎng)絡化和智能化的方向發(fā)展,并逐漸融合多種媒體功能。模擬可視對講(黑白、彩色),音視頻通過同軸電纜傳輸,控制信號通過單片機總線傳輸,其技術(shù)特點決定著產(chǎn)品有著先天的缺點,而數(shù)字化網(wǎng)絡傳輸帶來的不僅僅是通過將音視頻及所有控制信息均通過一根網(wǎng)絡線傳輸克服了模擬傳輸帶來的弊端,更為重要的是為用戶增添了更為實用的增值業(yè)務。下表所示為模擬對講與數(shù)字對講的對比。
今后數(shù)字可視對講的發(fā)展更多的是融合了智能家居控制,逐漸成為智能家居的控制中心,同時也會將越來越多的附加功能加入其中。
圖2 數(shù)字可視對講Roadmap plan
數(shù)字可視對講技術(shù)原理及框圖
數(shù)字可視對講系統(tǒng)的構(gòu)成,一般包含這么幾個模塊:室內(nèi)機,梯口機、交換機、管理機等。如圖3所示。
圖3 數(shù)字可視對講系統(tǒng)框圖
訪客來訪,通過梯口機撥號呼叫指定的室內(nèi)機,梯口機通過將訪客的影音信息數(shù)字化后編碼壓縮傳送給指定的室內(nèi)機,室內(nèi)機接收到網(wǎng)絡傳輸過來的影音信號進行解壓縮顯示,確定訪客身份后,按動開鎖鍵開啟梯口的門鎖。同時,梯口機和室內(nèi)機之間還實現(xiàn)了VoIP,兩個終端可實現(xiàn)雙向語音對講,為業(yè)主辨別來客身份提供進一步溝通、確認之需要。
在兩個室內(nèi)機或室內(nèi)機與管理機之間,系統(tǒng)則提供了雙向的視頻及語音傳輸功能。在功能實現(xiàn)上,梯口機、管理機都可以歸結(jié)為室內(nèi)機。室內(nèi)機的功能最為全面,實現(xiàn)音視頻的壓縮傳輸、接收解壓縮顯示和回聲抵消功能,同時可作為各項網(wǎng)絡增值業(yè)務的實現(xiàn)終端。本文以海思半導體的多用途媒體網(wǎng)絡處理芯片Hi3510為例介紹室內(nèi)機的構(gòu)成。Hi3510是海思半導體針對媒體壓縮/解壓縮處理、網(wǎng)絡傳輸、VoIP多功能混合應用市場開發(fā)的處理芯片,已廣泛應用于可視電話、網(wǎng)絡攝像機、網(wǎng)絡視頻服務器及數(shù)字可視對講等產(chǎn)品上。從Hi3510應用于數(shù)字可視對講的系統(tǒng)框圖中,我們可以看出完整的信號處理元素和流程。
圖4 Hi3510數(shù)字可視對講最小系統(tǒng)框圖
以Hi3510為核心,配備圖像傳感器作為影像輸入源,視頻信號通過ITU656接口輸送給Hi3510,Hi3510對數(shù)字視頻進行壓縮處理,經(jīng)過PHY將數(shù)據(jù)以TCP/IP包傳輸?shù)侥康牡?同時,Hi3510對通過PHY傳送的TCP/IP包進行解碼、縮放,通過RGB888接口送至TFT Module顯示;為方便用戶進行選擇操作,可通過SPI接口及GPIO實現(xiàn)觸摸屏和按鍵功能;語音數(shù)據(jù)則通過一顆音頻Codec進行AD編碼后通過I2S總線送往Hi3510處理,Hi3510不僅僅需要對語音作壓縮處理以備傳輸,而且還需要實現(xiàn)雙向語音傳輸所需的回聲抵消功能、唇音同步以及按鍵的雙音多頻DTMF等。多達兩個的USB1.1接口提供了豐富的個人存貯界面,各種影音即可通過網(wǎng)絡傳輸也可通過USB及USB轉(zhuǎn)SD存貯至本地,以便需要時播放。若需擴展WIFI無線傳輸,另一個USB1.1接口可提供成本低且易實現(xiàn)的USB轉(zhuǎn)Wi-Fi方案。
技術(shù)核心:視頻壓縮、語音處理、網(wǎng)絡傳輸
未來多媒體產(chǎn)品的核心不外乎:音視頻壓縮,語音處理和網(wǎng)絡傳輸三大部分。無論是從PC娛樂、SetBox,還是Digital TV以及任何多媒體產(chǎn)品都可以看到這三大要素的蹤影。作為數(shù)字家庭中的新秀,這三要素也是構(gòu)成數(shù)字可視對講系統(tǒng)的基礎(chǔ)。
由于歷史原因,早期的數(shù)字可視對講的視頻編碼格式多為H.263,其目的是為了和可視電話兼容。H.264作為H.263的升級版本提供了更大的壓縮比和更好的網(wǎng)絡適應性?;诖耍絹碓蕉嗟臄?shù)字可視對講產(chǎn)品采用H.264標準作為視頻壓縮的格式。 H.264最大特點是對帶寬的要求很低,在同等的還原圖像質(zhì)量的情況下,H.264要比MPEG-4節(jié)省50%以上的碼率。同時,H.264在設計之初就考慮到了在不同網(wǎng)絡資源下的分級編碼傳輸。H.264具有較強的容錯能力,在質(zhì)量不穩(wěn)定的網(wǎng)絡環(huán)境中,可以得到比MPEG4編碼視頻更好的質(zhì)量。當然,H.264帶來的好處不是免費的、更高的壓縮比和良好的網(wǎng)絡適應性能,而是處理算法的復雜化,對處理器提出了更高的性能要求。
為了適應網(wǎng)絡傳輸?shù)奶攸c,語音也需要低帶寬、高音質(zhì)的音頻編碼標準。日常所常見的MP3、AAC等多媒體音頻格式不能很好的適應語音網(wǎng)絡通信的要求。語音網(wǎng)絡通信使用的更多的是G.7xx和AMR(Adaptive Multi-Rate)語音編碼,以便在有限帶寬下提供多路數(shù)的語音數(shù)據(jù)業(yè)務。例如,G.729是一種高效的壓縮編碼技術(shù),可將經(jīng)過采樣的64kb/s話音以幾乎不失真的質(zhì)量壓縮至8kb/s,非常適合在VoIP系統(tǒng)中使用;AMR主要用于移動設備的音頻,壓縮比比較大,但相對其他的壓縮格式質(zhì)量比較差,由于多用于人聲通話,效果還是很不錯的。同時為了支撐雙向語音對講業(yè)務,語音處理模塊仍要提供對回聲抵消、唇音同步、噪聲抑制、雙音多頻DTMF的支持。普通的多媒體處理器往往只能提供單一的語音處理功能,因此應用在數(shù)字可視對講上的處理器需提供更為靈活和強大的語音支持。
海思半導體Hi3510芯片靈活的多核架構(gòu),滿足了視頻H.264的復雜編碼和音頻多種壓縮格式的要求,同時內(nèi)置雙MAC,可方便配置帶路由功能的網(wǎng)絡,降低eBOM。圖5為Hi3510內(nèi)部邏輯圖。
圖5 Hi3510功能邏輯圖
內(nèi)置的H.264/263 硬件加速器完成視頻編解碼算法,保障了流暢的視頻畫面,對H.263的兼容使得采用Hi3510為主芯片的設備可兼容早期的可視電話系統(tǒng),實現(xiàn)多終端對接。32位的語音DSP,在提供從MP3、WMA到G.7xx,AMR多種語音編碼處理的同時,支持回聲抵消、噪聲抑制、唇音同步等處理需求。主頻220MHz的ARM處理器,可實現(xiàn)更多增值業(yè)務,IE瀏覽、數(shù)碼相框、信息發(fā)布均在ARM上完成。Hi3510以ARM+Audio DSP+H.264/263硬件加速的多核處理架構(gòu)并配備豐富的通信接口,如MAC、UART、USB等。
結(jié)語
數(shù)字可視對講無論在市場上還是技術(shù)上,目前正處于加速發(fā)展時期,并越來越成為數(shù)字家庭的一個重要角色。其自身具備的三大要素:視頻壓縮、語音處理、網(wǎng)絡傳輸,使得數(shù)字可視對講與其他家庭多媒體產(chǎn)品互相融合。由此,隨著技術(shù)的發(fā)展,對內(nèi)置的處理器也提出了更高的要求。
評論