基于MPEG-2算法的列車語音記錄設備

——

作者：劉建偉1,王蕾2,牛濤1,申建德1,趙江海1 時間：2007-01-26 來源：《電子設計應用》

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

本文引用地址：http://butianyuan.cn/article/21511.htm

前言

列車運行監(jiān)控記錄裝置在鐵路的安全運輸過程中發(fā)揮了巨大的作用，但不足的是沒有語音記錄功能。為了解決這個問題，按照鐵道部的技術要求，本文研究開發(fā)了一種新型列車語音記錄設備。該設備主要用于對乘務員機車聯(lián)控進行錄音，并可協(xié)同監(jiān)控裝置分析行車事故，為機務部門和運輸部門的科學管理提供新的技術手段。鑒于常見設備的技術指標及標準，對于語音的數(shù)字化，以16khz的采樣頻率、16位量化精度進行采樣，在編碼方面，采用mpeg-2壓縮編碼方式。

硬件系統(tǒng)組成

該語音記錄設備如圖1所示，整個系統(tǒng)由adc、dsp、cpld控制器，flash大容量存儲器及l(fā)cd顯示屏等組成。

在本系統(tǒng)中，adc用來完成信號的轉換，數(shù)據(jù)格式在16、18、20位之間可選，dsp為系統(tǒng)的核心數(shù)字處理器，功能強大，完成數(shù)字信號的壓縮編碼，cpld用于數(shù)據(jù)傳送的控制以及對adc、flash和lcd顯示屏等器件的初始化檢測設置，flash用來存儲數(shù)據(jù)，lcd顯示屏用來顯示當前系統(tǒng)的狀態(tài)，如運行等待和數(shù)據(jù)處理等。系統(tǒng)上電后，若有語音信號，則輸入adc，得到一串數(shù)字信號送入dsp進行數(shù)據(jù)壓縮編碼，經(jīng)過壓縮編碼的數(shù)據(jù)由cpld存儲到flash中，整個系統(tǒng)以流水線的方式工作，數(shù)據(jù)的采集、壓縮編碼和存儲同時進行。

a/d轉換器uda1341ts

uda1341ts是由philips公司生產(chǎn)的一款單片立體聲a/d、d/a轉換器，工作電壓為3.0v，信噪比為97db，具有雙通道輸入功能，采樣頻率在16，32和44.1khz之間可選。

uda1341ts與dsp構成語音信號采集系統(tǒng)，主要涉及到位采樣時鐘（bck）、字同步時鐘（ws）、采樣數(shù)據(jù)輸出（datao），系統(tǒng)時鐘輸入（sysclk）這幾個對時序有要求的引腳。系統(tǒng)中，datao作為輸出引腳，與dsp的bdr0引腳相連；bck、ws、sysclk作為輸入引腳，其時序由dsp供給。uda1341ts的系統(tǒng)時鐘只能是256fs、384fs、512fs，通過對狀態(tài)寄存器的sc0位和sc1位編程可實現(xiàn)系統(tǒng)時鐘的選擇設置。這里fs是語音信號的采樣頻率。在采樣數(shù)據(jù)時，ws用來指明uda1341ts的datao輸出的有效數(shù)據(jù)。當系統(tǒng)對vinl（左聲道）端口進行采樣時，ws的上升沿表明一幀數(shù)據(jù)的起始，下降沿表明一幀數(shù)據(jù)的結束；當系統(tǒng)對vinr（右聲道）端口進行采樣時，ws的下降沿表明一幀數(shù)據(jù)的起始，上升沿表明一幀數(shù)據(jù)的結束。

uda1341ts提供了一個l3端口，利用cpld控制器對l3的l3data、l3mode和l3clock三個引腳進行編程，可以設置其內部的寄存器。當l3mode引腳為低電平時，通過l3data引腳輸入寄存器地址信息；當l3data引腳為高電平時，通過l3data引腳輸入有關寄存器設置的數(shù)據(jù)信息（如設置芯片系統(tǒng)時鐘頻率、數(shù)據(jù)輸入格式、芯片工作模式等）。uda1341ts與dsp的mcbsp（多通道緩沖同步串口）相連，各種同步信號由dsp產(chǎn)生，這樣就保證了新數(shù)據(jù)的正常接收以及已接收數(shù)據(jù)的正常處理。uda1341ts與dsp的硬件連接如圖2所示。

語音編碼器tms320vc5402

數(shù)字語音信號的壓縮需要大量的數(shù)字信號處理，一般單片機是無法完成的，所以本系統(tǒng)選用ti公司的dsp芯片tms320vc5402（以下簡稱c5402）對語音信號進行壓縮處理。

c5402通過它的msbsp與語音采樣轉換器uda1341ts通信。mcbsp提供了全雙工的通信機制，以及雙緩存的發(fā)送寄存器和三緩存的接收寄存器，允許連續(xù)的數(shù)據(jù)流傳輸，數(shù)據(jù)寬度的8、12、16、20、24、32位之間可選；mcbsp與adc的通信通過bdr0引腳實現(xiàn)，通信過程的控制則由bclkr0、bclkr1、bfsr0等三條引腳實現(xiàn)。

cpld低速控制

dsp作為高速的運算處理器不合適低速的控制應用。對uda1341ts檢測、初始化，對lcd的控制以及對flash的存儲控制都是低速的控制。本系統(tǒng)選用cpld來完成這些工作。cpld為altera公司的epm7128s，開發(fā)仿真環(huán)境為altera公司的max-plusii。因為dsp的地址線a0、a1、a2要被某些芯片使用，所以選取a3-a7、a15共6根地址線和i/o空間選擇信號is的反共同產(chǎn)生系統(tǒng)中各芯片的選通信號。cpld中的控制電路負責產(chǎn)生各種讀寫信號，如flash的讀信號mem_rd和寫信號mem_wr等。

在該系統(tǒng)中，c5402要產(chǎn)生許多控制信號（如flash程序頁的選擇信號ppg2-ppgo等），同時也要監(jiān)視和讀取外部的狀態(tài)。因為c5402只有兩個通用i/o引腳，所以用cpld來對其進行i/o端口擴展。cpld內部通過一個8位dff觸發(fā)器實現(xiàn)對數(shù)據(jù)的輸出。另外，通過8個三態(tài)門，將8位輸入狀態(tài)放到c5402數(shù)據(jù)總線的低8位上。c5402有4個中斷輸入intr3反—intr0的反。cpld的中斷選擇模塊可以從最多8個外部中斷信號中選擇4個作為c5402的中斷輸入，提高了系統(tǒng)的靈活性。

軟件設計

軟件設計主要包括adc的程序設計，語音數(shù)據(jù)的壓縮編碼等。

adc的程序設計

adc以16khz的采樣頻率、16位量化精度進行采樣，采樣的位同步信號，幀同步信號、數(shù)據(jù)位時鐘信號均由dsp提供，所以對mcbsp相關寄存器的編程，如引腳控制寄存器（pcr）的編程，串口控制器（spcr1，spcr2）的編程，接收控制寄存器（rcr1x，rcr2x）以及發(fā)送控制寄存器（xcr1，xcr2）的編程會影響語音信號的最終效果，所以用戶在開發(fā)之前必須詳細參閱相關資料。

語音數(shù)據(jù)編碼

本文采用通用的mpeg-2語音壓縮編碼算法，該算法是幀數(shù)據(jù)結構編碼，一幀的樣點值是576，以uda1341ts的16khz采樣頻率計算，一幀數(shù)據(jù)的編碼要求在72ms內完成。c5402的指令周期是10ns，在滿足算法要求的情況下，進行雙通道實時編碼約需要10ms，所以c5402可以完成該算法的實時編碼。主要包括以下幾方面：濾波器組的運算；心理聲學模型的運算；量化編碼；幀數(shù)據(jù)格式化。

濾波器組的作用是完成信號從時域到頻域的映射。心理聲學模型的計算是利用1024點的fft，對輸入的語音信號進行頻譜分析，再結合時頻映射的結果，計算出各子帶人耳的掩蔽特性。量化編碼是通過各子帶人耳的掩蔽特性和輸出比特率的要求，計算出各子帶編碼所需的比特分配信息，并且對各子帶數(shù)據(jù)進行線性量化編碼的過程。程序的后續(xù)工作是按照mpeg-2標準對數(shù)據(jù)進行格式化，其目的是使數(shù)據(jù)編碼后能被正確地解碼、系統(tǒng)主程序如圖3所示。

幀內編碼是dsp按照mpeg-2標準對adc傳來的數(shù)字語音信號進行壓縮編碼，其流程如圖4所示。

結語

系統(tǒng)上電運行后，經(jīng)多次實驗測試，運行情況穩(wěn)定。目前該設備已經(jīng)進行現(xiàn)場調試運用，開始部分裝車運行，滿足了列車語音記錄的實際要求。

新聞中心

基于MPEG-2算法的列車語音記錄設備

評論

相關推薦

技術專區(qū)