基于 RTL8723DS +A113 開(kāi)發(fā)的智能音箱模塊設(shè)計(jì)方案
一、前言
本文引用地址:http://butianyuan.cn/article/202208/436895.htmAI智能音箱是人工智能與傳統(tǒng)音箱結(jié)合的產(chǎn)物。其基本原理是用戶(hù)使用自然語(yǔ)言與機(jī)器(即音箱)交流,音箱通過(guò)識(shí)別用戶(hù)的語(yǔ)音指令完成相應(yīng)任務(wù),如點(diǎn)播音樂(lè)、收聽(tīng)新聞、設(shè)置日程、查詢(xún)信息等。當(dāng)今AI智能音箱,已被認(rèn)為是物聯(lián)網(wǎng)時(shí)代的入口,在去年成為了各大廠商爭(zhēng)相投入的風(fēng)口。因它不僅僅是一臺(tái)單純的音樂(lè)播放器,在其背后支撐的 AI 技術(shù)才是整個(gè)產(chǎn)品的核心,也是各大公司覬覦物聯(lián)網(wǎng)入口的最根本原因。經(jīng)歷了2017年的爆發(fā)式增長(zhǎng),到現(xiàn)在AI智能音箱已經(jīng)成為最熱門(mén)的硬件產(chǎn)品之一,因此各種客制化的產(chǎn)品如雨后春筍般的噴涌而出。
二、基于“RTL8723DS +A113”開(kāi)發(fā)的智能音箱模塊設(shè)計(jì)
鑒于市場(chǎng)的蓬勃發(fā)展,我們審時(shí)度勢(shì),推出基于“RTL8723DS +A113”開(kāi)發(fā)的智能音箱模塊設(shè)計(jì),更加方便工程師的應(yīng)用需求,注意 Amlogic/A113 開(kāi)發(fā)手冊(cè)目前只面向 Rokid 開(kāi)發(fā)者提供。如未注冊(cè)成為Rokid 開(kāi)發(fā)者,請(qǐng)先至 Rokid 官網(wǎng)注冊(cè)成為開(kāi)發(fā)者,具體請(qǐng)?jiān)L問(wèn)https://developer.rokid.com/。
1)開(kāi)發(fā)板套件基本參數(shù)介紹
1.1. Rokid語(yǔ)音整體方案 通過(guò)接入Rokid智能語(yǔ)音服務(wù),您可以為配有麥克風(fēng)和揚(yáng)聲器的聯(lián)網(wǎng)硬件設(shè)備添加語(yǔ)音交互體驗(yàn),使得您的手機(jī)、電視、音箱等智能設(shè)備輕松擁有語(yǔ)音交互的能力。
· Rokid語(yǔ)音整體方案,融合了從前端硬件的遠(yuǎn)場(chǎng)拾音、降噪、回聲消除等技術(shù),到語(yǔ)音識(shí)別、語(yǔ)義理解、自然語(yǔ)言合成等AI技術(shù)和iot物聯(lián)網(wǎng)技術(shù),提供硬件到軟件全鏈路解決方案,助力開(kāi)發(fā)者快速實(shí)現(xiàn)產(chǎn)品的智能化。
· Rokid語(yǔ)音整體方案,還針對(duì)行業(yè)或者特定場(chǎng)景,提供行業(yè)和場(chǎng)景解決方案,包括傳統(tǒng)制造行業(yè),運(yùn)營(yíng)商以及互聯(lián)網(wǎng)行業(yè)和智能音箱解決方案、兒童故事機(jī)解決方案、智能電視解決方案
同時(shí),平臺(tái)還提供了包括內(nèi)容類(lèi)、工具類(lèi)和互動(dòng)類(lèi)等不同類(lèi)型的垂直語(yǔ)音技能。您的設(shè)備接入Rokid后,即可使用眾多豐富有趣的 Rokid 公有技能,您也可以為自己的設(shè)備創(chuàng)建個(gè)性化的私有技能。
1.2. 接入方案類(lèi)型
· 全鏈路通用方案:包括前端語(yǔ)音激活/降噪以及 Rokid 語(yǔ)音識(shí)別服務(wù)和語(yǔ)音合成服務(wù)的相關(guān)能力。
· 基礎(chǔ)語(yǔ)音模塊:基礎(chǔ)語(yǔ)語(yǔ)音服務(wù)的輸出,包括語(yǔ)音識(shí)別服務(wù)和語(yǔ)音合成服務(wù)。
· 全開(kāi)源方案:YODAOS系統(tǒng),可根據(jù)廠商或者個(gè)人開(kāi)發(fā)者的需求,靈活修改,也歡迎開(kāi)發(fā)者一起建設(shè)。
· CPU: Amlogic A113X A53x4 up to 1.5Ghz
· Memory: 256MB DDR3 + 512MB Nand Flash
· Mic Array: PDM mic x 4 Audio:line out 3.5mm
· Network:802.11 a/b/g/n/ac
· Bluetooth: BT 4.1/BLE LED: RGB
· LED x 12
· DC in:USB-Type C 5V
? 方案方塊圖
? 原理方框圖
? 核心技術(shù)優(yōu)勢(shì)
1,支持實(shí)時(shí)快速、精確的云端識(shí)別和遠(yuǎn)場(chǎng)拾音, 5米距離識(shí)別準(zhǔn)確率高達(dá)>92%。
2,識(shí)別輸出支持流式格式,能夠?qū)崟r(shí)地得到當(dāng)前識(shí)別的結(jié)果,根據(jù)字段判斷是否返回最終結(jié)果。
3,為保證用戶(hù)口音和生僻字、方言的識(shí)別,針對(duì)用戶(hù)粒度配置誤識(shí)別較高的糾錯(cuò)指令,通過(guò)app端的人工干預(yù),進(jìn)行識(shí)別的糾正。
4,支持通用領(lǐng)域識(shí)別和垂直領(lǐng)域定制識(shí)別,定期增加領(lǐng)域數(shù)據(jù),快速迭代,持續(xù)提升識(shí)別率。
? 方案規(guī)格
· 模組尺寸小,滿(mǎn)足小尺寸應(yīng)用場(chǎng)景
· 工作溫度-20℃+70℃;
· 工作電壓3.8V-4.2V,建議4V供電;
· 支持?jǐn)?shù)字音頻和模擬音頻,支持HR,FR,EFR,AMR語(yǔ)音編碼;
· 支持802.11 b/g/n 2.4GHz
· 支持HT20/HT40模式
· 支持低功耗信標(biāo)監(jiān)聽(tīng)模式,低功耗接收模式,低功耗掛起模式
· 支持SWD調(diào)試端口訪(fǎng)問(wèn)保護(hù)和禁止模式
· Wi-Fi和BT共用同一天線(xiàn)
· 支持串口本地升級(jí)和遠(yuǎn)程固件升級(jí)(FOTA)
評(píng)論