新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 新品快遞 > Achronix推出基于FPGA的加速自動(dòng)語音識(shí)別解決方案

Achronix推出基于FPGA的加速自動(dòng)語音識(shí)別解決方案

—— 提供超低延遲和極低錯(cuò)誤率(WER)的實(shí)時(shí)流式語音轉(zhuǎn)文本解決方案,可同時(shí)運(yùn)行超過1000個(gè)并發(fā)語音流
作者: 時(shí)間:2023-11-29 來源:電子產(chǎn)品世界 收藏

高性能芯片和嵌入式(e IP)領(lǐng)域的領(lǐng)先企業(yè)半導(dǎo)體公司日前自豪地宣布:正式推出與Myrtle.ai合作的最新創(chuàng)新——基于Speedster7t FPGA的(ASR)加速方案。這一變革性的解決方案,實(shí)現(xiàn)了高精度和快速響應(yīng),可將超過1000個(gè)并發(fā)的實(shí)時(shí)語音流轉(zhuǎn)換為文本,同時(shí)性能比競爭方案高20倍。于2023年11月12日至17日在丹佛舉辦的“2023年超級(jí)計(jì)算大會(huì)(SC23)”上演示了該方案。

本文引用地址:http://butianyuan.cn/article/202311/453430.htm

該解決方案由搭載Speedster7t FPGA器件的VectorPath加速卡提供支持,運(yùn)行Myrtle.ai提供的基于Achronix FPGA的ASR IP,從而提供業(yè)界領(lǐng)先的、實(shí)時(shí)的、超低延遲的語音轉(zhuǎn)文本功能。服務(wù)器中的單張加速卡可替代多達(dá)20臺(tái)僅基于CPU的服務(wù)器或15張GPU加速卡。當(dāng)不需要支持1000個(gè)并發(fā)流時(shí),可以輕松自定義 AI 模型,以權(quán)衡準(zhǔn)確性與性能。其出色的單詞錯(cuò)誤率和54毫秒的端到端99%延遲(包括了預(yù)處理和后處理以及與CPU做數(shù)據(jù)交互的時(shí)間)將顛覆ASR領(lǐng)域。此外,該解決方案可以在標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)(ML)框架中使用垂直應(yīng)用特定的或自定義的數(shù)據(jù)集進(jìn)行定制或重新訓(xùn)練。

1701240190899461.png

“基于Achronix Speedster7t FPGA器件的Myrtle.ai加速ASR解決方案的關(guān)鍵優(yōu)勢(shì)之一是能夠降低運(yùn)營成本和資本支出,同時(shí)保持其顯著的頂級(jí)性能,”Achronix人工智能產(chǎn)品營銷總監(jiān)Bill Jenkins指出。“該解決方案基于Speedster7t FPGA,與傳統(tǒng)的基于CPU/ GPU的服務(wù)器解決方案相比,無論是在企業(yè)還是在云端,都可以將成本降低90%。這種能力意味著企業(yè)可以顯著降本增效,同時(shí)提供卓越的實(shí)時(shí)語音轉(zhuǎn)文本功能?!?/p>

Myrtle.ai一流的ASR加速器IP運(yùn)行在Speedster7t FPGA器件和軟件棧上,事實(shí)證明了該FPGA器件能夠?qū)崿F(xiàn)并加速ASR實(shí)現(xiàn)解決方案,且易于使用。與基于GPU的競爭解決方案相比,基于Speedster7t器件的解決方案將性價(jià)比提升了16倍,憑借該優(yōu)勢(shì),該解決方案或?qū)⒅匦露x行業(yè)級(jí)語音數(shù)據(jù)處理方式。

“Achronix Speedster7t FPGA器件的架構(gòu)以及其二維片上網(wǎng)絡(luò)(2D NoC)和機(jī)器學(xué)習(xí)處理器(MLP)陣列,為我們提供了創(chuàng)建ASR產(chǎn)品所需的構(gòu)建模塊,該產(chǎn)品比目前市場(chǎng)上的任何產(chǎn)品都更優(yōu)秀,”Myrtle.ai首席執(zhí)行官說道。Myrtle.ai公司以其在優(yōu)化實(shí)時(shí)性應(yīng)用的低延遲 ML 推理方面的專業(yè)知識(shí)而聞名于業(yè)界。 “這些FPGA器件中特有的極低延遲使其成為實(shí)時(shí)工作負(fù)載的理想選擇。我們很高興能夠幫助用戶實(shí)現(xiàn)以比以往更快的速度和更低的成本來擴(kuò)展其ASR服務(wù)的能力?!?/p>

Achronix與Myrtle.ai共同推出的加速ASR解決方案將給那些依賴于快速且準(zhǔn)確的語音轉(zhuǎn)文本功能的行業(yè)帶來革命性的影響。其特性包括與主流深度學(xué)習(xí)框架(如PyTorch等)的兼容性,以及用于多語言或?qū)I(yè)的可重訓(xùn)練性。該解決方案目前已在早期合作客戶中部署,現(xiàn)在可以在一般市場(chǎng)上使用。大家可以使用您自己的數(shù)據(jù)集對(duì)該解決方案進(jìn)行評(píng)估,或與我們的團(tuán)隊(duì)聯(lián)系安排詳細(xì)的討論和演示。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉