語音算法公司爭奪的下一戰(zhàn) 為何是芯片?
諸多AI算法公司在語音識別、圖像處理等領(lǐng)域大舉進攻,迎來了資本的熱捧。但如今風(fēng)向已變,AI算法公司在尋求應(yīng)用落地的過程中,發(fā)現(xiàn)算法無法成為持續(xù)的“抓手”,開始尋求轉(zhuǎn)型之道。這不,最近國內(nèi)數(shù)家語音創(chuàng)業(yè)公司已然陸續(xù)“硬”著陸,推出了AI語音專用芯片,包括思必馳、出門問問、Rokid、云知聲等等。拋開他們之間的“明爭暗斗”及互懟不談,以AI算法單打獨斗的時代顯然已然翻篇,下一戰(zhàn)AI語音專用芯片的戰(zhàn)斗已然打響。
本文引用地址:http://butianyuan.cn/article/201806/382486.htm算法的末路
對于這些公司“不約而同”的選擇,或許是時勢使然。
安創(chuàng)空間聯(lián)合創(chuàng)始人楊宇欣實話實說,他在最近的第五期安創(chuàng)成長營路演會上表示,創(chuàng)業(yè)公司純做算法是難以長久的,因為算法是有瓶頸和天花板的,可能根本就賣不了大錢,所以一定要與硬件結(jié)合來實現(xiàn)商業(yè)價值。
商業(yè)價值是與場景應(yīng)用密切相關(guān)的?!霸谀骋患毞謭鼍?,商業(yè)價值在于能夠用性價比高和性能功耗比最好的硬件實現(xiàn)相應(yīng)功能。這些場景在量還沒有起來時大公司的芯片不可能切入,因為大公司看重的是千萬級出貨量的市場?!?楊宇欣認(rèn)為,“在這一‘真空’時段,做算法的公司技術(shù)上一定要做垂直整合,即用芯片的方式保證自己的核心價值和利益。因為自己有AI能力,基于自己的算法和能力可開發(fā)最適合自己的芯片,實現(xiàn)最佳的匹配,這是AI算法公司商業(yè)價值最大化的必然趨勢?!?/p>
顯然這是一個“進化”中的結(jié)果,算法的世界必然是由算力作為基礎(chǔ)的,算法不足以支撐未來的成長,AI算法公司的垂直整合成為必然的路徑選擇。
專用芯片成新戰(zhàn)場?
因而,AI語音算法公司“不約而同”率先試水,近期國內(nèi)數(shù)家語音技術(shù)創(chuàng)業(yè)公司陸續(xù)推出AI語音專用芯片即為佐證。上述這些AI語音領(lǐng)域的頭部創(chuàng)業(yè)公司,幾乎都相繼押注AI語音專用芯片。
這一方面是算法公司的“騰籠換鳥”之舉,亦與市場的推力“合拍”。在語音應(yīng)用中的一大市場智能音箱中,迎來了銷量井噴期,Canalys預(yù)測,2018年全球智能音箱出貨量將超過5600萬臺。此外,車載市場、智能家居等諸多場景中的硬件也開始語音化智能化,將更加帶動AI專用語音芯片的爆發(fā)。
目前市場上智能音箱中的芯片方案或是由通用芯片兼顧語音處理,或已有專用語音芯片接招。例如天貓精靈使用的是聯(lián)發(fā)科MT8516語音芯片,小米音箱使用的是晶晨A113芯片,在這一形勢下,國內(nèi)一眾語音技術(shù)公司憑借自身在語音識別、自然語言處理、語音交互設(shè)計等技術(shù)上的積累,轉(zhuǎn)型做AI語音芯片集成及提供語音交互解決方案來得順理成章。
而隨著一眾AI語音公司加入戰(zhàn)團,也將使市場格局和未來走勢難以明朗。
芯片的架構(gòu)選擇?
從芯片架構(gòu)來看,不管是云知聲發(fā)布的面向IoT領(lǐng)域的第一代UniOne芯片“雨燕”,還是出門問問推出的語音芯片模組問芯Mobvoi A1,亦或是Rokid發(fā)布的SoC芯片KAMINO18,都主打高集成度、低功耗、低成本、可定制化等特點。
據(jù)悉,云知聲的“雨燕”芯片采用CPU+uDSP+DeepNet架構(gòu),而出門問問和Rokid則宣布自己的芯片是基于杭州國芯科技芯片深度定制。Rokid曾確認(rèn)KAMINO18基于40nm工藝的國芯GX8010制造。
國芯科技在去年底發(fā)布了兩款主打AI語音交互功能的NPU芯片GX8008和GX8010,內(nèi)置Cadence最新的Tensilica HIFI 4 DSP內(nèi)核,主打低功耗、低成本、可離線與集成化。出門問問、Rokid等廠商通過集成麥克風(fēng)陣列信號處理、降噪、喚醒技術(shù)、聲紋識別以及一些語音技能來成就自己的IC。
思必馳日前宣布完成D輪5億元融資,由元禾控股、中國民生投資集團領(lǐng)投,深創(chuàng)投、富士康、聯(lián)發(fā)科跟投。思必馳表示,目前已與某芯片巨頭在AI芯片方面達成合作,雙方將成立合資公司,適用于智能語音交互的AI芯片已在研發(fā)過程中,下半年將流片。據(jù)悉,這將是一款A(yù)SIC芯片,同時具備聲學(xué)信號處理能力和語音能力。
而芯片的比拼并不只是性價比那么簡單,提供整體的語音交互解決方案才是重“芯”所在。其中,云知聲提出了云端芯一體化的解決方案,出門問問則要打造一站式軟硬結(jié)合的語音解決方案。而思必馳宣稱要提供包括DUI平臺、語音芯片、垂直方案等更全面的支持服務(wù),以及將走深化方案與平臺能力,提供智慧服務(wù),近期即將公布Business Assistant 企業(yè)智能服務(wù)業(yè)務(wù)。
市場的角力?
而這或只是語音專用芯片戰(zhàn)局的開始,未來或有更多的算法公司甚至巨頭“攪入”,這一戰(zhàn)局涌入如此多玩家,亦注定是一場硬仗。
而AI專用語音芯片能否持續(xù)爆發(fā),一方面要看這些芯片能否大規(guī)模應(yīng)用,另一方面還要看這些產(chǎn)品的語音交互能力到底能否得到市場的青睞。
清華大學(xué)微電子所所長魏少軍在接受媒體采訪時曾表示,AI的殺手級應(yīng)用還沒出現(xiàn),不管是智能音箱還是其他產(chǎn)品,都還沒有成為一個剛需。因此,只有使語音真正成為人機交互的主流,才能推動AI語音芯片的爆發(fā)。
而除一體化的解決方案之外,與場景的深度融合才是未來真正的考驗。楊宇欣表示,AI公司如果只做芯片,沒有算法和場景的話立馬就會遇到生態(tài)系統(tǒng)的問題,必須要有場景、有算法、有芯片?,F(xiàn)在有了算法和芯片,關(guān)鍵的問題是如何深入場景打造優(yōu)秀的語音交互體驗?
思必馳、云知聲、出門問問、Rokid等在應(yīng)用場景的布局有諸多交叉,均集中智能家居、車載、機器人等領(lǐng)域,這應(yīng)是未來的主戰(zhàn)場。當(dāng)然,他們也都在積極探索新的業(yè)務(wù)場景,如醫(yī)療、智慧服務(wù)等。未來的戰(zhàn)線也將拖得越來越長。
評論