博客專欄

EEPW首頁 > 博客 > 當(dāng)AI遇到世界杯:梅西的封神之路,多了一些特殊觀眾

當(dāng)AI遇到世界杯:梅西的封神之路,多了一些特殊觀眾

發(fā)布人:大數(shù)據(jù)文摘 時間:2022-12-23 來源:工程師 發(fā)布文章

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自學(xué)術(shù)頭條


梅西圓夢了。


圖片


每屆世界杯都會造就英雄,但也會有人率先離場。然而,足球場上滾動的,不僅有球員們的汗水,觀眾的歡呼,也有歷屆世界杯所迭代的科技。


自1904年FIFA國際足聯(lián)成立后,世界杯走進了人們的視線。但直至上世紀50年代,隨著電視轉(zhuǎn)播技術(shù)的出現(xiàn),它才真正走向了千家萬戶。1998年的法國世界杯,電視轉(zhuǎn)播觀眾人數(shù)達到40億人次。然而,時至今日,依舊有一些人需要這樣的“聲音”。


距離卡塔爾6000多公里外,身穿紅色連衣裙、扎著馬尾辮的“主播”弋瑭,開始了她繁忙的一天,不斷向全世界傳遞著這樣的“聲音”。


圖片

圖|“主播”弋瑭為世界杯進行手語播報


從“奧運會”走向“世界杯”


來自世界衛(wèi)生組織(WHO)的數(shù)據(jù)顯示,截至 2021 年 4 月 1 日,全球約有 15 億人罹患某種程度的聽力損失,其中約有 4.3 億人需要針對聽力損失的康復(fù)服務(wù);到 2050 年,預(yù)計將有近 25 億人存在某種程度的聽力損失,至少 7 億人需要聽力康復(fù)。因此,由AI技術(shù)驅(qū)動的手語數(shù)字人屆時或?qū)⒊霈F(xiàn)在各種各樣的實際場景中,是聽障人士在試圖認識世界、感受世界時必不可少的幫手。


早在今年的北京冬奧會、北京冬殘奧會上,一個同樣身穿紅色西裝的AI手語數(shù)字人,就在北京衛(wèi)視《北京您早》節(jié)目中對“冬奧賽事集錦”和“一起看冬奧”進行了手語播報,不僅降低了播報工作的運營成本,還為聽障人士收看冬奧賽事提供了便利。她便是第一代手語數(shù)字人“華同學(xué)”。她源于北京市科委科技冬奧專項支持的“冬奧手語播報數(shù)字人系統(tǒng)”課題技術(shù)成果,經(jīng)北京冬奧會、冬殘奧會期間實踐應(yīng)用改進提升而來。


圖片

圖|“華同學(xué)”助力冬奧會現(xiàn)場


AI手語數(shù)字人華同學(xué)的數(shù)據(jù)基礎(chǔ)以《國家通用手語》為標(biāo)準,采集大量動態(tài)數(shù)據(jù),構(gòu)建了符合國家通用手語規(guī)范的國內(nèi)最大規(guī)模多模態(tài)手語語料庫。智譜AI的研發(fā)團隊基于大規(guī)模預(yù)訓(xùn)練模型構(gòu)建手語數(shù)字腦,通過語義蒸餾算法與手語翻譯模型,生成和原文語義高度接近、語義精簡且符合手語表達習(xí)慣的手語詞序列。最后,通過跨模態(tài)擬人生產(chǎn)算法,驅(qū)動AI手語數(shù)字人華同學(xué)能夠以連貫、精準的手勢動作、表情、口型,為觀眾朋友提供專業(yè)、準確的手語體育賽事解說。


而在這個冬天,華同學(xué)“學(xué)會”了更多的新知識?;诙瑠W手語數(shù)字人科研成果,她新學(xué)了足球相關(guān)手語詞90個,提取了2018年世界杯8場比賽近1000分鐘的語音解說文本,進行手語翻譯詞序列的語料標(biāo)注,補充12場比賽14個球隊365名球員的手語表達方式。然后,她走向了“世界杯”。


 “華同學(xué)”賦能“弋瑭”


升級后的“華同學(xué)”不僅能夠為賽事提供更加連貫精準的手勢、表情以及口型動作,還能賦能給其他的數(shù)字人。此次世界杯,她便賦能“弋瑭”,倆人一同出場。她們超有感染力流暢的實時解說,帶給了觀眾們新奇的體驗。


圖片

圖片

圖|“華同學(xué)”賦能“弋瑭”聯(lián)袂播報


世界杯期間咪咕推出智能手語主播弋瑭,由智譜AI與凌云光提供技術(shù)支持。那么, “華同學(xué)”是如何賦能給“弋瑭”的呢?主要包括以下三點原因:


  • 新增手語詞手勢數(shù)據(jù):依據(jù)《體育和律動常用詞通用手語》以及世界杯解說高頻詞語,新增足球、足球項目裁判手勢、足球聯(lián)賽等相關(guān)手語詞,共計90個。


  • 補充語料:為提升手語翻譯引擎在世界杯解說中的表現(xiàn),項目組提取2018年俄羅斯世界杯,8場比賽近1000分鐘的語音解說文本,進行手語翻譯詞序列的語料標(biāo)注。并根據(jù)手語數(shù)智人解說場次,補充12場比賽14個球隊365名球員的手語表達方式。


  • 手語翻譯算法:足球領(lǐng)域?qū)儆谔囟I(lǐng)域,通用領(lǐng)域的知識難以直接滿足特定的業(yè)務(wù)場景,基于這點,智譜AI選擇使用原始模型加上少量的領(lǐng)域數(shù)據(jù)對來獲取一個面向特定領(lǐng)域的手語翻譯模型。為了提高模型的泛化能力以及領(lǐng)域適配性,他們采用了一種新穎的正負樣本生成的對比學(xué)習(xí)方法,以區(qū)分正確的輸出和正確輸出。


讓“世界”更有“愛(AI)”


此次為世界杯加油助力的數(shù)字人技術(shù),是借助基于深度神經(jīng)網(wǎng)絡(luò)的自然語言處理、高逼真度3D渲染、行業(yè)手語語料庫、融合手語知識的翻譯模型等技術(shù),讓更多人感受到了綠茵場上的賽事激情。


但AI技術(shù)需要持續(xù)不斷地發(fā)展,不能在賽事之后變?yōu)椤凹澎o的森林”。智譜AI也將繼續(xù)秉承著MaaS(Model as A Service/模型即服務(wù))的理念,提供模型共訓(xùn)服務(wù)、模型授權(quán)服務(wù),以及API開放平臺,圍繞平臺形成人工智能的應(yīng)用生態(tài)。在數(shù)字人技術(shù)方面,智譜AI也將持續(xù)研發(fā)技術(shù),開放多層次的應(yīng)用,包括手語播報、手語翻譯以及AI手語詞典,為殘障人士平等參與社會生活創(chuàng)造無障礙環(huán)境,切實提高大家的社會參與感和生活幸福指數(shù)。


讓科技服務(wù)公益,讓世界更有愛(AI)。


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉