新聞中心

EEPW首頁 > 智能計(jì)算 > 市場(chǎng)分析 > 分析師觀點(diǎn):Sora正式發(fā)布前,多模態(tài)大模型爆發(fā)前夜的10個(gè)思考

分析師觀點(diǎn):Sora正式發(fā)布前,多模態(tài)大模型爆發(fā)前夜的10個(gè)思考

作者: 時(shí)間:2024-02-21 來源:IDC 收藏

OpenAI發(fā)布使用大模型生成的1分鐘短視頻后,正式全面打開了生成式AI的想象空間。盡管目前尚未正式對(duì)外開放使用,也無法了解到更多技術(shù)細(xì)節(jié),但可以確定的是這一波技術(shù)迭代將為AI行業(yè)參與者帶來可觀的機(jī)遇。

本文引用地址:http://www.butianyuan.cn/article/202402/455590.htm

爆發(fā)前夜,中國研究總監(jiān)盧言霞給出了以下10個(gè)思考,供您參考

對(duì)于生成式AI的影響:在文生視頻領(lǐng)域真正邁出了第一步,真正做到生成式AI驅(qū)動(dòng)生成短視頻。接下來也將刺激其他科技巨頭加快在該領(lǐng)域的技術(shù)攻關(guān)力度以及產(chǎn)品發(fā)布速度。

不可預(yù)測(cè)的未來:具體哪些公司能在什么時(shí)間點(diǎn)推出與類似的產(chǎn)品,不可預(yù)測(cè)。當(dāng)前Sora生成的是1分鐘的視頻,對(duì)于行業(yè)已經(jīng)是重大突破,下一步何時(shí)能生成2分鐘5分鐘以上的視頻,不可預(yù)測(cè)。

最先應(yīng)用的領(lǐng)域:將最先應(yīng)用于短視頻、廣告、互娛、影視、媒體等領(lǐng)域。在這些領(lǐng)域采用能力,輔助人類員工生成視頻,既可以提高生產(chǎn)速度又可以提高生產(chǎn)數(shù)量,還可以創(chuàng)造全新的視覺感受,能夠幫助企業(yè)真正實(shí)現(xiàn)降本增效、提升用戶體驗(yàn)。

哪些公司有潛力快速推出類似產(chǎn)品:幾個(gè)最有潛力的群體——在大模型以及AI領(lǐng)域投入最為領(lǐng)先的科技巨頭,如BAT、科大訊飛等;在計(jì)算機(jī)視覺領(lǐng)域擁有深厚積累的公司,比如商湯、??狄活惖墓荆灰约岸桃曨l類公司;更可大膽想象,也或許會(huì)培訓(xùn)出的全新創(chuàng)企。

對(duì)于AI產(chǎn)業(yè)的影響:大語言模型為AI產(chǎn)業(yè)帶來新的生機(jī),然而語言模型的應(yīng)用場(chǎng)景有限。要全面打開生成式AI的想象力,還是要依托多模態(tài)大模型。Sora的發(fā)布,以及后續(xù)科技巨頭的跟進(jìn),有望對(duì)AI產(chǎn)業(yè)帶來再一輪爆發(fā)式的增長(zhǎng)。

對(duì)于個(gè)體的影響:不管您是否感受得到,于個(gè)人而言,生成式AI產(chǎn)品已經(jīng)在潛移默化的改變我們的生活方式,每一個(gè)人都可以認(rèn)真考慮該類產(chǎn)品如何能夠助力我們的生活與工作。

生成式AI對(duì)于全球數(shù)據(jù)空間的改變:未來5年,生成式AI生成的文本類文件、圖像類文件、視頻類文件、軟件代碼類文件數(shù)量將會(huì)越來越平均。而這其中,與圖像文件相關(guān)的數(shù)據(jù)量可能是文本文件的 100 倍,視頻文件是圖像文件的 10 倍。整體來看,由于 GenAI 的采用和使用日益增多,近期和遠(yuǎn)期所創(chuàng)建數(shù)據(jù)的增長(zhǎng)速度都將快于近幾年。

行業(yè)發(fā)展的挑戰(zhàn):

●   高質(zhì)量數(shù)據(jù)的稀缺:圖像、視頻類數(shù)據(jù)掌握在少數(shù)公司手中。這些數(shù)據(jù)也需要標(biāo)注,甚至重新采集,才能用于大模型的訓(xùn)練。

●   多模態(tài)大模型對(duì)算力的消耗更高,算力的可獲取性以及成本將是挑戰(zhàn)之一。

●   頂尖的大模型研發(fā)人才,也是行業(yè)發(fā)展的稀缺資源。

值得關(guān)注的事項(xiàng):多模態(tài)大模型將帶來更嚴(yán)峻的安全方面的挑戰(zhàn)。一方面多模態(tài)大模型將讀取更多的圖像、視頻類數(shù)據(jù),這些圖像視頻數(shù)據(jù)是否合規(guī)是否安全,需要得到保障;另一方面,生成的視頻與真實(shí)世界之間的差異,是否會(huì)影響到人身安全、社會(huì)穩(wěn)定、企業(yè)安全等,也需要注意。

做好準(zhǔn)備:大語言模型的研發(fā)歷程已經(jīng)能夠看到數(shù)據(jù)的重要性。在多模態(tài)大模型領(lǐng)域,有數(shù)據(jù)資源的企業(yè)可以考慮如何將這些數(shù)據(jù)開發(fā)成可供模型訓(xùn)練的數(shù)據(jù)產(chǎn)品,缺乏數(shù)據(jù)資源的企業(yè)也需要盡早收集能夠獲取到的數(shù)據(jù)源。

免責(zé)聲明

本文中的內(nèi)容和數(shù)據(jù)均來源于所發(fā)布的報(bào)告,所有內(nèi)容及數(shù)據(jù)均為我公司所有。未經(jīng)書面許可,任何機(jī)構(gòu)和個(gè)人不得以任何形式翻版、復(fù)制、刊登、發(fā)表或引用。



關(guān)鍵詞: Sora 多模態(tài)大模型 IDC

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉