引爆A股的Sora到底是啥?將為AI賽道帶來什么投資機會?
2月19日,Sora概念股掀起漲停潮。該AI視頻模型系日前OpenAI發(fā)布的“核彈級”產(chǎn)品,文生視頻60秒一鏡到底,效果堪稱“炸裂”!中證君收集了多個市場最關心的問題,讓我們一起看看機構和業(yè)內(nèi)人士如何剖析Sora。
Sora到底是什么?
2月16日,OpenAI發(fā)布文生視頻模型Sora。它能夠根據(jù)用戶輸入的提示詞、文本指令或靜態(tài)圖像,生成長達一分鐘的視頻,其中既能實現(xiàn)多角度鏡頭的自然切換,還包含復雜的場景和生動的角色表情,且故事的邏輯性和連貫性極佳。
OpenAI一共展示了48個文本生成的視頻。如:
文本提示:一位時尚的女人走在東京的街道上,街道上到處都是溫暖的發(fā)光霓虹燈和動畫城市標志。她身穿黑色皮夾克,紅色長裙,黑色靴子,背著一個黑色錢包。她戴著墨鏡,涂著紅色口紅。她自信而隨意地走路。街道潮濕而反光,營造出五顏六色的燈光的鏡面效果。許多行人四處走動。
OpenAI視頻截圖
工銀瑞信:AI視頻生成的難點在于,一方面視頻是連續(xù)的多幀圖像,并且要有邏輯性,并非簡單的圖片組合;另一方面是帶來模型復雜度提升、計算難度和成本的提升。此外,文生視頻需要大量的“文本-視頻”配對數(shù)據(jù),而目前缺乏多樣化的數(shù)據(jù)集,且數(shù)據(jù)標注的工作量較大。因而此前視頻大多為5-15秒,而Sora將視頻時長提升至1分鐘,支持生成多個鏡頭,同時基本維持了角色和視覺風格的一致性,并能在一定程度上“理解”現(xiàn)實世界。
國泰君安:Sora具有三大突出亮點:一是60秒長視頻,可以保持視頻主體與背景的高度流暢性與穩(wěn)定性;二是在一個視頻內(nèi)實現(xiàn)多角度鏡頭,分鏡切換符合邏輯且十分流暢;三是理解真實世界的能力,對于光影反射、運動方式、鏡頭移動等細節(jié)處理得十分優(yōu)秀,極大地提升了真實感。
Sora發(fā)明者之一是天才少年謝賽寧?
2月19日,針對有自媒體稱Sora發(fā)明者之一是畢業(yè)于上海交大的天才少年謝賽寧,謝賽寧本人通過朋友圈對此進行否認稱,一點關系都沒有,是該自媒體標題黨AI寫稿,胡亂掛鉤,誤導事實。
OpenAI官網(wǎng)披露的Sora技術團隊信息顯示,Sora團隊由Peebles等3人領導,核心成員包括12人,其中有多位華人。不過謝賽寧不在名單中。
Sora的技術思路與其他產(chǎn)品有何不同?
工銀瑞信:技術角度來看,Sora采用了“擴散+Transformer”的視頻生成大模型技術路線,可謂有了里程碑式的技術進步。相比以往使用的同為擴散模型的U-Net,Transformer架構的參數(shù)可拓展性強,即參數(shù)量增加,性能加速提升,同時支持任意分辨率、長寬比、時長的視頻訓練數(shù)據(jù),不會因為壓縮導致訓練數(shù)據(jù)質量下降。此外,Sora訓練了能在時間和空間上壓縮視頻的自編碼器,這也是其能夠大幅提升生成視頻時長的原因。
360集團創(chuàng)始人周鴻祎:Sora的技術思路完全不一樣。之前做視頻做圖用的都是Diffusion,是多個真實圖片的組合。這次OpenAI利用其大語言模型優(yōu)勢,把LLM和Diffusion結合起來訓練,讓Sora實現(xiàn)了對現(xiàn)實世界的理解和對世界的模擬兩層能力,這樣產(chǎn)生的視頻才是真實的,才能跳出2D的范圍模擬真實的物理世界。
Sora有何商業(yè)價值?
安爵資產(chǎn)董事長劉巖:Sora模型的出現(xiàn)預示著行業(yè)變革的來臨。在內(nèi)容創(chuàng)作與媒體領域,它將徹底改變視頻制作的傳統(tǒng)方式,助力創(chuàng)作者以更高效、更低成本的方式創(chuàng)作出高質量視頻,從而推動整個行業(yè)的工作效率提升。對于廣告、電影預告片和短視頻等行業(yè),Sora模型更是可能帶來顛覆性的創(chuàng)新。同時其在模擬世界方面的能力為虛擬現(xiàn)實、游戲開發(fā)等領域開辟了巨大的潛力空間。
工銀瑞信:商業(yè)角度來看,從“idea或IP→內(nèi)容生產(chǎn)→內(nèi)容分發(fā)”的產(chǎn)業(yè)鏈,長期預計視頻生產(chǎn)的成本將大幅降低。目前AI生成視頻的水平還有待提升,可能更適合做對視頻質量要求低的互聯(lián)網(wǎng)廣告素材,如游戲買量素材等。由于Sora基本處于閉源狀態(tài),技術細節(jié)并未公布,相比于GPT有較多開源模型而言,國內(nèi)視頻生成模型方面尚有差距,利好有idea但落地較慢的動畫電影公司、IP公司,以及能夠降本增效的游戲行業(yè)。
周鴻祎:Sora有強勁的大模型做底子,基于對人類語言的理解,對人類知識和世界模型的了解,再疊加很多其他的技術,就可以創(chuàng)造各個領域的超級工具,比如生物醫(yī)學、蛋白質和基因研究,包括物理、化學、數(shù)學的學科研究上,大模型都會發(fā)揮作用。這次Sora對物理世界的模擬,至少將會對機器人具身智能和自動駕駛帶來巨大的影響。
A股Sora概念股怎么看?
云從科技:目前,從容大模型已實現(xiàn)利用diffusion、GAN等生成式技術圍繞人物圖像、人物視頻數(shù)據(jù)進行建模,通過文本和音頻實現(xiàn)對圖像和視頻內(nèi)容進行生成、控制、編輯。應用上,云從科技與天津港、華為等共同開發(fā)港口大模型PortGPT,核心是AI智能體天天,通過AI生成交互畫面,協(xié)同數(shù)據(jù)分析,提高港口運轉效率及安全性。此外,還在文生圖像、視頻等跨模態(tài)領域積極布局,包括發(fā)布數(shù)字人能力平臺,生成AI視頻;與中國電信合作AI營銷海報生成等。
博匯科技:公司一直在積極關注Sora相關業(yè)務的布局及發(fā)展。目前,公司業(yè)務主要在傳媒安全領域,有兩個方向:一方面是針對音視頻內(nèi)容運維提供保障,另一方面是針對音視頻內(nèi)容的監(jiān)管。目前Sora相關產(chǎn)品處于初級階段,未來的應用還有待進一步研究。Sora后續(xù)如果應用場景比較寬泛,產(chǎn)生的視頻數(shù)據(jù)量將有所增長,對產(chǎn)業(yè)將有一定促進。
因賽集團:預計于2024年3月底前,開發(fā)實現(xiàn)文生視頻功能,之后推出公測版正式啟動商業(yè)化。公司目前已收到幾家汽車、快消行業(yè)知名品牌方發(fā)出的AIGC營銷項目投標邀請,后續(xù)會在確保生成效果和效率的前提下,加快 InsightGPT的商業(yè)化進程。
漢王科技:Sora目前屬于比較前沿的動態(tài),漢王一直在人工智能領域耕耘。公司有自己的核心技術,比如文本識別、圖像識別、視頻分析等多模態(tài)識別技術,并已在多領域進行應用。在識別解析技術方向,公司有自己的大模型(漢王天地),主要在垂直領域進行應用。
Sora將為AI賽道帶來什么投資機會?
止于至善投資總經(jīng)理何理:Sora的發(fā)布有望再度掀起AI上漲熱潮。盡管Sora的視頻時間僅有一分鐘,但按照OpenAI的迭代速度,生產(chǎn)出幾十分鐘的AI視頻也不遠了。未來數(shù)年內(nèi),將對整個影視制作和短視頻行業(yè)帶來顛覆性沖擊。目前AI熱潮已進入第二階段,重點在于產(chǎn)品層面的AI創(chuàng)新以及數(shù)據(jù)層面的業(yè)績檢驗。未來行情的爆發(fā)屬于應用端與基建端并舉,應用端重點關注與AI融合較好的TOB端應用,基建端主要關注GPU、光模塊、液冷、數(shù)據(jù)要素等。
中信建投證券:AI仍然是當前科技投資的主線,海外AI大模型和應用保持較快迭代速度,隨著Sora、Gemini 1.5 Pro 等大模型的發(fā)布,多模態(tài)能力顯著增強,應用場景進一步拓寬,這將帶動算力基礎設施的投資,建議關注光模塊、ICT基礎設施等板塊。
申萬宏源:對于短視頻UGC平臺,借助AI升級剪輯工具拉動創(chuàng)作者經(jīng)濟的進一步發(fā)展,但也需關注是否會有競爭的變化。對于深度內(nèi)容受益,IP價值提升,對淺顯低門檻內(nèi)容競爭加劇。對創(chuàng)意工具,應對競爭的要素是B端客戶粘性和版權庫積累。AI造假或影響新聞生產(chǎn)和傳播,識別AI視頻將是內(nèi)容審核關鍵環(huán)節(jié)。可關注光通信產(chǎn)業(yè)鏈、算力設備產(chǎn)業(yè)鏈、多模態(tài)算法布局、有豐富IP儲備的深度內(nèi)容創(chuàng)作、商業(yè)化AI應用場景的美圖等方向。
招商基金:AI賽道大概率仍是未來一段時間的主線之一,后續(xù)仍可重點關注AI產(chǎn)業(yè)鏈內(nèi)算力與應用的配置機會。
博時基金:受海外AI應用取得突破性進展的催化,AI板塊****強勁。當前AI板塊的產(chǎn)業(yè)邏輯較為順暢,后續(xù)的增長持續(xù)性或有望提升,業(yè)績也有可能超預期,相對看好其未來表現(xiàn)。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。