4個人撐起2.5億美元估值,Pika給AI創(chuàng)業(yè)撕開一道新口子
被戲稱為“女兒概念股”的信雅達(600571),在經(jīng)歷連續(xù)6個漲停板后,近日股價終于降溫,但外界對于AI視頻生成工具Pika的關(guān)注并未因此而消退。
Pika是一款在硅谷風(fēng)頭正盛的AI視頻生成產(chǎn)品,其創(chuàng)始人郭文景(Demi Guo)是一位來自杭州的“95后”年輕女性,同時也是信雅達實控人郭華強之女。
盡管信雅達多次發(fā)布公告與Pika“劃清界限”,稱公司并未投資Pika,也無投資計劃,但市場對Pika的信心首先反映在了信雅達的股價上。
圖源:Pika 1.0官方宣傳片
團隊僅有四個人,不到半年時間完成3輪共計5500萬美元的融資,估值飆升至2.5億美元——這組數(shù)字在凸顯Pika能力的同時,也從側(cè)面表明AI生成視頻產(chǎn)品仍在起步階段,需要投入大量財力進行基礎(chǔ)訓(xùn)練。
此時距離ChatGPT掀起的“聊天機器人”AI風(fēng)口剛滿一年,相關(guān)公司之間的淘汰賽也愈發(fā)激烈。像Pika這樣的初創(chuàng)公司到底是一時突圍的幸運兒,還是能走向終點的幸存者?
小團隊“大力出奇跡”拋去A股上市公司實控人之女的身份,郭文景算是一位年輕的技術(shù)和學(xué)術(shù)人才。
她在高中時就進入國際數(shù)學(xué)奧林匹克競賽國家集訓(xùn)隊,并在2015年獲得國際信息學(xué)奧林匹克競賽銀牌。此后從國內(nèi)高中升學(xué)進入哈佛大學(xué),在獲得數(shù)學(xué)學(xué)士學(xué)位后,繼續(xù)攻讀計算機科學(xué)碩士學(xué)位,后轉(zhuǎn)至斯坦福攻讀博士學(xué)位。
Pika團隊另一位聯(lián)合創(chuàng)始人同為女性,CTO孟晨琳(Chenlin Meng)在攻讀計算機博士學(xué)位期間,3年時間里發(fā)表了30多篇論文,其中,她參與創(chuàng)作的DDIM(去噪擴散隱模型)論文是AI生圖領(lǐng)域的一種重要技術(shù)路線。
據(jù)《海外獨角獸》報道,Pika誕生于一次“失敗”的經(jīng)驗。2023年初,郭文景組織了一個小團隊參與Runway(目前公認的AI生成視頻產(chǎn)品領(lǐng)頭羊)比賽,期間她發(fā)現(xiàn)想用AI賦能電影創(chuàng)作十分困難,即便幾秒鐘的內(nèi)容也要耗費幾小時。這讓她看見了機會。
今年1月,郭文景產(chǎn)生了創(chuàng)業(yè)的想法。當時,Runway還未發(fā)布令外界震驚的文生視頻產(chǎn)品Gen-1,而郭文景看到了AI視頻生成技術(shù)進展迅速,“但其他人都沒開始做”,即便是已有大量競品出現(xiàn)的當下,行業(yè)里還有諸如流暢度、復(fù)雜性等大量問題亟待突破。瓶頸也是機會,團隊因此感到興奮。
公司另一位創(chuàng)始成員陳思禹(Karli Chen)是郭文景的高中同學(xué),同樣為技術(shù)出身。還有一位較晚加入的成員Matan Cohen-Grumi則是創(chuàng)意出身,其公開職位是創(chuàng)意總監(jiān)。
4個人,這就是目前Pika團隊所有的全職人員。還有一些兼職人員與實習(xí)生,大多是來自名校的博士與本科生,一些基礎(chǔ)工作則采用外包形式。
Pika的第一個版本今年4月下旬就在Discord上進行了公測,7月Pika測試版在Discord正式推出服務(wù)器。11月29日,Pika1.0正式發(fā)布,用戶可以在網(wǎng)頁端排隊等候測試名額。截至12月4日,Pika的Discord服務(wù)器人數(shù)已經(jīng)增長到超過16萬。
Pika成立以來一直在“快進”,但郭文景卻在上述報道中表示,“和預(yù)期中比起來做得還不夠好”。團隊本來設(shè)定的激進目標是在暑假發(fā)布一個新產(chǎn)品,實現(xiàn)百萬用戶。
“Pika其實證明了一件很核心的事情,他們團隊非常小,每個人都有很好的算法經(jīng)驗,同時花了很多錢在模型的訓(xùn)練算力支出上。這意味著(創(chuàng)業(yè)公司)新的范式:錢不是花在真的人身上,而是花在GPU上,GPU某種程度就是一個新的人類,它能更不知疲倦地干活,在某種特定任務(wù)上干得更有效率,但背后其實需要的是關(guān)鍵算法的指揮。”企業(yè)級生成式AI平臺猴子無限CEO尹伯昊對界面新聞?wù)f。他認為,Pika的核心在于找到了其他競品沒有做到的關(guān)鍵點——讓視頻畫面具有故事性。
他舉例說,市面上其他產(chǎn)品是“把一個相對靜態(tài)的圖變得稍微動態(tài)了一點”,而Pika則是“強調(diào)讓單個分鏡頭有更強的故事性,可能他們已然只有2-3秒?!边@個關(guān)鍵算法不是秘密,接下來許多公司都會跟進,但Pika的壁壘在于,投入了足夠多的計算資源在它上面。
多模態(tài)AI應(yīng)用對于算力的需求顯著高于文字,Pika將大量財力物力注入基礎(chǔ)模型側(cè)而非網(wǎng)頁端,這導(dǎo)致其本質(zhì)上更像一家典型的模型層公司,而非應(yīng)用層公司。在美國風(fēng)投對基礎(chǔ)大模型投資臨近關(guān)閉的當口,Pika趕上了末班車, “目前Pika的熱度能否持續(xù),要看接下來燒錢融資的情況?!币晃活^部廠商的云計算業(yè)務(wù)負責人告訴界面新聞。
目前,Pika用戶數(shù)達到50萬,每周生成數(shù)百萬個視頻。截至2023年11月,Pika租用了數(shù)百個量級的GPU。
3D數(shù)字內(nèi)容應(yīng)用平臺隨幻科技數(shù)字化應(yīng)用業(yè)務(wù)負責人黃文迪對界面新聞表示,“AI視頻生成是一項計算密集型任務(wù),特別是當涉及到高分辨率和高質(zhì)量輸出時。數(shù)百量級的GPU可以支持相當數(shù)量的并發(fā)視頻生成任務(wù),這對于初創(chuàng)公司來說通常是足夠的?!?/p>
在此前披露的采訪里,郭文景稱Pika有信心成為視頻生成行業(yè)里技術(shù)最強的團隊,現(xiàn)階段第一要務(wù)就是招更多的技術(shù)人才,并在2024年推出可投入商用的產(chǎn)品。
要保持住領(lǐng)先優(yōu)勢,郭文景還認為,“要不斷積累資源,包括用戶資源、數(shù)據(jù)和GPU資源等等。”同時,在視頻生成領(lǐng)域,審美與技術(shù)一樣重要,所以團隊做產(chǎn)品會把技術(shù)與設(shè)計能力結(jié)合,逐漸形成壁壘。
AI新戰(zhàn)場并非所有人都對爆火的Pika持積極態(tài)度,一位投資人便向界面新聞記者表示,Pika“有一些亮點,但也沒有那么好”。公司最大的問題來自于持久性,因為有基礎(chǔ)模型能力的大廠即將或正在輸出完全同質(zhì)化的產(chǎn)品,Pika可能被“卷死”。這也是所有小規(guī)模AI應(yīng)用公司面臨的生存難題。
Pika的另外兩大競品分別為Runway與Stable。Runway成立于2018年,是行業(yè)內(nèi)有先發(fā)優(yōu)勢的公司,它在今年發(fā)布了Gen-1和Gen-2兩款產(chǎn)品,是第一個商業(yè)化且公開的視頻生成模型,可通過文本、圖片和視頻來進行視頻生成,并可編輯。Runway產(chǎn)品已有付費訂閱模式。
Stable指Stable Video Diffusion,它是由Stability AI開發(fā)的一款免費開源AI視頻生成模型,這家公司另一個明星產(chǎn)品是文生圖模型Stable Diffusion。
許多網(wǎng)友使用相同提示詞或圖片對三個產(chǎn)品進行橫評,從生成視頻質(zhì)量來看,光大證券的一份研報總結(jié)道:Runway Gen-2、Pika測試版、Stable中,Runway明顯領(lǐng)先,但其特色的“動態(tài)筆刷”功能還不能真正理解物品運動邏輯;而Pika測試版僅能使用提示詞生成,導(dǎo)致視頻質(zhì)量和穩(wěn)定性較差;Stable則無法直接由文字生成視頻(需要先文生圖),圖片動畫化的動態(tài)幅度強于Pika測試版,但可操作性和穩(wěn)定性弱于Runway。
需要注意的是,11月29日新發(fā)布的Pika 1.0在多方面都有提升,并且增加了局部編輯等功能,已經(jīng)可與Runway“打平”。
在商業(yè)化方面,AI視頻生成還無法直接生成一部電影,但能夠為電影等視頻內(nèi)容提供素材。短期內(nèi),AIGC可以聚焦于在某個環(huán)節(jié)內(nèi)部提升工作效率,例如減少建模、渲染的工作。此外,一些對視頻質(zhì)量要求不高,或定制化的領(lǐng)域,如廣告營銷、自媒體、數(shù)字人直播也可讓AI視頻技術(shù)發(fā)揮功用。如果能在算法和研發(fā)方面持續(xù)精進,AIGC也很有希望在電影、動漫的分鏡設(shè)計、鏡頭敘事等核心領(lǐng)域搶占一席之地。
該領(lǐng)域的競爭格局可謂百花齊放。在海外,創(chuàng)業(yè)公司與巨頭同臺競技,國內(nèi)則主要被資力雄厚的大廠占據(jù)陣地。
阿里研究院在近期推出了AI動畫項目Animate Anyone,可使用一張人物靜態(tài)圖與一個骨骼動畫生成人物動畫,但還沒有推出可供使用的版本。
字節(jié)跳動也發(fā)布了MagicAnimate、pixel dance產(chǎn)品,前者是一個基于圖片生成的人像動畫產(chǎn)品,后者則可以支持文本、圖像形式生成視頻,幾乎與Pika同時間推出。
黃文迪表示,當阿里和字節(jié)跳動這樣的大公司快速推出與Pika相似的產(chǎn)品時,通常會在市場上得到較快的認可,因為他們擁有豐富的數(shù)據(jù)來訓(xùn)練模型,以及強大的計算資源來支持模型的運行和優(yōu)化。
但東吳證券研報認為,Pika爆紅的意義在于,讓市場認識到好的AI產(chǎn)品可以創(chuàng)造新需求:6月起ChatGPT活躍用戶出現(xiàn)下降,但很快爆款A(yù)I生成視頻應(yīng)用顛覆了傳統(tǒng)視頻制作,各行各業(yè)都有望涌現(xiàn)出優(yōu)秀AI應(yīng)用。同時,爆款國產(chǎn)AI應(yīng)用的門檻并非遙不可及,過去的應(yīng)用壁壘可能會被AI應(yīng)用重新顛覆重塑。Pika小團隊的案例就足以說明,并非只有巨頭才能做出好的AI產(chǎn)品。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。