OpenAI正式發(fā)布AI視頻生成工具Sora，Plus用戶每月可生成50條

作者：時間：2024-12-10 來源：網(wǎng)易科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

12月10日消息，美國時間周一，OpenAI正式發(fā)布了其備受關(guān)注的人工智能視頻生成工具Sora。

本文引用地址：http://butianyuan.cn/article/202412/465339.htm

這款工具的工作原理類似于OpenAI的圖像生成工具DALL-E：用戶只需輸入想要的場景描述，Sora即可生成高質(zhì)量視頻片段。此外，Sora還能夠根據(jù)靜態(tài)圖像生成相關(guān)視頻、擴展已有視頻或填補視頻缺失的幀。這一功能讓Sora在視覺生成領(lǐng)域展現(xiàn)了強大的創(chuàng)造力。今年2月，Sora首次亮相，而OpenAI去年憑借ChatGPT的廣泛流行躍入公眾視野。

根據(jù)OpenAI在YouTube上的直播介紹，Sora將于今日正式向美國以及“國際上大多數(shù)國家”的用戶開放。不過，對于歐洲、英國及其他部分國家的上線時間，OpenAI尚未給出具體安排。

用戶可以生成分辨率高達1080p、時長最長20秒的視頻，并支持寬屏、豎屏和正方形等多種畫幅比例。此外，用戶還可以導(dǎo)入自己的素材，用于擴展、重新混合或融合內(nèi)容，甚至直接從文本生成全新的視頻。

Sora將免費提供給現(xiàn)有的ChatGPT Plus和Pro訂閱用戶，無需支付額外費用；Plus用戶每月最多可生成50個480p視頻，而Pro用戶最多可生成500個。在直播中，OpenAI員工以及首席執(zhí)行官薩姆·奧特曼（Sam Altman）展示了Sora的多個功能亮點，例如“混合”功能（可以將兩個場景按照用戶指令融合為一個視頻）以及生成可無限循環(huán)播放的視頻選項。

無標題.jpg

（圖注：ChatGPT Plus每月提供1000積分； ChatGPT Pro提供10000積分）

在正式推出之前，Sora主要供一小部分“紅隊”安全測試人員使用，這些測試人員幫助檢測模型在信息偏差和誤用方面的潛在風險。

10月時，一些Reddit用戶向OpenAI高管詢問Sora的發(fā)布日期，并猜測延遲的原因是“推理計算和時間成本過高”或“出于安全考慮”。對此，OpenAI產(chǎn)品主管凱文·威爾（Kevin Weil）回應(yīng)稱：“我們需要完善模型，確保其在安全性、模擬能力及其他方面的表現(xiàn)，同時擴展計算能力！”

OpenAI的Sora產(chǎn)品負責人羅漢·薩海（Rohan Sahai）在直播中表示：“作為OpenAI，我們顯然承擔著巨大的責任?！彼a充道，公司必須防止該技術(shù)被非法使用，“但我們同樣希望實現(xiàn)創(chuàng)新與創(chuàng)意表達之間的平衡?！?/p>

今年10月，OpenAI完成了最新一輪融資，估值高達1570億美元，融資金額達到66億美元，并獲得了40億美元的循環(huán)信貸額度，使公司可支配流動資金總額超過100億美元。

作為微軟支持的人工智能初創(chuàng)企業(yè)，OpenAI正與眾多科技巨頭展開激烈競爭，包括亞馬遜及其支持的Anthropic、埃隆·馬斯克創(chuàng)辦的xAI，以及谷歌、Meta和微軟等。據(jù)預(yù)測，在未來十年內(nèi)，生成式人工智能市場收入可能突破1萬億美元大關(guān)。

本月早些時候，OpenAI任命其首位首席營銷官，標志著公司計劃在市場推廣方面增加投入，以進一步拓展用戶基礎(chǔ)。此外，今年10月，OpenAI在ChatGPT中新增了搜索功能，使其能夠更好地與谷歌、必應(yīng)和Perplexity等搜索引擎競爭，并吸引更多用戶。

作為ChatGPT的開發(fā)者，OpenAI希望通過Sora在視頻生成領(lǐng)域與Meta和谷歌等公司展開直接競爭。谷歌今年1月推出了Lumiere，而其他初創(chuàng)公司也已發(fā)布了類似的人工智能工具，例如Stability AI的Stable Video Diffusion。此外，亞馬遜也推出了“Create with Alexa”，這是一款專注于生成基于提示的短片兒童動畫內(nèi)容的模型。

隨著聊天機器人和圖像生成工具在消費及商業(yè)領(lǐng)域的普及，視頻生成正成為生成式人工智能的下一個前沿領(lǐng)域。雖然這一技術(shù)為AI愛好者帶來了創(chuàng)造性的新機會，但也引發(fā)了對錯誤信息和深度偽造的擔憂。據(jù)機器學習公司Clarity數(shù)據(jù)顯示，AI生成的深度偽造視頻數(shù)量同比增長達900%。

OpenAI將多模態(tài)（文本、圖像和視頻生成的結(jié)合）作為其戰(zhàn)略目標的一部分，以拓展人工智能工具的應(yīng)用場景。

在Sora發(fā)布之前，一些抗議者泄露了Sora的副本，表達對OpenAI對待藝術(shù)家方式的不滿。OpenAI的早期訪問計劃中包含了約300名藝術(shù)家，這些藝術(shù)家在11月底發(fā)表了一封公開信，批評OpenAI在透明度和對藝術(shù)界的支持方面做得不夠。

公開信中提到：“我們曾承諾作為早期測試者、紅隊成員和創(chuàng)意合作伙伴參與Sora的開發(fā)。然而，我們感到自己被引導(dǎo)參與了一場‘藝術(shù)洗白’，旨在展示Sora是一個對藝術(shù)家有用的工具?！?/p>

信中指出，數(shù)百名藝術(shù)家為Sora提供了大量無償勞動，通過漏洞測試和反饋推動了模型開發(fā)?！氨M管如此，只有少數(shù)人能通過競爭脫穎而出，他們的Sora創(chuàng)作作品得以公開放映，但所獲得的回報與OpenAI的公關(guān)和營銷價值相比微不足道?！?/p>

公開信指出：“我們并不反對將人工智能技術(shù)用作藝術(shù)創(chuàng)作的工具（如果反對，我們可能根本不會被邀請參加這個項目）。但我們不認同該藝術(shù)家項目的推出方式，以及這一工具在可能公開發(fā)布前的發(fā)展方向。我們公開這一情況，是希望OpenAI能變得更加開放，更加友好地對待藝術(shù)家，并真正支持藝術(shù)的發(fā)展，而不是將其僅作為公關(guān)宣傳的手段。”

對此，OpenAI在11月下旬發(fā)表聲明回應(yīng)稱：“數(shù)百名藝術(shù)家對Sora的開發(fā)作出了重要貢獻，幫助我們確定了功能開發(fā)的優(yōu)先級，并改進了安全措施。參與完全是自愿的，我們也未要求提供反饋或使用工具。我們很高興能夠為這些藝術(shù)家提供免費訪問的機會，并將繼續(xù)通過贈款、活動及其他項目為他們提供支持。”

以下為OpenAI發(fā)布Sora的官方博客文章全文：

我們的視頻生成模型現(xiàn)已從研究預(yù)覽階段推向市場，并已在sora.com正式上線。

今年早些時候，我們推出了Sora——一款能夠通過文本生成逼真視頻的人工智能模型，同時分享了我們在世界模擬領(lǐng)域的初步研究成果。Sora是開發(fā)能與物理環(huán)境交互的人工智能模型的重要基礎(chǔ)，標志著這一領(lǐng)域邁出了關(guān)鍵一步。

我們?nèi)掳l(fā)布的升級版Sora Turbo，其速度顯著超過了2月份發(fā)布的預(yù)覽版。今天，這款獨立產(chǎn)品已在sora.com上線，并向ChatGPT Plus和Pro用戶開放使用。

全新設(shè)計的Sora界面

我們?yōu)镾ora設(shè)計了一系列新功能，這些功能在此前的技術(shù)報告中已初步提及。

現(xiàn)在，用戶可以生成分辨率高達1080p、時長最長20秒的視頻，并支持寬屏、豎屏和正方形等多種畫幅比例。此外，用戶還可以導(dǎo)入自己的素材，用于擴展、重新混合或融合內(nèi)容，甚至直接從文本生成全新的視頻。

全新的界面設(shè)計讓用戶可以更方便地通過文本、圖像或視頻提示使用Sora。同時，我們的故事板工具允許用戶精確控制每一幀的輸入內(nèi)容。此外，我們還推出了“特色板塊”和“最新動態(tài)”，展示社區(qū)創(chuàng)作者的優(yōu)秀作品并持續(xù)更新。

OpenAI Sora官方使用指南（來源：網(wǎng)易科技報道）

Sora的訂閱服務(wù)與可用性

Sora已納入ChatGPT Plus訂閱中，用戶無需支付額外費用。每月最多可生成50個視頻，分辨率為480p，或更少數(shù)量的720p視頻。

對于更高需求的用戶，ChatGPT Pro訂閱提供10倍的使用額度，同時支持更高的分辨率和更長的視頻時長。此外，我們正在為不同類型用戶開發(fā)個性化的定價方案，預(yù)計將于明年初推出。

技術(shù)部署與限制

目前推出的Sora版本在一些方面仍存在限制。例如，它可能生成不符合現(xiàn)實的物理效果，并在處理復(fù)雜動作時表現(xiàn)不足。盡管Sora Turbo相比2月份的預(yù)覽版速度快了很多，但我們?nèi)栽谂档图夹g(shù)成本，讓更多用戶可以負擔得起并輕松使用。

我們決定在此階段推出視頻生成技術(shù)，是希望社會各界能有時間探索其潛力，并共同制定規(guī)范和安全保障措施，以確保技術(shù)在未來能夠被負責任地應(yīng)用。

所有通過Sora生成的視頻均嵌入了C2PA元數(shù)據(jù)，用于標識內(nèi)容來源并提供透明度。這些元數(shù)據(jù)還可用于驗證視頻的真實性。盡管當前技術(shù)尚不完美，我們已默認添加了多項保護措施，例如可見水印。同時，我們開發(fā)了一個內(nèi)部搜索工具，通過生成內(nèi)容的技術(shù)屬性來輔助驗證其是否源自Sora。

目前，我們已屏蔽了一些嚴重濫用形式，例如兒童性虐待材料和深度偽造內(nèi)容。發(fā)布初期，涉及人物的上傳功能將受到限制，但隨著深度偽造緩解措施的改進，我們計劃逐步向更多用戶開放這一功能。

我們希望這個早期版本的Sora能夠激發(fā)用戶的創(chuàng)造力，讓他們探索新的敘事形式，講述自己的故事，并不斷擴展視頻敘事的可能性。我們期待著見證Sora如何塑造全新的創(chuàng)作世界。

新聞中心

OpenAI正式發(fā)布AI視頻生成工具Sora，Plus用戶每月可生成50條

評論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

OpenAI正式發(fā)布AI視頻生成工具Sora，Plus用戶每月可生成50條

評論

相關(guān)推薦

技術(shù)專區(qū)

OpenAI正式發(fā)布AI視頻生成工具Sora，Plus用戶每月可生成50條