一次性搞懂什么是AIGC — 22個基本概念
新的時代,AIGC(Artificial Intelligence Generative Content,即人工智能生成內(nèi)容)正在重新塑造著內(nèi)容創(chuàng)作生態(tài)。當常識能被機器識別,當藝術(shù)被重新定義,當創(chuàng)意不再需要人工,廣告營銷行業(yè)將迎來一場生產(chǎn)變革巨浪。數(shù)英將持續(xù)聚焦AIGC領(lǐng)域,通過資訊分享、認知科普、方法總結(jié)、深度訪談等,帶領(lǐng)大家多方位了解AIGC。
本文引用地址:http://butianyuan.cn/article/202404/457601.htm以ChatGPT、Midjourney為首的AIGC軟件出現(xiàn)至今,不過短短半年時間,已經(jīng)從方方面面浸入到人們的生活里,與此同時,大量專業(yè)術(shù)語涌入我們視野。
AI、AIGC、AGI、Bing AI,ChatGPT……這些字母縮寫到底是什么?有什么區(qū)別?和廣告營銷有什么關(guān)系?
本文將盡可能用最直白通俗的語言,結(jié)合廣告營銷案例,幫你搞清楚互聯(lián)網(wǎng)上常見的AI術(shù)語。
一、基本概念/理論
1、AI 工作原理
AI,全稱Artificial Intelligence,人工智能。顧名思義,讓機器發(fā)展出像人一樣的智能,可以看到、聽到、思考、判斷,然后根據(jù)經(jīng)驗作出決策。
而AI之所以能夠走向現(xiàn)實生活,影響到多個行業(yè)領(lǐng)域的生產(chǎn)工作,離不開三個重要技術(shù)的支撐:深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)以及生成式對抗網(wǎng)絡(luò)(GAN)。
1)神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)元連接的算法模型。你可以把神經(jīng)網(wǎng)絡(luò)想象成一個大腦。就像大腦由許多神經(jīng)元相互連接構(gòu)成,神經(jīng)網(wǎng)絡(luò)也由許多"節(jié)點"或"神經(jīng)元"通過"鏈接"相互連接。這些鏈接就像我們大腦中的神經(jīng)連接,可以傳遞和處理信息。
2)深度學(xué)習(xí)
如果說神經(jīng)網(wǎng)絡(luò)像一個普通大腦,深度學(xué)習(xí)則是一個更加“聰明”的大腦。在這個“大腦”里,神經(jīng)元被組織成許多層,這就像大腦的不同區(qū)域處理不同的任務(wù)一樣。每一層都在學(xué)習(xí)和處理數(shù)據(jù)的不同特征或部分。這就使得深度學(xué)習(xí)能夠處理非常復(fù)雜的問題,比如識別圖像或理解自然語言。
3)生成式對抗網(wǎng)絡(luò)(GAN)
GAN技術(shù)可以說是推動這次AIGC熱潮的關(guān)鍵技術(shù),有了它,AI才能夠生成逼真的圖像、音頻和文本。
你可以把GAN的工作原理想象成是一個藝術(shù)家和藝術(shù)評論家的競賽。藝術(shù)家(生成器)的工作是創(chuàng)造看起來真實的藝術(shù)作品,而藝術(shù)評論家(判別器)的任務(wù)是判斷這個作品是否真的來自真正的藝術(shù)家,還是來自我們的AI藝術(shù)家。
藝術(shù)家(生成器)開始時可能不太擅長制作逼真的作品,而評論家(判別器)也可能并不擅長識別真?zhèn)巍5?,隨著他們不斷的競爭,藝術(shù)家的作品變得越來越逼真,評論家的判斷能力也越來越強。
在這個不斷生成和對抗的過程中,AI逐漸學(xué)會了如何創(chuàng)作看起來非常真實的作品。
2、AI大模型/預(yù)訓(xùn)練大模型
AI大模型是一種機器學(xué)習(xí)模型。它可以學(xué)習(xí)和處理更多的信息,比如圖像、文字、聲音等,也可以通過訓(xùn)練,完成各種復(fù)雜的任務(wù)。比如智能語音助手和圖像識別軟件都會用到AI大模型。
這里的「預(yù)訓(xùn)練」,可以理解為像學(xué)生學(xué)習(xí)知識一樣,機器也需要通過學(xué)習(xí)和訓(xùn)練來獲取相關(guān)的知識和技能,來完成各種任務(wù)。AI預(yù)訓(xùn)練大模型可以通過不同領(lǐng)域的大量訓(xùn)練,掌握知識和技能。
由OpenAI公司開發(fā)的模型GPT就是一種大型語言模型,也是預(yù)訓(xùn)練模型的一種,它能夠自動生成各類文本,比如新聞報道、小說,也可以回答問題、寫文章、進行對話。GPT是目前自然語言處理領(lǐng)域最為先進的自然語言生成模型之一。
3、開源
開源可以被理解為分享和合作的一種方式。在計算機編程中,當一個項目是開源的,意味著它的源代碼是公開的,任何人都可以查看,修改和分享。
想象你正在做一份蛋糕,如果你將蛋糕的配方公開,讓所有人都可以制作這個蛋糕,甚至可以根據(jù)自己的口味對配方進行修改和優(yōu)化,那么這個蛋糕的配方就可以被認為是"開源"的。
4、自然語言處理(NLP)
自然語言處理(NLP)就像是教計算機理解和使用人類語言的一種技術(shù)。舉個例子,當你對手機說:“打開天氣應(yīng)用,查看明天的天氣?!边@就涉及到了自然語言處理。你的手機需要理解你的指令——這是什么意思,你想做什么,然后才能執(zhí)行正確的動作。
自然語言處理需要用到很多開源的工具和軟件,它們能夠幫助研究員處理語言數(shù)據(jù),大大降低開發(fā)的門檻,讓自然語言處理技術(shù)的進步的速度變快。
5、AIGC
是指由AI自動創(chuàng)作生成的內(nèi)容( AI Generated Content),即AI接收到人下達的任務(wù)指令,通過處理人的自然語言,自動生成圖片、視頻、音頻等。
打個通俗點的比方,AIGC就像一支馬良神筆,擁有的無盡創(chuàng)造力。這支筆的特別之處在于,是由AI打造的。來自AI的理解力、想象力和創(chuàng)作力的加持,它可以根據(jù)指定的需求和樣式,創(chuàng)作出各種內(nèi)容:文章、短篇小說、報告、音樂、圖像,甚至是視頻。AIGC的出現(xiàn),就像是打開了一個全新的創(chuàng)作世界,為人們提供了無盡的可能性。從用戶生成內(nèi)容(UGC),到專業(yè)生成內(nèi)容(PGC),再到現(xiàn)在的人工智能生成內(nèi)容(AIGC),我們看到了內(nèi)容創(chuàng)作方式的巨大變革和進步。
6、AIGC和Chat GPT的關(guān)系
AIGC是AI大模型,特別是自然語言處理模型的一種重要應(yīng)用;ChatGPT則是AIGC在聊天對話場景的一個具體應(yīng)用。
可以把AIGC看作是一個大的范疇,而ChatGPT是其中一個類別的小應(yīng)用。
7、AIGC可以生成的內(nèi)容
AIGC可以生成的內(nèi)容很多,具體的種類和范圍可能隨著技術(shù)的發(fā)展而不斷擴大。目前,一些常見的AIGC內(nèi)容包括:
文字:最基本的AIGC內(nèi)容,可以與人類進行實時對話,生成不同風(fēng)格的文字,詩歌、故事,甚至計算機代碼等。
圖像:可以由文字或者圖片,直接生成各種類型的圖片。可以輔助人類進行繪畫設(shè)計和發(fā)散想象力,大致可以分為圖像自主生成工具和圖像編輯工具兩類。
視頻:可以通過文字描述,生成一段情節(jié)連貫的視頻。比如廣告片、電影預(yù)告片、教學(xué)視頻、音樂視頻等。也可以當作視頻的剪輯工具。
音頻:可以生成逼真的音效,包括語音克隆、語音合成、文本生成特定音,音樂生成、聲音效果等。
游戲:游戲的劇情設(shè)計、角色設(shè)計、配音和音樂、美術(shù)原畫設(shè)計、游戲動畫、3D模型、地圖編輯器等都可以讓AIGC幫助完成。
虛擬人:可以生成虛擬明星、虛擬戀人、虛擬助手、虛擬朋友等。指存在于非物理世界(如圖片、視頻、直播、一體服務(wù)機、VR)中,并具有多重人類特征的綜合產(chǎn)物。
二、常見的AIGC應(yīng)用
(一)常用軟件
8、ChatGPT
ChatGPT是由OpenAI開發(fā)的一款大型預(yù)訓(xùn)練語言模型,就像一個會聊天的機器人。
它可以理解你說的話,并給出回答。這個機器人在互聯(lián)網(wǎng)上讀了很多書、文章,學(xué)到了很多知識,所以可以回答各種問題,甚至進行深入的討論。不過,ChatGPT的理解與人類不同,人類理解事物時,有意識、經(jīng)驗和情感等多個層次的參與,而ChatGPT只是通過分析和模擬大量的文本數(shù)據(jù)來"學(xué)習(xí)"如何合理地回應(yīng)。
9、Midjourney
Midjourney是由美國舊金山的一家獨立研究實驗室創(chuàng)立的圖片類AIGC應(yīng)用程序,我們可以通過語言描述來生成圖片。比如,輸入一個蘋果,它就會為你生成出一張?zhí)O果的圖片。
10、Stable Diffusion
圖片生成類AI大模型,可以在給定的任何提示詞下生成圖像,并支持根據(jù)關(guān)鍵詞和圖片檢索。與Midjourney相比,生成圖像的結(jié)果更可控。
11、Bing AI
Bing AI就是搭載了GPT-4的Bing瀏覽器,它能夠更好地理解用戶意圖,提供更加智能化、個性化的搜索和服務(wù)體驗。
12、文心一言
文心一言是百度全新一代知識增強大語言模型,能夠與人對話互動、回答問題、協(xié)助創(chuàng)作,具備更強的中文理解能力。
13、文心一格
文心一格是百度基于文心大模型的文生圖系統(tǒng),搭建的圖片生成類AI大模型,可以根據(jù)用戶輸入的指令提示,生成相應(yīng)的圖片。
(二)AIGC在廣告營銷中的運用
隨著AIGC的浪潮在現(xiàn)實中涌動,多個行業(yè)迎來了自我更迭的新機遇,廣告行業(yè)也開始擁抱AIGC。我們可以從文本應(yīng)用、圖片應(yīng)用、視頻應(yīng)用、市場分析的四個層面,探尋與AI共事的進擊之路。
14、文本應(yīng)用
當ChatGPT走進大眾視野時,我們看到不少人感嘆它強大的表達能力和迅猛的反應(yīng)能力,無論向它拋出什么樣的問題,它都能對答如流,甚至對于同一命題,也能給出許多不同的答案。這樣蓬勃的新力量,正被更多品牌看見。
今年4月,戶外運動品牌The North Face以重回山野為主題,對ChatGPT進行了發(fā)問,令人驚喜的是,ChatGPT給予了10000個答案。
15、圖片應(yīng)用
AIGC的出現(xiàn),不僅提速人們在繪圖工作中的效率,更解鎖了繪畫創(chuàng)作的更多可能性,帶來一些在藝術(shù)審美上的靈感。不得不說,AI的想象力、審美力和創(chuàng)作力,已然被更多人所見。今年4月,飛豬旅行就使用了AI技術(shù)生成了一組世界風(fēng)景圖,并將畫面投放至地鐵廣告里,來往的人都能一睹AI眼里的世界。
飛豬旅行《玩得比想象更酷》:用AI生成的世界風(fēng)景圖
16、視頻應(yīng)用
以往,制作廣告的工作流是貫穿線上線下,線上對接腳本,線下注重執(zhí)行,尤其是現(xiàn)場拍攝,一些不可抗力的因素會影響到計劃進度。
如今,隨著AIGC的橫空出世,內(nèi)容生產(chǎn)的工作流正發(fā)生著不小的改變,創(chuàng)作者可以選擇純在線上完成廣告任務(wù)。即向AI發(fā)生任務(wù)指令,再通過線上的一些調(diào)試,便能形成一支廣告片。就在最近,飛書發(fā)布了一支廣告片《探》,便是純由AI完成的。
17、其他營銷應(yīng)用
AI不僅僅能夠提供創(chuàng)意內(nèi)容,還能幫助品牌與商家優(yōu)化媒介投放和客戶管理系統(tǒng)。事實上,國內(nèi)許多To B企業(yè)早就應(yīng)用了AI技術(shù),輔助客戶優(yōu)化營銷效果。
比如,阿里媽媽發(fā)布的序列化智能投放技術(shù),就是借助AI技術(shù)幫助商家實現(xiàn)合理投放;巨量引擎則使用了與GPT相同的transformer技術(shù),幫助客戶高效提升ROI。
三、AI的未來,機遇和挑戰(zhàn)共生
18、多模態(tài)AI
在許多專家領(lǐng)袖對于AI的預(yù)言中,多模態(tài)AI是一個高頻關(guān)鍵詞。
多模態(tài)AI,即能夠處理和理解多種類型數(shù)據(jù)(例如圖像、文本、音頻等)的人工智能。目前的AI技術(shù)大多只能處理文字數(shù)據(jù),而多模態(tài)能夠理解更多類型的信息。
比如,你在看一部沒有字幕的外語電影,而你并不懂這種語言。如果有一個多模態(tài)AI,它可以同時理解電影中的視覺和聽覺信息,然后把這些信息轉(zhuǎn)化為你能理解的語言,為你提供實時的字幕。這就是多模態(tài)AI的應(yīng)用場景之一,它可以處理并理解多種類型的信息,以幫助我們更好地獲取和理解信息。
19、AGI
Artificial General Intelligence,即“人工通用智能”,這是另一個與AI未來相關(guān)的高頻詞匯。
它指AI能夠在所有領(lǐng)域中,像人類一樣學(xué)習(xí)各種知識,完成各種任務(wù)。AGI是人工智能的一種理想狀態(tài),也可以說是AI研究的終極目標,即讓機器擁有與人類等同的智能。
現(xiàn)在的AI技術(shù),雖然在特定任務(wù)上表現(xiàn)出超越人類的能力(如圍棋、圖像識別等),但它們?nèi)匀恢皇恰罢盇I,僅限于特定任務(wù)。雖然研究者們對實現(xiàn)AGI的未來充滿了希望,但這是否能在未來的某個時刻實現(xiàn),以及何時能夠?qū)崿F(xiàn),現(xiàn)在還不得而知。
四、AI領(lǐng)域新興職業(yè)
20、提示詞工程師
提示詞工程師像是AI模型的導(dǎo)演,負責(zé)設(shè)計和優(yōu)化指導(dǎo)AI行動的語言提示。
他們了解AI模型的工作原理,并使用這些知識來優(yōu)化語言提示,從而引導(dǎo)AI模型產(chǎn)生更好的結(jié)果。他們的工作可以涵蓋多種任務(wù),比如提升AI對問題的理解,優(yōu)化AI的回答,甚至引導(dǎo)AI生成全新的內(nèi)容。這項工作更偏向語言藝術(shù)和人工智能的交叉領(lǐng)域。
21、提示詞藝術(shù)家
提示詞藝術(shù)家是AI的藝術(shù)合作者,用創(chuàng)意和技巧指引AI創(chuàng)建出吸引人的藝術(shù)作品。
他們可能會使用像Midjourney這樣的圖片生成模型,通過提供特定的提示詞或語句,來生成新奇和獨特的文本或圖像內(nèi)容。他們需要有深厚的藝術(shù)素養(yǎng),同時也需要對AI模型的工作原理有一定的理解,以便能夠精確地指導(dǎo)模型產(chǎn)生預(yù)期的藝術(shù)作品。
22、人工智能訓(xùn)練師
人工智能訓(xùn)練師就像是AI模型的教師,他們主要關(guān)注如何訓(xùn)練和優(yōu)化AI模型。
他們?yōu)锳I模型提供訓(xùn)練數(shù)據(jù),監(jiān)督學(xué)習(xí)過程,并調(diào)整模型參數(shù)以改善其性能。這些工作主要涉及到機器學(xué)習(xí)和深度學(xué)習(xí)的知識,需要對AI技術(shù)有深入的理解。
評論