被ChatGPT帶飛的AIGC,能為垂直產(chǎn)業(yè)做些什么?
本文從 AIGC 技術(shù) -> 產(chǎn)品 -> 業(yè)務(wù)應(yīng)用和價(jià)值實(shí)現(xiàn)環(huán)節(jié)探討其發(fā)展路徑,并以產(chǎn)業(yè)實(shí)例探討 AIGC 如何才能在產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)閉環(huán)和價(jià)值落地。
紅杉資本針對 AIGC 相關(guān)產(chǎn)品成熟預(yù)測
若考慮到 AIGC 產(chǎn)業(yè)應(yīng)用,如在制造業(yè)、建筑業(yè)等巨型垂直實(shí)體領(lǐng)域中,AIGC 的 C/Content 內(nèi)容將不能僅停留在圖片和文字的領(lǐng)域,而是需要進(jìn)入信息更為豐富的三維領(lǐng)域。接下來,我們將從 AIGC 技術(shù) -> 產(chǎn)品 -> 業(yè)務(wù)應(yīng)用和價(jià)值實(shí)現(xiàn)環(huán)節(jié)探討其發(fā)展路徑,并以產(chǎn)業(yè)實(shí)例探討 AIGC 如何才能在產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)閉環(huán)和價(jià)值落地。
1.AIGC 技術(shù):從文字到圖片
從大家對 ChatGPT 越來越多的測試中可以看到,ChatGPT 不僅能對語義進(jìn)行解析和結(jié)構(gòu)化,還能在此基礎(chǔ)上用 NLP 自然語言處理做數(shù)據(jù)分析。
ChatGPT 對內(nèi)容進(jìn)行結(jié)構(gòu)化處理和數(shù)據(jù)分析 - 佳格數(shù)據(jù)提供
事實(shí)上,以 Stable Diffusion 為首的一眾 AI 畫圖框架或者平臺(tái),在去年更早的時(shí)候已經(jīng)引起了轟動(dòng)。雖然圖片相對文字來說看上去信息含量要更為復(fù)雜,但是其技術(shù)成熟卻要比以 GPT 為首的文字生成來的更早一些,我們有必要從主流的開源框架 Stable Diffusion 為例,回顧一下這些圖片 AIGC 框架是如何工作的。
Stable Diffusion 生成的圖片, 已經(jīng)有了比擬人類畫家的能力
Stable Diffusion 主要有三個(gè)組成部分,每一個(gè)部分都有自己的神經(jīng)網(wǎng)絡(luò)。
1、CLIP 用于文字編碼器:以文字作為輸出的語義信息組成一個(gè) 77*768 的矩陣,CLIP 訓(xùn)練 AI 同時(shí)進(jìn)行自然語言理解和計(jì)算機(jī)視覺分析。CLIP 可以決定圖像和文字提示的對應(yīng)程度,比如逐步把建筑的圖像和 “建筑” 這個(gè)詞完全匹配起來,而其能力訓(xùn)練是通過全球 40 多億張帶文字描述的圖片實(shí)現(xiàn)的。
CLIP 的訓(xùn)練集
2、UNET 及調(diào)度程序:這就是大名鼎鼎的擴(kuò)散模型主程序(來自 CompVis 和 Runway 團(tuán)隊(duì)于 2021 年 12 月提出的 “潛在擴(kuò)散模型”(LDM / Latent Diffusion Model)),用于對噪聲進(jìn)行預(yù)測實(shí)現(xiàn)反向去噪的過程,進(jìn)而實(shí)現(xiàn)圖片在信息空間中的生成。如圖片所示,染料擴(kuò)散的過程就像從圖片逐漸變成噪點(diǎn)的過程,而當(dāng)研究人員對圖片增加隨機(jī)噪點(diǎn)讓 AI 反向?qū)W習(xí)整體過程,而后就擁有了一套從信息空間噪點(diǎn)圖反向生成圖片的模型。
Diffusion 模型反向去噪過程
用通俗的例子解釋,如果在清水里隨機(jī)滴入一些染料,隨著時(shí)間推移會(huì)得到如下圖一樣絢麗的形狀。那么有沒有一種方法,能夠根據(jù)某一個(gè)特定時(shí)間特定的狀態(tài),反向推出初始的染料用量、順序、滴入水缸的初始狀態(tài)等信息呢?顯然,如果不借用 AI 的方式幾乎無法實(shí)現(xiàn)。
不同的染料滴入水中擴(kuò)散出不同的形狀
3、信息空間到真實(shí)圖片空間的****:即把信息空間中的矩陣信息轉(zhuǎn)換為肉眼可見的 RGB 圖片。想象一下我們與人交流的過程,聽到的聲音信號(hào)轉(zhuǎn)換為大腦能理解的文字信號(hào)存儲(chǔ)在腦中,這個(gè)過程稱之為編碼。如果嘗試把文字信號(hào)通過某種語言表達(dá)出來,這個(gè)過程可以稱為解碼 —— 這里的表達(dá)方式可以是任意的語言,每種語言對應(yīng)不同的****,解碼只是一種表達(dá)方式,本質(zhì)還是基于人類腦海中對于某件事情的描述與理解。
StableDiffusion 從輸入到輸出全流程解讀
正是有了這幾個(gè)關(guān)鍵技術(shù)步驟的串聯(lián),Stable Diffusion 成功創(chuàng)建了一個(gè)無所不能的 AI 作圖機(jī)器人,不僅能理解語義,將其轉(zhuǎn)化為信息空間的信息流,還能夠在信息空間中通過模擬降噪創(chuàng)作,通過****還原成肉眼可見的圖片,這一充滿科幻色彩的過程放在 AI 不存在的世界來看,堪稱神跡。
2.AIGC 技術(shù):從圖片到 3D 模型
圖片生成已經(jīng)取得了突破性的效果,但如果這些成果能夠進(jìn)一步優(yōu)化應(yīng)用到更多領(lǐng)域,將有可能實(shí)現(xiàn)更大價(jià)值。我們也看到一些細(xì)分領(lǐng)域中的探索成果,比如經(jīng)由對場景的理解,通過不同的數(shù)據(jù)集加入和調(diào)參,可以實(shí)現(xiàn)對圖片生成更好的控制,而不僅是通過文字的不斷試錯(cuò)來獲得更優(yōu)結(jié)果。
2.1 設(shè)計(jì)意向圖生成
2019 年初,用 GANs 生成的「這個(gè) XX 不存在」系列在海外獲得大量關(guān)注,在國內(nèi)我們也看到企業(yè)推出了在細(xì)分領(lǐng)域的成果。而該團(tuán)隊(duì)也于 22 年 8 月實(shí)驗(yàn)性的在手機(jī)端推出了「AI 創(chuàng)意庫」,只需要輸入一句話,對話機(jī)器人就能在一分鐘內(nèi)快速理解語義,生成多張效果細(xì)膩貼近建筑概念方案的意向圖。在此之上,更是可以通過輸入一張已有的圖片,修改部分描述的關(guān)鍵字,「AI 創(chuàng)意庫」即可生成一系列的衍生圖片,輔助設(shè)計(jì)師在日常創(chuàng)作中尋找靈感。
小庫科技「這個(gè)建筑不存在」,GANs 模型生成建筑意象圖及迭代過程
左圖:小庫「AI 創(chuàng)意庫」生成,觸發(fā)語句 Louis Kahn 風(fēng)格,依山傍水的小型博物館;右圖:小庫「AI 創(chuàng)意庫」生成,基于左圖 Louis Kahn 風(fēng)格圖片,完成風(fēng)格切換至 Le Corbusier
為了使得「AI 創(chuàng)意庫」的效果更優(yōu),團(tuán)隊(duì)做了一些新的探索:由于已有的算法和模型更多聚集在通用互聯(lián)網(wǎng)素材上,建筑相關(guān)的圖片、形容及風(fēng)格的數(shù)據(jù)儲(chǔ)備在專業(yè)程度顯然是不夠的。這里采取了一種針對建筑相關(guān)詞匯的特殊標(biāo)識(shí),組成一個(gè)微調(diào)的先驗(yàn)數(shù)據(jù)集并將該數(shù)據(jù)集融合訓(xùn)練,實(shí)現(xiàn)模型增強(qiáng)。通過建筑專業(yè)領(lǐng)域增強(qiáng)的新模型,形成了面向建筑行業(yè)專屬的 AI 創(chuàng)意庫,針對建筑類描述短句,測試集優(yōu)品率相比原有模型提升了 13.6% 之多。
Google Dreambooth Fine-Tuning 算法示意
舉個(gè)例子,當(dāng)輸入一張博物館圖片及一個(gè)詞匯 "Zaha Hadid(過世的全球著名女建筑師)" 的時(shí)候,模型能夠理解需要將博物館的建筑風(fēng)格或特征往 Zaha Hadid 的作品靠攏,而不是在博物館中增加一個(gè) Zaha Hadid 的人物或畫像,抑或是在 AI 世界里創(chuàng)作一個(gè) Zaha Hadid 的卡通畫像 —— 這往往是通用模型會(huì)返回的結(jié)果之一。
經(jīng)過微調(diào)后的建筑模型,小庫「AI 創(chuàng)意庫」能充分理解 “Zaha Hadid” 這個(gè)特殊詞匯隱含意思
2.2 3D 模型生成
二維的圖片雖然精彩,但在產(chǎn)業(yè)應(yīng)用中暫時(shí)還只是停留在 “意向圖庫” 的作用,未來如果要成為可以精準(zhǔn)表達(dá)設(shè)計(jì)的成果,需要向 3D 和更高信息維度去邁進(jìn)。
在 2020 年 AIGC 沒有現(xiàn)在這么成熟的時(shí)候,上述團(tuán)隊(duì)就在探索如何用 AI 生成 3D 模型,并在同濟(jì)大學(xué) DigitalFUTURES 工作坊教學(xué)中,公開了其在研發(fā)中的從圖形生成圖像進(jìn)一步生成模型的算法,能看到當(dāng)時(shí)的模型效果并不太理想,有價(jià)值的是實(shí)現(xiàn)了圖形 - 圖像 - 模型的聯(lián)動(dòng)。
2020 同濟(jì)大學(xué) DigitalFUTURES 工作坊小庫教學(xué)團(tuán)隊(duì)成果,手繪圖形生成圖像進(jìn)而生成模型
第二年在同濟(jì)大學(xué) DigitalFUTURES 工作坊教學(xué)中,該團(tuán)隊(duì)發(fā)布了一種通過 GANs 學(xué)習(xí)衛(wèi)星圖與真實(shí)三維模型之間關(guān)系,將衛(wèi)星圖生成為真實(shí)三維模型的算法。該算法通過對衛(wèi)星圖上不同的圖層元素進(jìn)行特征學(xué)習(xí),能大致復(fù)原出衛(wèi)星圖所對應(yīng)的主要物體三維拉伸形體,預(yù)測不同物體投影所對應(yīng)的原物體高度。當(dāng)然,這種方法還存在一定的缺陷,只能在衛(wèi)星圖場景中使用,難以積累其他場景中同類圖片與三維形體之間的關(guān)系;其次是還原的三維形體只能粗略預(yù)測高度,其他細(xì)節(jié)需要通過算法重新生成,與真實(shí)的三維模型存在較大誤差,只能用于項(xiàng)目早期研判使用,應(yīng)用場景有限。
城市三維模型分層特征提取訓(xùn)練示意圖
2021 同濟(jì)大學(xué) DigitalFUTURES 工作坊小庫教學(xué)團(tuán)隊(duì)成果,基于 GANS 的衛(wèi)星圖重建三維模型
得益于 AIGC 算法的爆發(fā)、3D 生成算法的日益成熟,我們也看到垂直類 AI 企業(yè)開始吸收更多先進(jìn)的技術(shù)與思路改善其模型,并在 3D-AIGC 的路線上有了一些新的嘗試方向。例如 OPENAI 推出了 Point-E 框架,該框架可以將任意二維圖片通過算法預(yù)測為點(diǎn)云,進(jìn)而通過點(diǎn)云去預(yù)測三維物件。
PointE 框架全過程示意圖
但是模型生成的質(zhì)量依然有一定的局限,而模型的不可用主要體現(xiàn)在以下三個(gè)方面:
1. 三維形體還原難:首先二維圖像數(shù)據(jù)比三維模型數(shù)據(jù)出現(xiàn)早,同時(shí)可獲取的二維圖像數(shù)據(jù)目前也比后者多,因此前者可作為訓(xùn)練素材的量級(jí)更多,較少的三維模型訓(xùn)練素材的泛化能力有限,難以還原最初的三維形體;
2. 材質(zhì)整體缺失:對于三維模型來說最重要的一環(huán)是材質(zhì)的填充與選擇,然而對于AI生成來說,從圖片直接推敲其材質(zhì)的方法尚未成熟,同樣材質(zhì)在不同的形狀、環(huán)境、光源下的表現(xiàn)都有所不同,而當(dāng)這些變量都集中在一張圖片中時(shí),材質(zhì)重建幾乎不可能實(shí)現(xiàn);
3. 生成的模型精度不達(dá)標(biāo):通過點(diǎn)云推敲的模型,通常是依賴于點(diǎn)云的密度重建物體表面 Mesh,如果點(diǎn)云過少物體會(huì)嚴(yán)重失真,甚至無法重建模型。
小庫團(tuán)隊(duì)測試 Point- E 模型,左邊建筑圖片生成點(diǎn)云進(jìn)而模擬出右邊三維模型,遺憾得到的只是一堆無意義的點(diǎn)云模型,Point-E 暫時(shí)還無法理解一個(gè)建筑物的圖片
當(dāng)然我們能理解當(dāng)前的技術(shù)瓶頸,如果把目標(biāo)定的稍微低一點(diǎn),選擇從三維建模軟件中生成的簡單形體、做二維的截圖在 point-e 模型中重建,會(huì)意外地發(fā)現(xiàn)其效果比以上測試更佳,但也仍局限在 “初步草稿” 的范疇。這與訓(xùn)練集有很大的關(guān)聯(lián)性,通過三維建模軟件生成各個(gè)視角的二維視圖是該模型最易獲取訓(xùn)練數(shù)據(jù)的方法之一。
小庫團(tuán)隊(duì)測試 Point-E 模型,針對建模軟件中選取一個(gè)簡單三維模型做任意角度截圖,重建三維模型,往往有還不錯(cuò)的效果
綜上來看,從文字 -> 圖片 -> 點(diǎn)云 -> 三維物體的技術(shù)路線固然令人驚嘆,但如果要應(yīng)用在產(chǎn)業(yè)領(lǐng)域,還有很多工作需要 AI 科學(xué)家們?nèi)プ觥?/span>
然而,是否只有這一條技術(shù)路線去實(shí)現(xiàn)三維模型的生成?
3 垂直領(lǐng)域 AIGC 應(yīng)用新思路
在泛領(lǐng)域的大模型研發(fā)上以 OpenAI 為首的廠商,包括 Nvidia 和 Google 等巨頭也在紛紛推出屬于自己自己的通用型 3D-AIGC 框架,遺憾的是目前還處在一個(gè)早期階段。對于垂直實(shí)體產(chǎn)業(yè)來說,落地應(yīng)用顯然還有很長的路要走。
從全球范圍來看,在 3D 模型的生成領(lǐng)域除了泛領(lǐng)域大模型外,部分垂直產(chǎn)業(yè)也在探索 AIGC 如何應(yīng)用落地。比如西門子在引擎的設(shè)計(jì)和制造中針對生成的模型進(jìn)行方針模擬和進(jìn)一步優(yōu)化,最終通過3D打印實(shí)體,實(shí)現(xiàn)了3D模型生成現(xiàn)成果交付和業(yè)務(wù)閉環(huán)。
西門子通過生成式算法實(shí)現(xiàn)引擎的設(shè)計(jì)和模擬
這樣的成果的實(shí)現(xiàn),有賴于在產(chǎn)業(yè)邏輯下的底層業(yè)務(wù)內(nèi)容及其數(shù)據(jù)標(biāo)準(zhǔn)的不斷迭代。
按照 ISO/ IEC 給出對內(nèi)容的數(shù)字標(biāo)準(zhǔn)定義 SMART(Standards Machine Applicable, Readable and Transferable 機(jī)器可開、可讀和可交互標(biāo)準(zhǔn)):L1 級(jí)為紙質(zhì)文本,沒有機(jī)器交互可能;L2 級(jí)為開放數(shù)字格式,機(jī)器交互性很低;L3 級(jí)為機(jī)器可讀文檔,但機(jī)器無法理解檢索的結(jié)果與內(nèi)容;L4 級(jí)為機(jī)器可讀內(nèi)容,可做語義交互但機(jī)器無法理解上下文的邏輯關(guān)系;L5 級(jí),機(jī)器可交互內(nèi)容,可實(shí)現(xiàn)自動(dòng)識(shí)別、自動(dòng)生成等智能屬性。
在產(chǎn)業(yè)領(lǐng)域中,目前廣泛應(yīng)用 L3 級(jí)信息化內(nèi)容,正在發(fā)展 L4 級(jí)數(shù)字化內(nèi)容,而 L5 級(jí)智能化是工業(yè) 4.0 和智能制造的核心基礎(chǔ)。因此,生成 L4 級(jí)以上機(jī)器可讀內(nèi)容,特別是生成 L5 級(jí)智能化內(nèi)容,是未來 AIGC 的方向。
ISO/IEC SMART 數(shù)字標(biāo)準(zhǔn)《中國工程科學(xué)》2021 年第 23 卷第 6 期《標(biāo)準(zhǔn)數(shù)字化發(fā)展現(xiàn)狀及趨勢研究》劉曦澤、王益誼、杜曉燕、李佳、車迪
海外已經(jīng)在 AIGC 的產(chǎn)業(yè)應(yīng)用領(lǐng)域中開始了實(shí)踐,而國內(nèi)的探索仍然比較稀缺,但我們也發(fā)現(xiàn)了一些在垂直領(lǐng)域深耕的企業(yè)。比如上述提到的,在建筑產(chǎn)業(yè)深耕的小庫科技團(tuán)隊(duì)。我們將以其實(shí)踐的建筑產(chǎn)業(yè)為例,探討 AIGC 在垂直產(chǎn)業(yè)中的落地路徑。
當(dāng)前國內(nèi)實(shí)體經(jīng)濟(jì)處于轉(zhuǎn)型的窗口期,國家層面提出 “人工智能與實(shí)體經(jīng)濟(jì)融合 “的重要任務(wù),各大產(chǎn)業(yè)迫切希望 AI 技術(shù)能夠真正落地,協(xié)助產(chǎn)業(yè)實(shí)現(xiàn)數(shù)字化與智能化的升級(jí)躍遷,而不是一個(gè)停留在概念的 DEMO 產(chǎn)品,或者茶余飯后討論的好玩趣物。
建筑產(chǎn)業(yè)是接近 30 萬億每年的國家支柱型產(chǎn)業(yè),但是其數(shù)字化水平在全國各行業(yè)中排名倒數(shù)第一。當(dāng)前國家提出智能建造方針,希望邁上 “中國建造” 的新臺(tái)階。智能建造是以新型建筑工業(yè)化(工業(yè)化 / 裝配式、數(shù)字化、智能化)為基礎(chǔ),基于新一代信息技術(shù)與先進(jìn)建造技術(shù)深度融合,貫穿于設(shè)計(jì)、生產(chǎn)、施工、運(yùn)維、監(jiān)管等建設(shè)活動(dòng)各個(gè)環(huán)節(jié),具有自感知、自決策、自執(zhí)行、自適應(yīng)、自學(xué)習(xí)等特征,旨在優(yōu)化建筑產(chǎn)業(yè)全生命周期質(zhì)量、效益和核心競爭力的先進(jìn)建造方式。
2011-2021 年中國建筑業(yè)總產(chǎn)值及增長情況 - 國家統(tǒng)計(jì)局 - 前瞻產(chǎn)業(yè)研究院,
資科來源:Gartner;Kable;經(jīng)合組織;中央統(tǒng)計(jì)局;彭博社;麥肯錫全球研究院分析
而在建筑產(chǎn)業(yè),底層數(shù)據(jù)標(biāo)準(zhǔn)正從機(jī)器可讀文檔 L3 級(jí)的 CAD 時(shí)代,向機(jī)器可讀內(nèi)容的 L4 級(jí) BIM 時(shí)代邁進(jìn)。建筑產(chǎn)業(yè)中對 3D 模型的要求是內(nèi)容對象具備三維空間中的全維度精確信息,包括模型、數(shù)據(jù)等維度,如果還能包含規(guī)則維度,進(jìn)而便可使其具備自感知、自學(xué)習(xí)、自迭代等智能化的能力。目前,L3 級(jí)的 CAD 和 L4 級(jí)的 BIM 應(yīng)用軟件已經(jīng)被海外壟斷,我們發(fā)展的空間和潛力必然集中在了可以高維覆蓋低維的 L5 級(jí)上。
數(shù)字標(biāo)準(zhǔn) SMART 在建筑領(lǐng)域的內(nèi)容格式示意
基于對建筑產(chǎn)業(yè)數(shù)字化變革的洞察,小庫團(tuán)隊(duì)意識(shí)到必須對整個(gè)產(chǎn)業(yè)的數(shù)據(jù)底層進(jìn)行再定義。從 2016 年成立起便致力于 L5 級(jí) 3D 模型 AIGC 的底層技術(shù)研發(fā)及其在建筑產(chǎn)業(yè)中的應(yīng)用?;谝惶缀袠I(yè)務(wù)流邏輯的 AI 系統(tǒng)生成包含建筑信息與多維數(shù)據(jù)、3D 模型、以及規(guī)則 / 規(guī)范 / 規(guī)律的 “數(shù) - 模 - 規(guī)” 可聯(lián)動(dòng)的內(nèi)容,實(shí)現(xiàn)建筑設(shè)計(jì)方案的智能生成。
這樣的底層數(shù)據(jù),團(tuán)隊(duì)將其稱為 AI driven Building Information Model on Cloud 人工智能生成的云端建筑信息模型(簡稱 ABC),并將智能生成的達(dá)成歸結(jié)為四個(gè)實(shí)踐步驟:AI 識(shí)別現(xiàn)有內(nèi)容用于訓(xùn)練或結(jié)構(gòu)化數(shù)據(jù)重建,對數(shù)據(jù)進(jìn)行評(píng)估和模擬仿真,通過對初步數(shù)據(jù)成果進(jìn)行優(yōu)化,最終生成由系列的 AI 模型組建的業(yè)務(wù)成果。
L5 級(jí)建筑智能格式 ABC 智能云模示意
AI 識(shí)別領(lǐng)域,團(tuán)隊(duì)通過對千萬級(jí)的不同業(yè)務(wù)類型 CAD 圖紙數(shù)據(jù)的清洗和訓(xùn)練,獲得了對 L3 級(jí)無語義 CAD 圖紙的 100% 云端還原與 99.8%* 的準(zhǔn)確語義解析和補(bǔ)充,在該領(lǐng)域達(dá)到世界先進(jìn)水平。這項(xiàng)成果已經(jīng)深度應(yīng)用到企業(yè)的多個(gè)產(chǎn)品與解決方案中,比如針對施工圖審查的「智能審圖」中條文審查準(zhǔn)確率約為 96%。
小庫施工圖構(gòu)件與空間識(shí)別
AI 分析領(lǐng)域,基于對項(xiàng)目的有效識(shí)別,針對住宅、商場等常用民用建筑類型,使得團(tuán)隊(duì)能夠進(jìn)行物理環(huán)境仿真分析、人類行為數(shù)據(jù)模擬與預(yù)測、項(xiàng)目相關(guān)大數(shù)據(jù)的分析和模擬。在應(yīng)用層面上,可以協(xié)助客戶進(jìn)行項(xiàng)目方案量化分析,比如通過對房企全線住宅產(chǎn)品的評(píng)估可以得到不同價(jià)值評(píng)估系數(shù),協(xié)助房企提升產(chǎn)品質(zhì)量。因此,小庫科技也被選為中房協(xié)戶型設(shè)計(jì)大賽首個(gè) AI 評(píng)委。這項(xiàng)能力也被應(yīng)用于香港和國內(nèi)十余個(gè)商場建筑的開發(fā)與運(yùn)營中。
小庫「產(chǎn)品力價(jià)值評(píng)估」
AI 優(yōu)化領(lǐng)域,團(tuán)隊(duì)認(rèn)為 “優(yōu)化” 是基于前序 “識(shí)別” 和 “分析 “后的進(jìn)一步尋優(yōu)迭代,即基于已有內(nèi)容的重新生成更優(yōu)的成果。這類技術(shù)已在公司具體的產(chǎn)品和解決方案中得到應(yīng)用。比如在設(shè)計(jì)云 2022 版 “智能日照優(yōu)化” 功能中,小庫可以將未通過日照的方案進(jìn)行自動(dòng)微調(diào),使其能夠在原有格局不進(jìn)行巨大調(diào)整的前提下通過日照驗(yàn)證。這項(xiàng)能力也用在了建筑方案的設(shè)計(jì)深化中,比如幕墻設(shè)計(jì)優(yōu)化場景。在與四川省商業(yè)設(shè)計(jì)院合作的四川某博物館幕墻項(xiàng)目中,小庫算法將原有 3 萬多種不規(guī)則三角形幕墻板優(yōu)化為 12 種標(biāo)準(zhǔn)模塊,比現(xiàn)有世界水平能降低到的 116 種還減少了 90%,建筑幕墻成本將因?yàn)?SKU 和開模數(shù)量的降低而得到大幅度降低。
小庫「幕墻優(yōu)化 AI 算法」
AI 生成領(lǐng)域,是智能設(shè)計(jì)最為核心的部分。對建筑業(yè)而言,選擇經(jīng)濟(jì)適用美觀的設(shè)計(jì)方案、交付安全高效高質(zhì)量的建造成果,需要多專業(yè)、多角色統(tǒng)籌協(xié)同完成。不僅需要從宏觀尺度、到中觀尺度再到微觀尺度逐個(gè)攻破,還需要在建筑、結(jié)構(gòu)、機(jī)電、水暖、景觀等多專業(yè)逐步覆蓋,更需要涵蓋住宅、公寓、產(chǎn)業(yè)、辦公、商業(yè)等各種業(yè)態(tài)類型。因此垂直領(lǐng)域的專業(yè)成果生成絕不是某一個(gè)模型算法一套數(shù)據(jù)可以解決的,它需要多模型、多模態(tài)、多數(shù)據(jù)集等多項(xiàng)技術(shù)與業(yè)務(wù)邏輯有機(jī)融合,通過契合細(xì)分場景的產(chǎn)品設(shè)計(jì)和基于用戶反饋的持續(xù)迭代,才能最終實(shí)現(xiàn)。
小庫團(tuán)隊(duì)從業(yè)務(wù)邏輯出發(fā),對傳統(tǒng)建筑設(shè)計(jì)需要的 24 個(gè)業(yè)務(wù)流程步驟進(jìn)行梳理,將其核心內(nèi)容抽取重構(gòu)為 6 個(gè)業(yè)務(wù)模塊,以 AI 系統(tǒng)與云端架構(gòu)為核心,建立起一套全新的建筑設(shè)計(jì) AIGC 業(yè)務(wù)流程:調(diào)(信息調(diào)用與AI識(shí)別)、做(全AI生成與人機(jī)協(xié)作生成)、改(人工可改與AI優(yōu)化)、核(數(shù)據(jù)核查與AI審查)、協(xié)(云端多人協(xié)同與業(yè)務(wù)管理)、出(自動(dòng)輸出更多格式- 3D模型/2D圖紙/圖像/PPT/Excel等)。
左圖:建筑設(shè)計(jì)原有業(yè)務(wù)流程 24 個(gè)步驟,右圖:小庫重構(gòu)為 6 個(gè) AI 加持下的業(yè)務(wù)流程板塊
基于對業(yè)務(wù)的深刻理解和重構(gòu)的業(yè)務(wù)邏輯,在產(chǎn)品設(shè)計(jì)上將 6 大業(yè)務(wù)模塊與 AI 識(shí)別、AI 生成、大數(shù)據(jù)、云端協(xié)同等技術(shù)深度融合,實(shí)現(xiàn)了建筑規(guī)劃、單體設(shè)計(jì)、構(gòu)件生成等不同深度的建筑業(yè)務(wù)需求,從分析到設(shè)計(jì)到審查再到協(xié)同與輸出,逐步覆蓋了住宅類業(yè)務(wù)所需的廣度和深度需求。
「小庫設(shè)計(jì)云 - 建筑規(guī)劃」產(chǎn)品 6 大模塊
「小庫設(shè)計(jì)云 - 建筑單體」產(chǎn)品 6 大模塊
4. AIGC 在產(chǎn)業(yè)中的價(jià)值落地
在大部分產(chǎn)業(yè)中,AIGC 的應(yīng)用仍然處于初級(jí)階段,整體 AI 技術(shù)的不斷發(fā)展將推動(dòng)后續(xù) AIGC 的創(chuàng)新應(yīng)用。以當(dāng)前的建筑產(chǎn)業(yè)實(shí)踐為例,AIGC 目前能夠在產(chǎn)生用戶可感知價(jià)值的部分業(yè)務(wù)細(xì)節(jié)場景中,輔助提升對效率有較高要求的具體業(yè)務(wù)場景,如建筑產(chǎn)業(yè)中的投研、設(shè)計(jì)、評(píng)估、管理和建造等環(huán)節(jié)。
4.1 最優(yōu)解增益與效率提升
在建筑產(chǎn)業(yè)的投研階段,2021 年出臺(tái)的 “兩集中” 政策(集中供應(yīng)土地和集中拍地)使大量土地集中在一個(gè)月內(nèi)推出,開發(fā)企業(yè)需要在短時(shí)間內(nèi)完成對每一塊土地的投資評(píng)估,其中最核心的是如何在一塊地上找到最優(yōu)的建筑規(guī)劃方案,獲得最大的產(chǎn)品貨值和投資回報(bào)測算。原本完成一個(gè)住宅規(guī)劃概念方案的時(shí)間至少需要 3-5 天,無法滿足業(yè)務(wù)需要,如此就提出了對投前建筑規(guī)劃方案的極致效率的需求。
小庫團(tuán)隊(duì)推出 AIGC 的建筑規(guī)劃方案,只需原來 30% 左右的時(shí)間就可以輸出初步方案。更重要的是,AI 可以生成和優(yōu)化一些人沒有想到過或難以靠手動(dòng)窮舉推敲出的方案,從而獲得性能或經(jīng)濟(jì)性方面更優(yōu)的成果。如在中國金茂的某江西項(xiàng)目中, AI 生成的方案不僅在時(shí)間上僅為原有方式的 20%,項(xiàng)目總貨值上比原有方案增加了 5600 萬。在 2021 年 9 個(gè)月的地產(chǎn)拍地市場中,團(tuán)隊(duì)累積完成了近千個(gè)項(xiàng)目及近萬個(gè)方案,協(xié)助客戶成功拿地?cái)?shù)十塊。
「小庫設(shè)計(jì)云」AI 生成實(shí)際住區(qū)拿地方案
4.2 成本降低與節(jié)能減排
在實(shí)際的建筑建造環(huán)節(jié),小庫團(tuán)隊(duì)將 AI 與 DFMA(Design For Manufacture and Assembly 為裝配和制造而設(shè)計(jì))的設(shè)計(jì)方法結(jié)合,與建筑業(yè)巨頭中建集團(tuán)旗下中建科工攜手,將箱型裝配式建筑與 AI 設(shè)計(jì)生成、L5 級(jí) ABC “數(shù) - 模 - 規(guī)” 聯(lián)動(dòng)深度結(jié)合,實(shí)現(xiàn)了投資 - 方案 - 成本在未實(shí)施前的實(shí)時(shí)聯(lián)動(dòng),減少了 80% 設(shè)計(jì)和成本變更,并有效降低總體裝配式構(gòu)件 SKU 和開模量,實(shí)現(xiàn) 50% 以上節(jié)能減排。在獲得性能與經(jīng)濟(jì)結(jié)果更優(yōu)的同時(shí),將 “原生數(shù)據(jù)” 與工廠產(chǎn)線、智能建造現(xiàn)場有效打通為 “孿生數(shù)據(jù)”。在深圳某酒店項(xiàng)目中實(shí)現(xiàn)了 4 個(gè)月完成從設(shè)計(jì)到建造,將總工期大幅縮短了至少 14 個(gè)月,節(jié)省了 60% 以上的時(shí)間。
「小庫裝配云」與中建科工合作的深圳某酒店,全過程智能設(shè)計(jì)與智能建造)
L5 級(jí)智能建造模式與傳統(tǒng)模式對比
通過以上案例可以看到,L5 級(jí)的 AIGC 可以從數(shù)據(jù)產(chǎn)生的源頭開始,通過在產(chǎn)業(yè)鏈各環(huán)節(jié)細(xì)分場景的具體應(yīng)用,能夠有效輔助產(chǎn)業(yè)鏈獲得更高的全生命周期質(zhì)量、效益和核心競爭力。未來,AIGC 從文字和圖片邁向更高維的 3D 和 L5 級(jí)內(nèi)容成果是大勢所趨,這不僅是建筑產(chǎn)業(yè)對人工智能的未來預(yù)期,也是各垂直產(chǎn)業(yè)的共同的期待。
注:*在圖層無明顯錯(cuò)誤的基礎(chǔ)上,當(dāng)前小庫AI識(shí)別針對標(biāo)準(zhǔn)構(gòu)件(門、窗、墻、樓梯、電梯、空調(diào)、消火栓、車位)等識(shí)別準(zhǔn)確率為99.8%(測試集為上千張建筑平面CAD圖紙,圖紙來源是數(shù)家頭部開發(fā)商的內(nèi)部標(biāo)準(zhǔn)庫)
來源:機(jī)器之心
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。