博客專欄

EEPW首頁 > 博客 > 決策智能技術(shù)浪潮襲來,數(shù)智商業(yè)領(lǐng)域如何變革?來聽聽三位專家怎么說(1)

決策智能技術(shù)浪潮襲來,數(shù)智商業(yè)領(lǐng)域如何變革?來聽聽三位專家怎么說(1)

發(fā)布人:機(jī)器之心 時(shí)間:2023-01-19 來源:工程師 發(fā)布文章

近年來,伴隨著廣告主的需求變化和相關(guān)技術(shù)發(fā)展,計(jì)算經(jīng)濟(jì)學(xué)理論、博弈論和人工智能技術(shù)被越來越多地應(yīng)用到廣告拍賣機(jī)制、投放策略中。


決策智能在商業(yè)場(chǎng)景中的意義逐漸凸顯。用戶看到的每一次商品展現(xiàn)、商家的每一次廣告出價(jià)、平臺(tái)的每一次流量分配,背后都有龐大且復(fù)雜的決策智能做支撐。


這些動(dòng)作的目標(biāo)在于優(yōu)化用戶購物體驗(yàn),讓廣告投放的決策過程更加智能,同時(shí)讓廣告主、媒體在平臺(tái)實(shí)現(xiàn)長期繁榮。廣告主希望在有限的資源投入下最大化營銷效果,平臺(tái)希望能夠建立更好的生態(tài)。然而流量環(huán)境、其他參競(jìng)廣告形成的競(jìng)爭(zhēng)環(huán)境的復(fù)雜性、以及廣告投放策略中出價(jià)、目標(biāo)人群、資源位、投放時(shí)間等變量的巨大組合復(fù)雜度,使得最優(yōu)廣告投放策略的計(jì)算與執(zhí)行充滿了挑戰(zhàn)。


這些問題如何解決?效益最大化的目標(biāo)具體如何分解?這些有關(guān)于決策智能的重要議題,也是領(lǐng)域內(nèi)的研究者和從業(yè)者最關(guān)心的。


為了深入探討「數(shù)智商業(yè)場(chǎng)景中的決策智能」這一主題,近日,阿里媽媽博見社聯(lián)合機(jī)器之心,邀請(qǐng)到了北京大學(xué)鄧小鐵教授、中科院蔡少偉研究員和阿里媽媽 CTO 鄭波老師三位領(lǐng)域內(nèi)的資深學(xué)者和專家,展開了一系列主題分享。


以下為鄧小鐵教授、蔡少偉研究員、鄭波老師的主題分享內(nèi)容,機(jī)器之心在不改變?cè)獾那疤嵯逻M(jìn)行了整理。


鄧小鐵教授:計(jì)算經(jīng)濟(jì)學(xué)的幾個(gè)最新研究進(jìn)展


我今天粗糙地介紹一下計(jì)算經(jīng)濟(jì)學(xué),這是一個(gè)很有歷史的研究領(lǐng)域,最早可以追溯到 1930 年。后來的計(jì)算經(jīng)濟(jì)學(xué)從另外一個(gè)角度出發(fā),將經(jīng)濟(jì)學(xué)變成計(jì)算,之前的計(jì)算經(jīng)濟(jì)學(xué)就是通過計(jì)算做經(jīng)濟(jì)學(xué)研究,這次講一講其中的思路。


圖片


我們從計(jì)算的角度來考慮經(jīng)濟(jì)學(xué),有幾個(gè)主要關(guān)鍵問題:首先是優(yōu)化,機(jī)器學(xué)習(xí)都是優(yōu)化,從中可以看到很多優(yōu)化體系。優(yōu)化之后,還有一個(gè)問題叫做均衡,以前我們做計(jì)算經(jīng)濟(jì)學(xué)是從計(jì)劃經(jīng)濟(jì)的思路去做的,但當(dāng)時(shí)也有一派是從世界****做發(fā)展中國家的發(fā)展,他們給發(fā)展中國家定計(jì)劃,從優(yōu)化投入產(chǎn)出的思路展開。從計(jì)算角度算均衡會(huì)是很困難的問題,所以出現(xiàn)了一個(gè)概念,叫做可計(jì)算的一般均衡(Computable general equilibrium)。


最近,我們也越來越多可以看到動(dòng)力學(xué)系統(tǒng),因?yàn)檫@個(gè)世界很多東西并不是均衡的狀態(tài),特別突出看到均衡的場(chǎng)景是在數(shù)字經(jīng)濟(jì)活動(dòng)中,其中包括經(jīng)濟(jì)學(xué)層面的東西,比如定價(jià)。在數(shù)字經(jīng)濟(jì)中,每時(shí)每秒都可以看到交易數(shù)據(jù)和價(jià)格波動(dòng)。我們可以清清楚楚看得數(shù)據(jù)的變化,而不是一年過去之后再把經(jīng)濟(jì)數(shù)據(jù)統(tǒng)計(jì)出來。


計(jì)算經(jīng)濟(jì)學(xué)的整個(gè)框架下還有很多東西。每一個(gè)經(jīng)濟(jì)主體都要優(yōu)化,它們共同博弈的不動(dòng)點(diǎn)即是均衡。平臺(tái)也會(huì)博弈均衡這件事情,特別是互聯(lián)網(wǎng)廣告平臺(tái),做廣告的人到平臺(tái)上來,將廣告要通過平臺(tái)、媒體發(fā)放出去。對(duì)于媒體,要把廣告位置提供出來,利用自身對(duì)某一類人群的吸引力。對(duì)于平臺(tái),要想的是如何將大家的興趣更好地匹配。阿里媽媽作為國內(nèi)最大的廣告平臺(tái),同樣面臨著博弈均衡的問題,需要安排好各方面利益,以實(shí)現(xiàn)社會(huì)效益最大化,同時(shí)也實(shí)現(xiàn)機(jī)制設(shè)計(jì)最大收益。


圖片


我們可以從三個(gè)角度來談優(yōu)化。


首先是經(jīng)濟(jì)智能體刻畫的問題。很多機(jī)器學(xué)習(xí)的東西都寫成優(yōu)化的問題,比如怎樣用機(jī)器學(xué)習(xí)的方法算出來制約的約束條件,包括有些環(huán)境中的約束條件。


在非完全信息下,有很多條件是未知的,原來的經(jīng)濟(jì)學(xué)考慮不了如此復(fù)雜的東西,比如博弈對(duì)手的效益函數(shù)是什么、博弈對(duì)手的策略空間是什么、博弈對(duì)手都有哪些,非完全信息也是非常重要的對(duì)經(jīng)濟(jì)活動(dòng)的刻畫。


很多假設(shè)可以刻畫非完全信息,比如經(jīng)濟(jì)人知道對(duì)手的效益函數(shù)、約束以及其他各種信息。關(guān)于彼此的效益函數(shù)有一個(gè) common knowledge:我們知道 distribution。但這個(gè) distribution 怎么來的呢?這就走進(jìn)入機(jī)器學(xué)習(xí)范疇:為什么 player 要告訴彼此、告訴我們它知道什么?針對(duì)這些,在計(jì)算角度上就有一些很合理的問題。


博弈動(dòng)力學(xué),這是計(jì)算經(jīng)濟(jì)學(xué)的第三步。從實(shí)體經(jīng)濟(jì)的經(jīng)濟(jì)學(xué)來講,很多活動(dòng)是經(jīng)過了 6000 年演化發(fā)展過來的,是大家慢慢地博弈,直到均衡。在數(shù)字經(jīng)濟(jì)中,想一下子到達(dá)均衡會(huì)是很大的挑戰(zhàn)。


廣告平臺(tái)優(yōu)化是阿里媽媽在做的事情。我們講了這么多難的計(jì)算任務(wù),什么時(shí)候能夠做好呢?在單參數(shù)的情況下,已有的理論能夠支撐,但是多參數(shù)怎么做到,理論上還沒有現(xiàn)成的定義。


很重要的一點(diǎn)是,整個(gè)經(jīng)濟(jì)學(xué)體系已經(jīng)建好了,但經(jīng)濟(jì)學(xué)用到互聯(lián)網(wǎng)中會(huì)產(chǎn)生一個(gè)很大的缺陷 —— 它是靜態(tài)的。大家肯定知道,業(yè)界的事情不是靜態(tài)的,比如說「雙十一」大促會(huì)產(chǎn)生很多挑戰(zhàn),如何設(shè)計(jì)紅包的價(jià)格,根據(jù)市場(chǎng)已知模型如何建立這些東西,這些成為了今天計(jì)算經(jīng)濟(jì)學(xué)重要的挑戰(zhàn):一是近似求解優(yōu)化,一是均衡計(jì)劃,一是平臺(tái)競(jìng)爭(zhēng)動(dòng)力學(xué)。


圖片


近似計(jì)算的難度很大,我們最多知道的均衡的解可以算到三分之一,最多是 33% 的錯(cuò)誤率,跟最優(yōu)相差 33%,所以均衡計(jì)算確實(shí)挺難的。自動(dòng)設(shè)計(jì)方法論、隱藏對(duì)手模型學(xué)習(xí),是這方面的框架,這里都是跟信息容量相關(guān)的東西。


圖片


另外就是與市場(chǎng)上的未知對(duì)手博弈。我們要考慮至少兩個(gè) company,建立一個(gè)模型來設(shè)計(jì)它們之間的博弈,這里都是單調(diào)的,并不知道所有的信息。根據(jù)已知的信息看市場(chǎng)的波動(dòng)、價(jià)格設(shè)計(jì)變化,我們基于此設(shè)計(jì)一個(gè)隱函數(shù)的優(yōu)化模型,用機(jī)器學(xué)習(xí)方法做分析。


多方認(rèn)知次序的先后給我們帶來博弈的認(rèn)知層次。近年來,一些研究討論了很多一價(jià)拍賣為什么比二價(jià)拍賣好。Myerson 假設(shè)所有人知道所有人的價(jià)值分布,發(fā)展了一套最優(yōu)拍賣理論,但我們實(shí)際上不知道公共知識(shí)。我們自己的研究是從另外一個(gè)角度來考慮的,出發(fā)點(diǎn)是沒有先驗(yàn)的共同知識(shí),把原來用的概率方法建立 Myerson 最優(yōu)拍賣理論的假設(shè)放棄掉。


在沒有這套拍賣均衡的基礎(chǔ)假設(shè)的環(huán)境下,最優(yōu)解可以如何實(shí)現(xiàn)均衡?可以發(fā)現(xiàn),泛化一價(jià)拍賣收益是跟 Myerson 相等的。這里應(yīng)對(duì)買家以最優(yōu)效益為目標(biāo)公布的價(jià)值分布,賣家設(shè)計(jì)的 Myerson 最優(yōu)收益,等價(jià)于它已泛化一價(jià)拍賣的期望拍賣收益。


最終的結(jié)論是,Myerson 和 GFP 是等價(jià)的,它們要比 VCG 要好,但是在 IID 情況下是相等的,Symmetric BNE 和 GSP 也是等價(jià)的。


計(jì)算經(jīng)濟(jì)學(xué)用到的另外一個(gè)概念是馬爾可夫博弈,一種在動(dòng)態(tài)環(huán)境下的博弈,特別是無窮輪博弈求解的問題。我們對(duì)問題從三個(gè)方向進(jìn)行了處理:一是為計(jì)算做了有理化的簡化,把目標(biāo)限制在近似解;二是用時(shí)間折現(xiàn)率保證無窮輪收益的收斂性;三是數(shù)學(xué)上的分階段求以及將策略不同輪的變化局限在一輪的變化。如此,無窮求和的難點(diǎn)得以克服。


我們進(jìn)一步在馬爾可夫博弈的應(yīng)用方面簡化了計(jì)算的難度。對(duì)于比特幣的共識(shí)機(jī)制的設(shè)計(jì),有清晰的馬爾可夫獎(jiǎng)勵(lì)分析,而且講了一個(gè)很好的故事。按照機(jī)制設(shè)計(jì)規(guī)定,大多數(shù)人支持它就是對(duì)。但后面發(fā)現(xiàn),大多數(shù)支持并不保證經(jīng)濟(jì)學(xué)上的安全,有四分之一的人通過自私挖礦攻擊就可以推翻多數(shù)原則。


圖片

遠(yuǎn)見挖礦策略:「螳螂捕蟬,黃雀在后」


對(duì)于數(shù)字經(jīng)濟(jì)設(shè)計(jì)環(huán)節(jié)的問題,我們最新的工作是可以用 Insightful mining Equilibrium 克服,用遠(yuǎn)見挖礦的策略實(shí)現(xiàn)最優(yōu),最后是馬爾科夫博弈的構(gòu)架,形成了馬爾科夫獎(jiǎng)勵(lì)過程,增加一個(gè)認(rèn)知層級(jí),從誠實(shí)礦池、自私礦池,再越過一個(gè)層級(jí),達(dá)到遠(yuǎn)見礦池的結(jié)果。


同樣地,許多互聯(lián)網(wǎng)公司要處理動(dòng)態(tài)的東西而非靜態(tài)的東西,如今世界經(jīng)濟(jì)學(xué)不再是以前的經(jīng)濟(jì)學(xué),此外還通過數(shù)學(xué)使得機(jī)器學(xué)習(xí)方法論和博弈論緊密結(jié)合在了一起。我們因此克服了只能處理靜態(tài)經(jīng)濟(jì)學(xué)的情形,演進(jìn)到了能夠處理動(dòng)態(tài)的情形。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

波段開關(guān)相關(guān)文章:波段開關(guān)原理




關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉