光子計(jì)算在金融領(lǐng)域的應(yīng)用研究
原標(biāo)題為【光子計(jì)算在金融領(lǐng)域的研究應(yīng)用——聚焦“光子金融科技”新方向】
本文引用地址:http://butianyuan.cn/article/202305/446505.htm作者 | 吳永飛 王彥博 沈亦晨 楊璇
光子計(jì)算作為前沿尖端技術(shù)之一,近年來蓬勃發(fā)展、逐步成熟,目前已基本具備與行業(yè)應(yīng)用深度結(jié)合的可行性。本文立足金融領(lǐng)域業(yè)務(wù)實(shí)踐,創(chuàng)新提出光子金融科技 (Photon FinTech)研究與應(yīng)用領(lǐng)域,并將光子計(jì)算應(yīng)用于風(fēng) 險(xiǎn)價(jià)值計(jì)量和賬戶欺詐識(shí)別等金融場(chǎng)景,以期為數(shù)字經(jīng)濟(jì)時(shí)代下 金融行業(yè)數(shù)字化轉(zhuǎn)型發(fā)展提供基于光子科技路線的新動(dòng)能。
一、數(shù)字經(jīng)濟(jì)時(shí)代呼喚光子金融科技
當(dāng)前,隨著ChatGPT的橫空出世,大模型背后的底層算力支撐問題再次受到全球業(yè)界和學(xué)界的高度關(guān)注。可以預(yù)見,數(shù)字經(jīng)濟(jì)時(shí)代下,隨著各行各業(yè)數(shù)字化轉(zhuǎn)型發(fā)展的不斷深化,疊加大模型參數(shù)量和訓(xùn)練效果的進(jìn)一步升級(jí)迭代,目前基于電子計(jì)算的經(jīng)典算力體系將面臨巨大挑戰(zhàn)。開辟光子計(jì)算新路徑,已成為提高計(jì)算效率、降低計(jì)算功耗迫在眉睫的重要選項(xiàng)。光子計(jì)算作為前沿尖端技術(shù)之一,近年來蓬勃發(fā)展、逐步成熟,目前已基本具備與行業(yè)應(yīng)用深度結(jié)合的可行性。本文立足金融領(lǐng)域業(yè)務(wù)實(shí)踐,創(chuàng)新提出光子金融科技 (Photon FinTech)研究與應(yīng)用領(lǐng)域,并將光子計(jì)算應(yīng)用于風(fēng) 險(xiǎn)價(jià)值計(jì)量和賬戶欺詐識(shí)別等金融場(chǎng)景,以期為數(shù)字經(jīng)濟(jì)時(shí)代下 金融行業(yè)數(shù)字化轉(zhuǎn)型發(fā)展提供基于光子科技路線的新動(dòng)能。
一直以來,世界各國(guó)都高度重視光子技術(shù)研究。早在2005年,歐盟就將光子技術(shù)定為重點(diǎn)研發(fā)的技術(shù)之一,并組建了“光子科技21”歐洲技術(shù)平臺(tái)。以德國(guó)為例,光子學(xué)是其國(guó)內(nèi)發(fā)展最快的行業(yè)之一,已在半導(dǎo)體和醫(yī)療技術(shù)、光伏、機(jī)械工程、航空等領(lǐng)域發(fā)揮著關(guān)鍵作用。我國(guó)同樣高度重視光子計(jì)算相關(guān)研究,從“十二五”規(guī)劃時(shí)期開始,我國(guó)以光學(xué)儀器行業(yè)作為著力點(diǎn),推動(dòng)光學(xué)技術(shù)的完善與發(fā)展。
光子計(jì)算作為一項(xiàng)快速發(fā)展的新興技術(shù),不僅在技術(shù)上不斷取得突破,近年來在商業(yè)應(yīng)用方面也日益成熟。特別是對(duì)于金融行業(yè)而言,光子計(jì)算所帶來的速度和效能優(yōu)勢(shì)天然地與金融行業(yè)的需求相匹配,光子金融科技這一新領(lǐng)域應(yīng)運(yùn)而生。一方面,光子金融科技有望滿足金融機(jī)構(gòu)對(duì)計(jì)算速度的嚴(yán)格要求。金融市場(chǎng)瞬息萬變,每一筆資金都具有時(shí)間成本,特別是在金融市場(chǎng)類業(yè)務(wù)中,交易速度的差異往往會(huì)對(duì)組合收益帶來顯著影響。光子計(jì)算所帶來的顯著速度提升有望為金融機(jī)構(gòu)在交易中提供“天下武功唯快不破”的優(yōu)勢(shì)。另一方面,光子金融科技有望滿足金融機(jī)構(gòu)海量數(shù)據(jù)樣本的計(jì)算需求。金融機(jī)構(gòu)是典型的數(shù)據(jù)密集型機(jī)構(gòu),具有海量的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)運(yùn)算需求,亟需探索出一條以低成本來處理海量數(shù)據(jù)的算力提升路徑。光子計(jì)算有望在該領(lǐng)域提出全新的破局思路。
二、光子計(jì)算的起源與發(fā)展
光子計(jì)算獨(dú)具優(yōu)勢(shì)
立足當(dāng)前的數(shù)字經(jīng)濟(jì)時(shí)代,回顧過往幾十年的算力發(fā)展歷程,傳統(tǒng)提高芯片算力的方法是在僅僅只有指甲蓋大小的芯片上集成晶體管,并不斷加大集成密度。然而,隨著人類社會(huì)數(shù)據(jù)量爆棚及人工智能的加速發(fā)展,人們對(duì)算力的需求激增,而芯片自身受物理極限限制,導(dǎo)致“摩爾定律”也面臨失效的困境。為了突破電子芯片存在的一系列弊端,國(guó)內(nèi)外學(xué)者們紛紛考慮從“電”向“光”進(jìn)行轉(zhuǎn)化,即利用光子計(jì)算代替?zhèn)鹘y(tǒng)電子計(jì)算中的計(jì)算密集型操作,從而達(dá)到提高算力、降低能耗的實(shí)用效果。
光子是一種靜止質(zhì)量為零的粒子,具有能量和動(dòng)量。光子計(jì)算具有超強(qiáng)的并行處理能力及超高的運(yùn)算速度。20世紀(jì)八九十年代,研究學(xué)者發(fā)現(xiàn)光學(xué)技術(shù)在信息處理方面具有巨大優(yōu)勢(shì),而后掀起了光子計(jì)算研究的熱潮。光子計(jì)算是一種基于光學(xué)信號(hào)處理的新型計(jì)算技術(shù),具有高速度、低功耗、高并行度等優(yōu)勢(shì),是未來信息技術(shù)領(lǐng)域的重要發(fā)展方向之一。在光子計(jì)算的諸多優(yōu)勢(shì)中,高速度和高效率兩個(gè)優(yōu)點(diǎn)尤為突出。在高速度方面,光子計(jì)算有著傳統(tǒng)電子計(jì)算無法比擬的優(yōu)點(diǎn),它可以采用新的進(jìn)制,比如三進(jìn)制和四進(jìn)制等,同時(shí)讓成千上萬條光在同一時(shí)刻穿越光子元件的不同通道,而且彼此之間互不干擾,這些優(yōu)點(diǎn)使其具有超強(qiáng)的并行計(jì)算能力,可以對(duì)數(shù)據(jù)實(shí)現(xiàn)高速處理。在高效率方面,光子在光介質(zhì)中傳輸信息損失極小,光在傳輸過程中的能量消耗和熱量散發(fā)極低,因此光子計(jì)算可以在大規(guī)模計(jì)算中實(shí)現(xiàn)高效率的數(shù)據(jù)處理。
光子計(jì)算在國(guó)內(nèi)外的發(fā)展如火如荼
國(guó)內(nèi)外已有許多專家學(xué)者在光子計(jì)算的相關(guān)領(lǐng)域開展了研究探索。1964年,Vander Lugt使用光學(xué)相關(guān)器的方法,通過空間濾波器來對(duì)光信號(hào)實(shí)現(xiàn)相位補(bǔ)償,并產(chǎn)生光信號(hào)計(jì)算結(jié)果。1990年前后,專家學(xué)者參考數(shù)字電子計(jì)算機(jī)的發(fā)展歷史來對(duì)光子計(jì)算機(jī)進(jìn)行了研究,主要成果涵蓋邏輯器件、邏輯計(jì)算、時(shí)空編碼及數(shù)字并行算法等各個(gè)領(lǐng)域。此后,研究學(xué)者們也針對(duì)光學(xué)計(jì)算中的光學(xué)模式識(shí)別、光子神經(jīng)網(wǎng)絡(luò)、邏輯光計(jì)算、光學(xué)全息存儲(chǔ)等技術(shù)方向進(jìn)行了研究,其中光子神經(jīng)網(wǎng)絡(luò)技術(shù)是一個(gè)重要的研究方向。
光子神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了存算一體的結(jié)構(gòu),有效解決了電子神經(jīng)網(wǎng)絡(luò)下對(duì)周期性數(shù)據(jù)讀寫異常的問題,它不僅提高了計(jì)算速度,同時(shí)也使計(jì)算時(shí)延降低。2017年,沈亦晨等人將硅基光電子技術(shù)和深度學(xué)習(xí)進(jìn)行融合,提出一種全光卷積架構(gòu),在相關(guān)納米光子芯片上實(shí)現(xiàn)了語音識(shí)別功能。2018年,Lin等人提出了一種光子深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),該結(jié)構(gòu)基于光的衍射,能對(duì)MNIST手寫數(shù)字?jǐn)?shù)據(jù)集和Fashion-MNIST時(shí)尚產(chǎn)品數(shù)據(jù)集進(jìn)行有效分類。2019年,費(fèi)爾德曼等人利用相關(guān)芯片實(shí)現(xiàn)光學(xué)神經(jīng)網(wǎng)絡(luò),并將其用于簡(jiǎn)單的英文字母識(shí)別。2022年,胡躍強(qiáng)等人提出了一種基于超構(gòu)表面全光衍射神經(jīng)網(wǎng)絡(luò)的多任務(wù)智能感知芯片,它能在可見光下執(zhí)行多個(gè)通道的低功耗、極速智能圖像識(shí)別任務(wù),其利用亞波長(zhǎng)納米結(jié)構(gòu)的偏振復(fù)用方案,構(gòu)建了一種多通道分類器框架,實(shí)現(xiàn)了對(duì)MNIST手寫數(shù)字?jǐn)?shù)據(jù)集和Fashion-MNIST時(shí)尚產(chǎn)品數(shù)據(jù)集的識(shí)別。
近年來,國(guó)內(nèi)相關(guān)光子研究團(tuán)隊(duì)有了創(chuàng)新的技術(shù)突破。2019年,首款光子芯片原型板卡由曦智科技發(fā)布,光子芯片的誕生有效證實(shí)了光子能夠替代電子來進(jìn)行高性能計(jì)算的設(shè)想。2021年,第二代高性能光子計(jì)算處理器PACE(Photonic Arithmetic Computing Engine,光子計(jì)算引擎)的問世再次驗(yàn)證了光子計(jì)算的優(yōu)越性。PACE主要利用了光計(jì)算的低延遲優(yōu)勢(shì),更具體而言,通過矩陣乘法的疊加及受控噪聲的緊密回環(huán)來實(shí)現(xiàn)低延遲,使得“伊辛問題”在PACE下僅在3納秒就可以完成單次迭代計(jì)算,其計(jì)算速度遠(yuǎn)超當(dāng)前頂端GPU計(jì)算。
三、光子計(jì)算在金融領(lǐng)域的應(yīng)用
光子計(jì)算在風(fēng)險(xiǎn)價(jià)值計(jì)量中的應(yīng)用
業(yè)務(wù)理解
金融機(jī)構(gòu)是經(jīng)營(yíng)風(fēng)險(xiǎn)的專業(yè)機(jī)構(gòu),對(duì)風(fēng)險(xiǎn)的價(jià)值計(jì)量能力是金融機(jī)構(gòu)的核心競(jìng)爭(zhēng)力之一。自2022年1月1日《關(guān)于規(guī)范金融機(jī)構(gòu)資產(chǎn)管理業(yè)務(wù)的指導(dǎo)意見》施行以來,理財(cái)產(chǎn)品打破“剛性兌付”,如何有效提升對(duì)金融產(chǎn)品的風(fēng)險(xiǎn)管理和風(fēng)險(xiǎn)價(jià)值計(jì)量能力再次引發(fā)了行業(yè)的高度關(guān)注。
風(fēng)險(xiǎn)管理是識(shí)別和度量風(fēng)險(xiǎn)、檢驗(yàn)承擔(dān)風(fēng)險(xiǎn)是否與預(yù)期風(fēng)險(xiǎn)一致的重要過程。管理市場(chǎng)風(fēng)險(xiǎn)的過程在很大程度上依賴于模型的使用,金融模型提供了管理投資風(fēng)險(xiǎn)所必需的關(guān)鍵信息。投資風(fēng)險(xiǎn)模型可以幫助投資組合管理者洞察風(fēng)險(xiǎn)因子發(fā)生變化時(shí)對(duì)投資組合的影響,了解投資組合未來收益和波動(dòng),以及可能發(fā)生的重大損失,在已打破“剛兌”的當(dāng)前具有現(xiàn)實(shí)意義。
風(fēng)險(xiǎn)價(jià)值(Value at Risk,VaR)是在假定的市場(chǎng)條件一段時(shí)間內(nèi),在一定顯著性水平(通常為1%或5%)內(nèi)預(yù)期的最小損失。在不同交易單位或投資組合頭寸之間比較風(fēng)險(xiǎn)價(jià)值,能夠?yàn)闆Q策者提供一個(gè)可用于資本配置的基準(zhǔn)。風(fēng)險(xiǎn)價(jià)值計(jì)量通常采用三種方法,分別為參數(shù)法、歷史模擬法和蒙特卡洛模擬法,這些方法需要根據(jù)產(chǎn)品復(fù)雜程度進(jìn)行金融建模,從而得到風(fēng)險(xiǎn)價(jià)值。然而,蒙特卡洛等傳統(tǒng)風(fēng)險(xiǎn)定價(jià)方法往往需要進(jìn)行大量路徑的模擬,需要消耗相對(duì)較長(zhǎng)的時(shí)間。面對(duì)復(fù)雜的金融市場(chǎng)變化和海量的數(shù)據(jù),如何既快速又準(zhǔn)確地計(jì)量出風(fēng)險(xiǎn)價(jià)值,一直是困擾相關(guān)金融從業(yè)者的難題之一。本文創(chuàng)新性地將光子計(jì)算運(yùn)用于金融風(fēng)險(xiǎn)價(jià)值計(jì)量場(chǎng)景,依托光子計(jì)算的高速傳輸特性,幫助金融從業(yè)者快速獲取所需資產(chǎn)路徑數(shù)據(jù)并迅速做出擬合計(jì)算,從而實(shí)現(xiàn)高效的風(fēng)險(xiǎn)價(jià)值計(jì)量。以表1中的某理財(cái)產(chǎn)品為例,實(shí)證分析結(jié)果如下。
表1 理財(cái)產(chǎn)品A要素示例
表2 風(fēng)險(xiǎn)價(jià)值計(jì)量參數(shù)表
數(shù)據(jù)理解
本文創(chuàng)新性地應(yīng)用光子神經(jīng)網(wǎng)絡(luò)算法對(duì)傳統(tǒng)的蒙特卡洛方法進(jìn)行替代,從而實(shí)現(xiàn)對(duì)投資組合風(fēng)險(xiǎn)價(jià)值(VaR)的高效計(jì)量。本文依托光互連技術(shù),能夠?qū)崿F(xiàn)大規(guī)模、高速、實(shí)時(shí)風(fēng)險(xiǎn)價(jià)值計(jì)量任務(wù)。風(fēng)險(xiǎn)價(jià)值計(jì)量過程主要分為訓(xùn)練和推理兩個(gè)階段,其中:訓(xùn)練階段是離線完成的,運(yùn)用提前準(zhǔn)備好的訓(xùn)練數(shù)據(jù)進(jìn)行深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練,并通過大量運(yùn)算把訓(xùn)練好的模型部署到適配的光子計(jì)算設(shè)備上;推理階段則是在線過程,將實(shí)時(shí)性數(shù)據(jù)推送至光子計(jì)算設(shè)備,依托光子計(jì)算低能耗、高速率等特性,通過實(shí)時(shí)推理得到風(fēng)險(xiǎn)價(jià)值計(jì)量值。通過離線訓(xùn)練和在線推理相結(jié)合的方式,滿足各品類實(shí)時(shí)風(fēng)險(xiǎn)價(jià)值計(jì)量需求。
離線訓(xùn)練過程主要應(yīng)用模擬數(shù)據(jù)來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型以適配光子計(jì)算網(wǎng)絡(luò),包含數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型驗(yàn)證等步驟。在數(shù)據(jù)準(zhǔn)備過程中,首先針對(duì)對(duì)應(yīng)投資組合產(chǎn)品特點(diǎn),確定影響產(chǎn)品風(fēng)險(xiǎn)敞口的固定參數(shù)及可變參數(shù)有效區(qū)間,如均值范圍、方差范圍、標(biāo)的初始價(jià)格、標(biāo)的計(jì)算周期等(見表2)。其次,在對(duì)應(yīng)的參數(shù)區(qū)間,采用均勻采樣的方式生成一組定價(jià)輸入?yún)?shù),并將各參數(shù)值輸入模型,而后進(jìn)行5萬次蒙特卡洛路徑模擬,得到對(duì)應(yīng)的風(fēng)險(xiǎn)價(jià)值計(jì)量值;以此方式離線生成數(shù)據(jù),并將生成的500萬條數(shù)據(jù)樣本,按照8∶1∶1的比例劃分為訓(xùn)練、驗(yàn)證及測(cè)試數(shù)據(jù)集。
模型構(gòu)建
在模型訓(xùn)練過程中,首先針對(duì)光子計(jì)算加速特性,設(shè)計(jì)專用的矩陣計(jì)算密集型風(fēng)險(xiǎn)價(jià)值計(jì)量神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并進(jìn)行隨機(jī)初始化。其次,利用數(shù)據(jù)準(zhǔn)備階段獲得的訓(xùn)練數(shù)據(jù)集,訓(xùn)練出運(yùn)行于光子計(jì)算設(shè)備上的風(fēng)險(xiǎn)價(jià)值計(jì)量神經(jīng)網(wǎng)絡(luò)模型。模型結(jié)構(gòu)采用共6層且除輸入及輸出層外每層1024個(gè)節(jié)點(diǎn)的多層全連接網(wǎng)絡(luò),能夠有效利用光子計(jì)算擅長(zhǎng)矩陣運(yùn)算推理的特性,以實(shí)現(xiàn)加速推理。當(dāng)完成模型訓(xùn)練及驗(yàn)證后,固定模型并部署權(quán)重。
模型評(píng)估
在線部署階段,將離線訓(xùn)練階段訓(xùn)練好的模型導(dǎo)入光子計(jì)算軟件棧中,進(jìn)行量化適配,并將模型部署到光子計(jì)算設(shè)備上,最終通過在線部署的方式實(shí)現(xiàn)對(duì)金融風(fēng)險(xiǎn)價(jià)值的實(shí)時(shí)計(jì)量。
從風(fēng)險(xiǎn)價(jià)值計(jì)量結(jié)果的精度來看,光子深度神經(jīng)網(wǎng)絡(luò)算法模型的計(jì)量精度隨路徑增多會(huì)逐漸逼近風(fēng)險(xiǎn)價(jià)值公允精度。本文以決定系數(shù)R2作為光子深度神經(jīng)網(wǎng)絡(luò)模型結(jié)果與經(jīng)典蒙特卡洛模擬算法結(jié)果之間擬合效果的評(píng)估指標(biāo),實(shí)證結(jié)果表明:光子計(jì)算模型的風(fēng)險(xiǎn)價(jià)值計(jì)量精度隨離線訓(xùn)練數(shù)據(jù)量的不斷增加而增加。隨著訓(xùn)練數(shù)據(jù)量的增大,光子計(jì)算風(fēng)險(xiǎn)價(jià)值計(jì)量精度能夠逐漸保持在99%以上(見圖1)。未來,隨著待估計(jì)產(chǎn)品種類及參數(shù)的增加,光子深度神經(jīng)網(wǎng)絡(luò)算法模型優(yōu)勢(shì)較其他模型將有望更加凸顯。
圖1 不同樣本量訓(xùn)練集下光子計(jì)算金融資產(chǎn)風(fēng)險(xiǎn)價(jià)值計(jì)量模型精度
從風(fēng)險(xiǎn)價(jià)值計(jì)量任務(wù)的計(jì)算速度來看,使用傳統(tǒng)CPU進(jìn)行蒙特卡洛模擬5萬條路徑需要528毫秒;而通過上述全連接網(wǎng)絡(luò)訓(xùn)練后,分別使用GPU計(jì)算及光子計(jì)算進(jìn)行推理運(yùn)算,其中使用8納米制程工藝的英偉達(dá)A10處理器用時(shí)893微秒,而實(shí)現(xiàn)同樣需求的光子計(jì)算使用的是28納米制程工藝但用時(shí)僅712微秒。在測(cè)試數(shù)據(jù)集上,光子計(jì)算風(fēng)險(xiǎn)價(jià)值計(jì)量模型的推理速度比采用傳統(tǒng)CPU蒙特卡洛算法得到相似結(jié)果快數(shù)百倍;同時(shí)采用先進(jìn)制程GPU計(jì)算模型實(shí)現(xiàn)推理的時(shí)間是采用該光子計(jì)算推理算法模型的1.25倍(見圖2)。
圖2 CPU與GPU和光子計(jì)算關(guān)于風(fēng)險(xiǎn)價(jià)值計(jì)量模型推理時(shí)間的對(duì)比(單位:微秒)
實(shí)證研究結(jié)果表明,針對(duì)風(fēng)險(xiǎn)價(jià)值計(jì)量問題,采用光子深度神經(jīng)網(wǎng)絡(luò)算法模型進(jìn)行推理的計(jì)算速度顯著優(yōu)于傳統(tǒng)的CPU蒙特卡洛模擬算法;且光子深度神經(jīng)網(wǎng)絡(luò)算法模型可以以低工藝制程(28納米)獲得更優(yōu)于先進(jìn)制程(8納米)的計(jì)算速度優(yōu)勢(shì)。
光子計(jì)算在銀行賬戶欺詐識(shí)別中的應(yīng)用
業(yè)務(wù)理解
數(shù)字經(jīng)濟(jì)時(shí)代下線上支付手段的快速發(fā)展,在為金融機(jī)構(gòu)用戶提供便捷服務(wù)的同時(shí),也對(duì)金融行業(yè)提出了新的挑戰(zhàn)。近年來,跨境賭博、電信網(wǎng)絡(luò)詐騙等涉賭涉詐案件劇增、方式手法多樣,呈現(xiàn)出線上化、產(chǎn)業(yè)化、交易鏈條復(fù)雜、易派生洗錢和其他涉詐等特點(diǎn),對(duì)人民群眾財(cái)產(chǎn)安全和社會(huì)安全穩(wěn)定造成了不良影響。以商業(yè)銀行為代表的金融機(jī)構(gòu)作為維護(hù)國(guó)家金融安全穩(wěn)定的重要力量之一,承擔(dān)著構(gòu)建牢固“防火墻”的責(zé)任使命。2022年12月1日起施行的《中華人民共和國(guó)反電信網(wǎng)絡(luò)詐騙法》已將反欺詐工作上升到了國(guó)家法律層面。該法中專門設(shè)立了“金融治理”章節(jié),明確了銀行業(yè)等金融機(jī)構(gòu)的反詐職責(zé),指出“銀行業(yè)金融機(jī)構(gòu)、非銀行支付機(jī)構(gòu)應(yīng)當(dāng)對(duì)銀行賬戶、支付賬戶及支付結(jié)算服務(wù)加強(qiáng)監(jiān)測(cè),建立完善符合電信網(wǎng)絡(luò)詐騙活動(dòng)特征的異常賬戶和可疑交易監(jiān)測(cè)機(jī)制”。
以商業(yè)銀行為例,銀行業(yè)務(wù)的交易流水可以看作為一個(gè)復(fù)雜的圖網(wǎng)絡(luò)結(jié)構(gòu),一些涉賭、涉詐及相關(guān)聯(lián)團(tuán)體往往呈現(xiàn)出一些“群體”特點(diǎn)。如何從復(fù)雜的交易網(wǎng)絡(luò)結(jié)構(gòu)中發(fā)現(xiàn)有欺詐特征的社區(qū)已經(jīng)成為一項(xiàng)重要的任務(wù)。本文從圖社區(qū)發(fā)現(xiàn)的視角出發(fā),將商業(yè)銀行的賬戶欺詐識(shí)別任務(wù)轉(zhuǎn)化為“伊辛模型”問題,并創(chuàng)新性地應(yīng)用光子計(jì)算進(jìn)行求解,以期高效地從圖數(shù)據(jù)中發(fā)現(xiàn)涉賭涉詐及值得關(guān)注的相關(guān)聯(lián)賬戶。
數(shù)據(jù)理解
本文采用國(guó)內(nèi)某全國(guó)性股份制商業(yè)銀行2020年3月1日至5月31日包含涉詐賬戶和欺詐行為的交易流水?dāng)?shù)據(jù),數(shù)據(jù)集包括賬戶數(shù)據(jù)、交易數(shù)據(jù)、樣本數(shù)據(jù)三大類,其中:賬戶數(shù)據(jù)包括賬戶號(hào)、賬戶所屬機(jī)構(gòu)、賬戶開戶日期等;交易數(shù)據(jù)包括交易流水號(hào)、賬戶號(hào)、對(duì)手賬戶號(hào)、交易金額、賬戶余額、對(duì)方行號(hào)、交易日期、交易時(shí)間、交易渠道、摘要代號(hào)等;樣本數(shù)據(jù)包括賬戶號(hào)、業(yè)務(wù)標(biāo)志等。本文聚焦涉賭涉詐及相關(guān)聯(lián)業(yè)務(wù)場(chǎng)景,并綜合考慮客戶地域、交易對(duì)手特征、交易金額、轉(zhuǎn)賬頻率、交易時(shí)間等業(yè)務(wù)關(guān)注的重點(diǎn)特征,提取出該類業(yè)務(wù)圖數(shù)據(jù)的一張子圖。從業(yè)務(wù)實(shí)際來看,該場(chǎng)景數(shù)據(jù)集為典型的小樣本學(xué)習(xí)圖數(shù)據(jù)集,包含66個(gè)賬戶節(jié)點(diǎn)和60筆交易,旨在從中發(fā)現(xiàn)涉賭、涉詐及存有其他相關(guān)聯(lián)問題的社區(qū)。
模型構(gòu)建
如前所述,面向該小樣本學(xué)習(xí)圖數(shù)據(jù)集的欺詐識(shí)別問題,可以被轉(zhuǎn)化為社區(qū)發(fā)現(xiàn)問題,即在一整張網(wǎng)絡(luò)中,將網(wǎng)絡(luò)中的節(jié)點(diǎn)劃分為若干社區(qū),從而發(fā)現(xiàn)包含涉賭、涉詐賬戶及其他相關(guān)聯(lián)賬戶的社區(qū)。傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法包括圖分割算法、層次聚類算法、分割式聚類算法和基于模塊度的算法等。經(jīng)典的Kernighan-Lin算法就是解決該類問題的重要方法之一。Kernighan-Lin算法常用于復(fù)雜網(wǎng)絡(luò)聚類問題,其核心目標(biāo)是使社區(qū)間連接數(shù)與社區(qū)內(nèi)連接數(shù)之間的差值最小化。然而,經(jīng)典的社區(qū)發(fā)現(xiàn)算法往往被認(rèn)為難以在多項(xiàng)式時(shí)間內(nèi)得到滿意的計(jì)算結(jié)果,因而在實(shí)際應(yīng)用中面臨不小的挑戰(zhàn)。
本文創(chuàng)新采用光子計(jì)算將該欺詐識(shí)別問題轉(zhuǎn)化為對(duì)社區(qū)發(fā)現(xiàn)問題進(jìn)行求解,并通過與經(jīng)典Kernighan-Lin算法模型進(jìn)行對(duì)比,從而達(dá)到提升效率、節(jié)約時(shí)間、提高模型準(zhǔn)確性的目的。具體而言,在光子計(jì)算視角下,可將社區(qū)發(fā)現(xiàn)問題轉(zhuǎn)化為二次無約束二值優(yōu)化問題(Quadratic Unconstrained Binary Optimization, QUBO),而QUBO問題和伊辛模型是一一對(duì)應(yīng)的,其數(shù)學(xué)表達(dá)式為:
min f = XTQX
其中,X=(x1,x2,…,xn )T,xi∈{0,1};Q為n×n的權(quán)重矩陣,它是通過鄰接矩陣得到的。本文使用光子計(jì)算對(duì)上述問題進(jìn)行求解:
首先通過電光轉(zhuǎn)換單元,將權(quán)重矩陣Q轉(zhuǎn)換為光權(quán)重信號(hào),并加載到光子器件上;同時(shí)初始化一組輸入向量X,并將其轉(zhuǎn)化為光輸入信號(hào);然后通過硅基芯片上實(shí)現(xiàn)的數(shù)萬個(gè)光學(xué)器件,實(shí)現(xiàn)一次高速低功耗的大規(guī)模矩陣計(jì)算,最終經(jīng)過光電轉(zhuǎn)換單元將結(jié)果轉(zhuǎn)換為電信號(hào),并將其分成兩部分,一部分用于能量計(jì)算,另一部分用于迭代。其中,下一次迭代使用的輸入向量是在前一步的基礎(chǔ)上加上隨機(jī)擾動(dòng)得到的,每次可在納秒量級(jí)完成一次端到端的算法迭代。
模型評(píng)估
在求解過程中,損失函數(shù)隨著迭代次數(shù)發(fā)生變化的曲線如圖3所示。不難看出,模型通過迭代后可較快地收斂到一個(gè)穩(wěn)定水平,此時(shí)可以理解為社區(qū)劃分任務(wù)達(dá)到了最佳社區(qū)分割狀態(tài)。
圖3 社區(qū)發(fā)現(xiàn)問題迭代求解過程中損失函數(shù)變化情況
從算法實(shí)現(xiàn)時(shí)間來看,實(shí)證研究結(jié)果表明:光芯片實(shí)現(xiàn)矩陣乘法在求解特定規(guī)模的社區(qū)發(fā)現(xiàn)問題時(shí),較現(xiàn)有算法具有顯著的性能優(yōu)勢(shì)。與傳統(tǒng)GPU相比,光子伊辛問題求解算法可展現(xiàn)出上百倍的速度優(yōu)勢(shì),具體計(jì)算時(shí)間情況如圖4所示。
圖4 光子計(jì)算與GPU計(jì)算在社區(qū)發(fā)現(xiàn)問題中單次迭代所耗時(shí)間對(duì)比(單位:納秒)
從模型準(zhǔn)確性方面來看,在該小樣本學(xué)習(xí)圖數(shù)據(jù)集上,模型的構(gòu)建天然面臨著較大挑戰(zhàn)。如表3和表4所示,經(jīng)典的Kernighan-Lin算法模型在該數(shù)據(jù)集上是將全部賬戶節(jié)點(diǎn)平均分為兩群,經(jīng)業(yè)務(wù)排查,涉賭涉詐的賬戶節(jié)點(diǎn)(真實(shí)標(biāo)簽為1的節(jié)點(diǎn))被平均分在兩群中,對(duì)于本文社區(qū)發(fā)現(xiàn)和欺詐識(shí)別問題而言效果不佳。而采用基于光子計(jì)算的伊辛模型結(jié)果顯示,實(shí)際發(fā)生涉賭涉詐的賬戶節(jié)點(diǎn)被較為有效地劃分進(jìn)了同一社區(qū),并為業(yè)務(wù)人員有效鎖定與涉賭涉詐相關(guān)聯(lián)的其他問題行為及相關(guān)賬戶提供了依據(jù),起到了事半功倍、降本增效的良好應(yīng)用效果。
表3 基于Kernighan-Lin算法構(gòu)建模型的混淆矩陣
表4 基于光子計(jì)算構(gòu)建模型的混淆矩陣
進(jìn)一步將經(jīng)典的圖分區(qū)Kernighan-Lin算法模型與光子計(jì)算模型結(jié)果指標(biāo)進(jìn)行對(duì)比:在當(dāng)前小樣本學(xué)習(xí)圖數(shù)據(jù)集上,針對(duì)涉賭涉詐相關(guān)賬戶識(shí)別任務(wù),Kernighan-Lin算法模型的查全率為0.5、查準(zhǔn)率為0.09、F1-score為0.15;而光子計(jì)算模型的查全率為0.83、查準(zhǔn)率為0.15、F1-score為0.26。光子計(jì)算模型在上述三個(gè)指標(biāo)方面均表現(xiàn)優(yōu)于Kernighan-Lin算法模型。
隨著未來相關(guān)欺詐識(shí)別業(yè)務(wù)的進(jìn)一步發(fā)展,在處理更大規(guī)模(甚至超大規(guī)模)交易圖數(shù)據(jù)時(shí),得益于數(shù)據(jù)規(guī)模的增大,模型準(zhǔn)確性指標(biāo)有望得到自然提升,同時(shí)光子計(jì)算模型的計(jì)算效率優(yōu)勢(shì)將進(jìn)一步得到凸顯,具有可觀的應(yīng)用價(jià)值和廣闊的應(yīng)用前景。
四、結(jié)語
數(shù)字經(jīng)濟(jì)時(shí)代下,光子金融科技作為提高金融業(yè)務(wù)與管理的計(jì)算效率、降低其計(jì)算功耗的新路徑應(yīng)運(yùn)而生。本文立足金融行業(yè)應(yīng)用視角,創(chuàng)新性地將光子計(jì)算應(yīng)用于風(fēng)險(xiǎn)價(jià)值計(jì)量和賬戶欺詐識(shí)別業(yè)務(wù)場(chǎng)景,構(gòu)建了較經(jīng)典電子計(jì)算技術(shù)更優(yōu)的應(yīng)用模型,為光子計(jì)算在金融領(lǐng)域的應(yīng)用提供了新思路。
此外,光子計(jì)算在金融行業(yè)還具有廣闊的應(yīng)用場(chǎng)景:一是可應(yīng)用于金融衍生品的定價(jià),特別是以障礙期權(quán)為代表的較為復(fù)雜的金融衍生品定價(jià)場(chǎng)景;二是結(jié)構(gòu)化金融產(chǎn)品的定價(jià),例如雙重貨幣債券的產(chǎn)品組合分析場(chǎng)景;三是金融圖計(jì)算中除社區(qū)發(fā)現(xiàn)以外的社交網(wǎng)絡(luò)分析以及知識(shí)圖譜應(yīng)用;四是自然語言處理在金融領(lǐng)域的應(yīng)用,包括但不限于智能客服、客戶情緒識(shí)別、合規(guī)制度問答等應(yīng)用場(chǎng)景;五是計(jì)算機(jī)視覺在金融領(lǐng)域的應(yīng)用,包括但不限于人臉識(shí)別、光學(xué)字符識(shí)別等應(yīng)用場(chǎng)景。
未來,應(yīng)進(jìn)一步聚焦光子金融科技的技術(shù)創(chuàng)新與深化應(yīng)用,為金融機(jī)構(gòu)數(shù)字化轉(zhuǎn)型發(fā)展提供更強(qiáng)有力的算力支撐,為數(shù)字經(jīng)濟(jì)時(shí)代下全社會(huì)廣泛應(yīng)用光子科技起到示范性效用。
【參考文獻(xiàn)】
1. Shen Y, Harris N C, Skirlo S, et al. Deep learning with coherent nanophotonic circuits[J]. Nature photonics, 2017, 11(7): 441-446.
2. Wetzstein G, Ozcan A, Gigan S, et al. Inference in artificial intelligence with deep optics and photonics[J]. Nature, 2020, 588(7836): 39-47.
3. Roques-Carmes C, Shen Y, Zanoci C, et al. Heuristic recurrent algorithms for photonic Ising machines[J]. Nature communications, 2020, 11(1).
4.王碩. 量子光學(xué)中的蒙特卡洛方法研究[J]. 科技資訊, 2015(15):7-9.
5.李樹. 光子與相對(duì)論麥克斯韋分布電子散射截面的蒙特卡羅計(jì)算方法[J]. 物理學(xué)報(bào), 2018, 67(21):268-276.
6. 方軼圣. 面向光學(xué)模擬計(jì)算的空間微分器和光學(xué)伊辛模型[D]. 浙江大學(xué), 2020.
(上海曦智科技有限公司陳辰、陳章、楊春、黃洋,龍盈智達(dá)﹝北京﹞科技有限公司張?jiān)?、王一多、徐奇、王子珺、曹曉峰、馮琳、高新凱、王學(xué)志、李婷婷、呂鵬對(duì)本文亦有貢獻(xiàn))
作者單位:華夏銀行股份有限公司,龍盈智達(dá)(北京)科技有限公司,上海曦智科技有限公司,其中吳永飛系華夏銀行首席信息官、信息科技部總經(jīng)理
責(zé)任編輯:董 治
Yhj_dz@126.com
文章刊發(fā)于《銀行家》雜志2023年第4期「金融科技」欄目(有刪節(jié))
評(píng)論