基于類別圖增強(qiáng)算法的融合異構(gòu)數(shù)據(jù)會(huì)話推薦分析

作者：李彩霞(河南工業(yè)貿(mào)易職業(yè)學(xué)院信息工程學(xué)院,鄭州 451191) 時(shí)間：2023-08-24 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

編者按：為了提高融合異構(gòu)數(shù)據(jù)會(huì)話推薦效率，設(shè)計(jì)了一種通過類別圖來實(shí)現(xiàn)增強(qiáng)效果的推薦算法。在融合層內(nèi)融合物品與類別表征結(jié)果，確保物品表征中包含類別數(shù)據(jù)；根據(jù)注意力機(jī)制建立全局表征，再通過局部表征建立最終表示；通過預(yù)測層計(jì)算各候選對象推薦參數(shù)。研究結(jié)果表明：設(shè)計(jì)得到的CaSe4SR模型對各類數(shù)據(jù)集都表現(xiàn)出了最優(yōu)推薦性能，CaSe4SR-W模型表現(xiàn)出了比Concat與CaSe4SR兩種模型更差的性能，推斷類別信息需結(jié)合物品信息共同建模，需根據(jù)物品參數(shù)才可以發(fā)揮信息補(bǔ)充功能。

基金項(xiàng)目：河南省重點(diǎn)研發(fā)與推廣專項(xiàng)，項(xiàng)目編號(hào)202102210177

本文引用地址：http://butianyuan.cn/article/202308/449928.htm

0 引言

從會(huì)話層面分析，在未掌握全面的用戶身份信息并且不知道會(huì)話序列包含的物品個(gè)數(shù)條件下，如果只根據(jù)物品參數(shù)來建立ID 標(biāo)簽序列模型時(shí)，并無法準(zhǔn)確捕獲用戶實(shí)際意圖，某些情況下還會(huì)出現(xiàn)關(guān)于用戶意圖的錯(cuò)誤理解結(jié)果。首先，當(dāng)會(huì)話序列較短的情況下，無法通過有限交互行為準(zhǔn)確反饋出用戶實(shí)際意圖?？紤]到大部分時(shí)候都無法得到用戶的身份信息，而且只有短時(shí)間中的用戶交互記錄才是有效的，這對大量處理方法造成了制約。

對人們?nèi)粘Ｊ褂玫母鞔筚徫锲脚_(tái)進(jìn)行分析可知，拼多多、淘寶、京東等電子商務(wù)服務(wù)平臺(tái)為提升搜索效率，通常都會(huì)針對各物品設(shè)置相應(yīng)的類別標(biāo)簽。通過上述方式促使用戶更加快速準(zhǔn)確找尋他們所需的商品，同時(shí)平臺(tái)還可通過推薦系統(tǒng)中顯示的用戶訪問信息推送同一類產(chǎn)品。綜合考慮物品與類別因素可以判斷出用戶的實(shí)際意圖。根據(jù)文獻(xiàn)^[1]報(bào)道可以發(fā)現(xiàn)，以圖神經(jīng)網(wǎng)絡(luò)構(gòu)建會(huì)話序列模型的時(shí)候，如果只針對單一物品結(jié)構(gòu)進(jìn)行建模，即只根據(jù)物品ID 序號(hào)構(gòu)建模型時(shí)，將會(huì)造成部分概念層數(shù)據(jù)丟失的結(jié)果。當(dāng)會(huì)話序列處于匿名狀態(tài)下時(shí)，無法包含所有用戶行為，如果只根據(jù)單一層面構(gòu)建模型時(shí)將會(huì)在用戶偏好方面產(chǎn)生較大偏差。本文對于上述分析結(jié)果，設(shè)計(jì)了一種通過類別圖來實(shí)現(xiàn)增強(qiáng)效果的推薦算法?？梢岳么怂惴槲锲方㈩悇e序列，再通過圖神經(jīng)網(wǎng)絡(luò)為上述序列構(gòu)建仿真模型，從而實(shí)現(xiàn)2 個(gè)層面的物品屬性評價(jià)，對2 個(gè)層面的測試結(jié)果進(jìn)行融合后確定會(huì)話用戶的偏好結(jié)果。

1 類別圖增強(qiáng)算法

在網(wǎng)絡(luò)中輸入各物品ID與類別序列再對其表征后，獲得每種序列下的各節(jié)點(diǎn)表征結(jié)果。由于類別屬于物品的特定屬性，可將其作為物品ID 標(biāo)簽序列的補(bǔ)充數(shù)據(jù)。CaSe4SR-W 方法是利用加權(quán)融合的過程來判斷全局偏好：物品與類別序列都是按照相互獨(dú)立的方式完成輸入與表征過程，因此進(jìn)行融合的時(shí)候先獨(dú)立處理2 個(gè)序列，之后測試融合所得的結(jié)果。上述融合模式是計(jì)算物品圖與類別圖的注意力加權(quán)數(shù)據(jù)，之后再對其實(shí)施融合，結(jié)果見圖1。

圖1 加權(quán)融合全局偏好方法

以下給出了具體處理步驟：

首先通過注意力機(jī)制加權(quán)計(jì)算物品表征向量，從而實(shí)現(xiàn)物品全局表征的效果，具體見式（1）（2）：

（1）

（2）

之后利用注意力機(jī)制加權(quán)計(jì)算類別表征向量，由此完成類別全局表征，構(gòu)建得到式（3）~（4）：

（3）

（4）

最后一步是對以上獲得的物品與類別層面進(jìn)行全局表征，融合物品與類別層面的信息后，可以更加全面描述物品特征，這使得各類ID 標(biāo)簽的物品因?yàn)轭悇e標(biāo)簽一致，也表現(xiàn)出了一定程度的相似性。通過會(huì)話表示層拼接局部與全局表征，再利用線性轉(zhuǎn)換方法確定最終會(huì)話表征。

2 實(shí)驗(yàn)

2.1 Cosmetics數(shù)據(jù)集及預(yù)處理

從Kaggle 平臺(tái)上采集測試參數(shù)，選擇中等化妝品在線商店在線用戶行為進(jìn)行分析。為確保數(shù)據(jù)處理過程更好地滿足一般性，將長度不在2~50 范圍的會(huì)話內(nèi)容去除，同時(shí)不考慮出現(xiàn)次數(shù)在5 次以內(nèi)的物品。表1 是統(tǒng)計(jì)得到的數(shù)據(jù)集參數(shù)。

表1 數(shù)據(jù)集統(tǒng)計(jì)

2.2 對比方法介紹及實(shí)驗(yàn)設(shè)置

為了對算法進(jìn)行可靠性驗(yàn)證，以SR-GNN[36] 模型作為基準(zhǔn)對比條件。

將模型設(shè)定為以下所示的控制參數(shù)：采用TensorFlow框架對模型開展訓(xùn)練。將數(shù)據(jù)集中的表征向量維度設(shè)置在100。同時(shí)將模型各參數(shù)矩陣均值都設(shè)置為0，標(biāo)準(zhǔn)差等于1，按照高斯分布形態(tài)實(shí)施初始化。通過minibatchAdam優(yōu)化器調(diào)整上述參數(shù)，設(shè)定最初學(xué)習(xí)率等于0.001?？刂朴?xùn)練批次為100，L2 懲罰保持105 的恒定值。

2.3 實(shí)驗(yàn)結(jié)果及分析

為驗(yàn)證以類別圖增強(qiáng)方法構(gòu)建的模型滿足有效性，本次利用2 個(gè)數(shù)據(jù)集分別測試了CaSe4SR、SR-GNN模型與CaSe4SR 變體模型，得到表2參數(shù)。

表2 不同方法的結(jié)果對比

根據(jù)表格參數(shù)可知，設(shè)計(jì)得到的CaSe4SR 模型對各類數(shù)據(jù)集都表現(xiàn)出了最優(yōu)推薦性能。同時(shí)可以發(fā)現(xiàn)，其他3 類包含類別信息數(shù)據(jù)的模型都獲得了比SRGNN模型更優(yōu)的性能，考慮到各模型具有自身獨(dú)特的建模過程，因此實(shí)際提升幅度也存在較大區(qū)別。Concat與CaSe4SR 雖然是以不同形式進(jìn)行建模，但都在建模過程中融合了物品與類別信息，可以將物品類別與表征形成一一對應(yīng)關(guān)系。CaSe4SR-W 則依次通過類別特征和物品實(shí)施建模，最后再對其實(shí)施融合。根據(jù)測試結(jié)果可知，CaSe4SR-W 模型表現(xiàn)出了比Concat 與CaSe4SR兩種模型更差的性能，由此可以推斷類別信息需結(jié)合物品信息共同建模，需根據(jù)物品參數(shù)才可以發(fā)揮信息補(bǔ)充功能。Concat 相對Case4SR 模型推薦性更弱，因此采用有向圖表示類別序列，同時(shí)引入門控圖神經(jīng)網(wǎng)絡(luò)建立模型的過程滿足可靠性要求。

3 結(jié)束語

本文開展基于類別圖增強(qiáng)算法的融合異構(gòu)數(shù)據(jù)會(huì)話推薦分析，得到如下有益結(jié)果：

1）設(shè)計(jì)了一種包含5 層結(jié)構(gòu)的CaSe4SR 仿真模型，在融合層內(nèi)融合物品與類別表征結(jié)果，確保物品表征中包含類別數(shù)據(jù)；根據(jù)注意力機(jī)制建立全局表征，再通過局部表征建立最終表示；通過預(yù)測層計(jì)算各候選對象推薦參數(shù)。

2）設(shè)計(jì)得到的CaSe4SR 模型對各類數(shù)據(jù)集都表現(xiàn)出了最優(yōu)推薦性能，CaSe4SR-W 模型表現(xiàn)出了比Concat 與CaSe4SR 兩種模型更差的性能，推斷類別信息需結(jié)合物品信息共同建模，需根據(jù)物品參數(shù)才可以發(fā)揮信息補(bǔ)充功能。

參考文獻(xiàn)：

[1] 賈丹,孫靜宇.基于用戶會(huì)話的TF-Ranking推薦方法[J]. 應(yīng)用科學(xué)學(xué)報(bào),2021,39(3):495-507.

[2] 任俊偉,曾誠,肖絲雨,等.基于會(huì)話的多粒度圖神經(jīng)網(wǎng)絡(luò)推薦模型[J].計(jì)算機(jī)應(yīng)用,2021,41(11): 3164-3170.

[3] 方軍,管業(yè)鵬.基于雙編碼器的會(huì)話型推薦模型[J].西安交通大學(xué)學(xué)報(bào),2021,55(8):166-174.

[4] WU S, TANG Y, ZHU Y, et al. Session-based recommendation with graph neural networks[C]. Proceedings of the AAAI Conference on Artificial Intelligence, Hawaii, United States,2019,33(1):346-353.

[5] 閆昭,項(xiàng)欣光.基于整體序列建模的會(huì)話推薦模型[J]. 南京理工大學(xué)學(xué)報(bào),2021,45(1):27-36.

[6] 張海通,黃增峰.基于影響力擴(kuò)散的會(huì)話推薦模型[J].計(jì)算機(jī)應(yīng)用研究,2021,38(7):1956-1962.

[7] 南寧,楊程屹,武志昊.基于多圖神經(jīng)網(wǎng)絡(luò)的會(huì)話感知推薦模型[J].計(jì)算機(jī)應(yīng)用,2021,41(2):330-336.

[8] WANG M, REN P, MEI L,et al. A collaborative sessionbased recommendation approach with parallel memory modules[C]. Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval, Paris, France, 2019: 345-354.

[9] 曾義夫,牟其林,周樂,等.基于圖表示學(xué)習(xí)的會(huì)話感知推薦模型[J].計(jì)算機(jī)研究與發(fā)展,2020,57(3):590-603.

[10] 李晶皎,孫麗梅,王驕.提高會(huì)話推薦多樣性的SRL推薦系統(tǒng)模型[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,34(5): 650-653+662.

[11] 劉浩翰,呂鑫,李建伏.考慮用戶意圖和時(shí)間間隔的會(huì)話型深度學(xué)習(xí)推薦系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件,2021,38(3): 190-195+223.

[12] 王鴻偉,過敏意.刻畫長短期用戶興趣的基于會(huì)話的推薦系統(tǒng)[J].中國科學(xué):信息科學(xué),2020,50(12):1867-1881.

（本文來源于《電子產(chǎn)品世界》雜志2023年8月期）

新聞中心

基于類別圖增強(qiáng)算法的融合異構(gòu)數(shù)據(jù)會(huì)話推薦分析

評論

相關(guān)推薦

技術(shù)專區(qū)