基于貝葉斯博弈的無人機通信延時研究

作者：余益科時間：2016-09-28 來源：電子產品世界

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

編者按：在無人機通信網絡中，無人機之間協(xié)同通信已經成為重要的研究方向。本文針對無人機類型的不確定性，基于動態(tài)貝葉斯聯(lián)盟博弈，通過計算無人機在最小通信延遲下的收益，利用貝葉斯聯(lián)盟博弈來分析無人機的策略選擇。此外，利用信念更新機制來發(fā)現(xiàn)系統(tǒng)中潛在的聯(lián)盟成員。仿真表明，獲得的聯(lián)盟結構是納什穩(wěn)定的。

摘要：在無人機通信網絡中，無人機之間協(xié)同通信已經成為重要的研究方向。本文針對無人機類型的不確定性，基于動態(tài)貝葉斯聯(lián)盟博弈，通過計算無人機在最小通信延遲下的收益，利用貝葉斯聯(lián)盟博弈來分析無人機的策略選擇。此外，利用信念更新機制來發(fā)現(xiàn)系統(tǒng)中潛在的聯(lián)盟成員。仿真表明，獲得的聯(lián)盟結構是納什穩(wěn)定的。

本文引用地址：http://butianyuan.cn/article/201609/310491.htm

引言

　　多無人機(unmanned aerial vehicle，UAV)協(xié)同搜索是多無人機協(xié)同的一個重要研究方向。多架UAV同時對一個未知區(qū)域進行搜索，目的就是大量獲取搜索區(qū)域的信息，確定目標存在的具體位置。文獻[1]提出了一種基于貝葉斯理論的多UAV魯棒協(xié)同搜索方法，首先建立搜索環(huán)境的數(shù)學模型，然后考慮到UAV傳感器測量的不確定性以及環(huán)境自身的不確定性，引入魯棒性能參數(shù)以提高系統(tǒng)的抗干擾性以及穩(wěn)定性，最后對目標函數(shù)進行優(yōu)化求解，從而引導UAV在區(qū)域中進行搜索。任務集結是協(xié)同作戰(zhàn)的首要行動和自組織協(xié)同控制的重要內容，文獻[2]為優(yōu)化集結行動中系統(tǒng)任務狀態(tài)協(xié)調過程能量最優(yōu)性、協(xié)同控制動態(tài)響應性和集結行動時效性3個性能指標，采用基于快速一致性控制算法的協(xié)同控制結構，在合作博弈框架下給出多無人機系統(tǒng)自組織協(xié)同與優(yōu)化控制問題描述，建立了優(yōu)化控制輸入的Pareto解集，采用Nash討價還價方法給出基本合作博弈優(yōu)化一致性控制算法。在基本算法中引入過去狀態(tài)差值，并以優(yōu)化目標構建適應度函數(shù)，采用遺傳算法優(yōu)化代價函數(shù)的加權矩陣，得到改進合作博弈優(yōu)化一致性控制算法。文獻[3]通過考慮合作聯(lián)盟的目標價值收益指標函數(shù)、損傷代價指標函數(shù)及航程代價指標函數(shù)，建立多無人機聯(lián)盟合作博弈模型，構建出其博弈矩陣，給出合作聯(lián)盟特征函數(shù)與混合策略納什均衡的定義，采用粒子群算法(particle swarm algorithm，PSO)求解出混合策略的納什均衡，并利用Shapley 值方法，給出一種合作博弈的求解方法，最終得到多無人機對地攻防最優(yōu)對抗策略。文獻[4]對目標運動行為的綜合利用，以敵我雙方為局中人，把敵我雙方可能的行為作為策略集，建立博弈論模型，通過求解Nash均衡改進掃描式搜索路徑規(guī)劃算法。文獻[5]通過分析實際戰(zhàn)場中目標價值和毀傷概率信息的不確定性，提出了不確定信息條件下需要解決的無人機(UAV)攻防博弈問題。以敵我雙方發(fā)射導彈的價值信息為依據，建立基于不確定信息的多UAV攻防對抗的支付函數(shù)，構建攻防雙方博弈支付矩陣。將粒子群算法和區(qū)間數(shù)多屬性方案排序方法相結合，給出基于不確定信息下博弈納什均衡求解方法，為不確定環(huán)境下UAV攻防博弈實現(xiàn)最優(yōu)策略提供了新方法。

　　現(xiàn)在我們考慮一些無人機為降低傳輸成本，提高自身的利益，會出現(xiàn)不良行為的無人機。無人機的行為有兩種類型：協(xié)作的無人機總是會協(xié)助聯(lián)盟內其他無人機進行信息傳輸;不良行為的無人機則表現(xiàn)為在聯(lián)盟內有時會不參與其他無人機的協(xié)作信息傳輸。為了模擬存在協(xié)作無人機和不良行為無人機間的聯(lián)盟形成過程，建立了基于貝葉斯聯(lián)盟博弈^[6]模擬無人機間協(xié)作傳輸信息的過程。

基于貝葉-1.jpg