這屆 AI 預(yù)測(cè)歐洲杯冠軍,通通被打臉
來源:HyperAI超神經(jīng)
持續(xù)了一個(gè)月的歐洲杯,終于落下帷幕。
北京時(shí)間 7 月 12 日(周一)凌晨,本屆歐洲杯決賽中,意大利對(duì)陣英格蘭。兩隊(duì)在 120 分鐘時(shí)間里 1-1 戰(zhàn)平,意大利在歐洲杯中通過點(diǎn)球大戰(zhàn)以 3:2擊敗英格蘭奪冠。
意大利上次贏得歐洲杯是 1968 年,2002 年與 2012 年都屈居亞軍,今年相隔 53 年再次奪冠,這也讓本屆延遲了一年的歐洲杯,成為了近期全球共同熱議的話題。
早在比賽前幾個(gè)月里,就有不少研究機(jī)構(gòu)公布了他們對(duì)本次大賽的預(yù)測(cè)結(jié)果,各個(gè) AI 綜合了近年各個(gè)球隊(duì)的數(shù)據(jù)、比賽結(jié)果和球員表現(xiàn),對(duì)歐洲杯的奪冠熱門球隊(duì)、單場(chǎng)比賽結(jié)果,都進(jìn)行了預(yù)測(cè)。
現(xiàn)在看來大部分 AI 預(yù)測(cè)結(jié)果,幾乎都被打臉。
The Analyst :法國隊(duì)奪冠希望最大
數(shù)據(jù)網(wǎng)站 The Analyst 對(duì)本屆歐洲杯各隊(duì)的奪冠概率進(jìn)行了 AI 預(yù)測(cè),AI 預(yù)測(cè)結(jié)果顯示法國隊(duì)奪冠概率最高,勝率高達(dá) 20.5 %,然而最終法國隊(duì)卻止步于八強(qiáng)。
從 The Analyst 的 AI 預(yù)測(cè)結(jié)果,對(duì)照最終的結(jié)果看來,的確差之千里,實(shí)際最終奪冠的意大利被認(rèn)為是第六順位的奪冠熱門,而最終的亞軍英格蘭隊(duì),甚至排在了預(yù)測(cè)榜的第九名。
高盛:我們覺得冠軍是比利時(shí)!
高盛公司的預(yù)測(cè)就更加成熟穩(wěn)重了,高盛選擇在小組賽結(jié)束、四強(qiáng)產(chǎn)生后,對(duì)模型進(jìn)行調(diào)整,并結(jié)合最終結(jié)果進(jìn)行了復(fù)盤。
高盛公布的預(yù)測(cè)維度示意圖
高盛首先使用自 1980 年以來 6000 多場(chǎng)國際足球比賽的大型數(shù)據(jù)集,對(duì)每支球隊(duì)的進(jìn)球數(shù)進(jìn)行建模(排除掉了友誼賽),將這些數(shù)據(jù)量化成四個(gè)維度來評(píng)估球隊(duì)奪冠概率:
1.球隊(duì)實(shí)力:世界足球 ELO 評(píng)級(jí)
2.近期勢(shì)頭:近期比賽的進(jìn)球數(shù)和失球數(shù)
3.主場(chǎng)優(yōu)勢(shì):主場(chǎng)多 0.4 個(gè)進(jìn)球
4.大賽效應(yīng):在大型賽事中的表現(xiàn)優(yōu)于其他比賽
高盛 AI 預(yù)測(cè)本屆世界杯結(jié)果
基于以上數(shù)據(jù)和維度,高盛的研究人員認(rèn)為比利時(shí)將最終奪冠,而四強(qiáng)分別是:西班牙、比利時(shí)、意大利和葡萄牙。
面對(duì)最終的現(xiàn)實(shí)結(jié)果,研究人員也風(fēng)趣地說道:雖然我們細(xì)致地考慮到了比賽的隨機(jī)性,也預(yù)測(cè)到結(jié)果是高度不確定的。事實(shí)證明即使用了復(fù)雜的統(tǒng)計(jì)技術(shù),足球仍是一種難以預(yù)測(cè)的比賽。
足球比賽,為什么難以預(yù)測(cè)?
今年的歐洲杯,似乎大多數(shù)預(yù)測(cè)結(jié)果的 AI 都被打臉了。
本屆歐洲杯,也出現(xiàn)了荷蘭、法國隊(duì)爆冷提前出局,捷克、英格蘭等黑馬球隊(duì)的意外出線,都比賽更加引發(fā)關(guān)注和熱議。
爆冷、黑馬、逆轉(zhuǎn)都是體育賽事的看點(diǎn)
除了 The Analyst、高盛,不少機(jī)構(gòu)都參與進(jìn)了近年體育賽事的結(jié)果預(yù)測(cè)中,通常都融合了傳統(tǒng)統(tǒng)計(jì)、機(jī)器學(xué)習(xí)的方法。
通常這類賽事預(yù)測(cè) AI,會(huì)收集近年內(nèi)全世界千余支球隊(duì)的數(shù)萬場(chǎng)比賽的百億條數(shù)據(jù),并將所有能夠影響比賽的因素(如球員傷病情況、轉(zhuǎn)會(huì)情況、天氣情況等)都數(shù)據(jù)結(jié)構(gòu)化。
再結(jié)合博彩公司的盤口和賠率情況,運(yùn)用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能算法,進(jìn)行建模,通過分析和匹配得出比賽預(yù)測(cè)結(jié)果。
目前人工智能都是依靠可量化的數(shù)據(jù)進(jìn)行觀察。但如果數(shù)據(jù)不真實(shí),結(jié)果必然是不準(zhǔn)確的。此外,模型無法結(jié)合難以量化的因素,例如球隊(duì)即時(shí)狀態(tài)、球員情緒、現(xiàn)場(chǎng)球迷情緒等等。
數(shù)據(jù)分析公司美庫爾 的總監(jiān) Debs Balme 認(rèn)為,與其他比賽相比,足球比賽的預(yù)測(cè)本質(zhì)上更為復(fù)雜。足球賽事因?yàn)槠滟愂绿匦?,比賽?shù)量遠(yuǎn)比籃球、棒球等運(yùn)動(dòng)少得多,可利用的數(shù)據(jù)也更少。比如,棒球運(yùn)動(dòng)員一個(gè)賽季要打 162 場(chǎng)比賽,而足球聯(lián)賽一個(gè)賽季只有 38 場(chǎng)比賽,再加上杯賽等其他比賽,即使是豪門球隊(duì)一個(gè)賽季也最多比賽 50 多場(chǎng)。所以足球賽事本身的預(yù)測(cè)難度,就要比其他體育賽事高上很多。
不到最后一刻難定輸贏的緊張刺激,和比賽中這些不確定性,也正是足球作為世界最流行、最具觀賞性的體育運(yùn)動(dòng)的原因之一,也是體育賽事的最大魅力。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。