




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一、簡介當今社會,網(wǎng)球這項體育運動越來越受歡迎。頻繁的賽季轉(zhuǎn)換、高密度的比賽安排和以賽代練是網(wǎng)球的顯著特點[1],當描述比賽的整體走勢出現(xiàn)了不可思議的波動或者轉(zhuǎn)折點時,“勢頭”這個詞被經(jīng)常提及?!皠蓊^”指運動員在一系列事件之后獲得的一種能夠提升比賽狀態(tài)和氣勢的動力,它在網(wǎng)球比賽的走勢中起到了相當重要的作用。[2]在2023年溫布爾登網(wǎng)球公開賽男子單打決賽中,盡管阿爾卡拉斯在第一盤中落后了5分,他在第二、三、五盤中分別以7-6,6-1,6-4比分獲勝,最終逆轉(zhuǎn)局勢,打敗了德約科維奇。于是,一個自然的想法是,在這場比賽中“勢頭”在阿爾卡拉斯第一盤大幅度落后及后面乘勝追擊時發(fā)揮作用,扭轉(zhuǎn)了比賽結(jié)果。根據(jù)以上背景,本文將“勢頭”選做研究對象。但考慮到“勢頭”是一種球員在比賽過程中擁有動力的主觀感受,很難進行準確的刻畫,無法衡量球員在某一時刻有多少“勢頭”,也難以說明“勢頭”在一場比賽中是如何產(chǎn)生及變化的?;诖耍疚牡闹饕蝿?wù)是給“勢頭”一個量化的指標,找到在“勢頭”不斷作用下比賽局勢發(fā)生逆轉(zhuǎn)的具體時刻,同時找出對“勢頭”影響較大的因素。本文利用2023年溫布爾登網(wǎng)球公開賽男子單打比賽的數(shù)據(jù)進行研究,并考慮了如下假設(shè):1.兩個球員綜合實力的差距可以用他們在ATP上的實時排名的差距來衡量。2.環(huán)境等客觀因素如天氣、場地等不影響球員的表現(xiàn)水平。這是因為比賽會因不理想的天氣延后,并且承辦比賽的場地均滿足一定的標準。3.比賽輪次不影響球員的狀態(tài)。即每個球員的比賽狀態(tài)在不同場、盤及局中保持穩(wěn)定。4.每一分的比賽結(jié)果只影響球員下一分比賽中的表現(xiàn)水平,且每一分在比賽進程中的位置不影響球員的狀態(tài)。由于比賽的盤數(shù)和比分在一定程度上能夠體現(xiàn)比賽的進程,于是本文假定在局點和盤點時的關(guān)鍵分與非關(guān)鍵分對球員的影響是一樣的。5.每一得分的性質(zhì)相同。由于雙發(fā)失誤、ACE球、破發(fā)點等具有特殊性質(zhì)的分已經(jīng)在比賽結(jié)果比分中有所反映,故此處不加以考慮。二、數(shù)據(jù)集介紹及預處理2023年溫布爾登網(wǎng)球公開賽男子單打比賽決賽的數(shù)據(jù)包含了31場比賽中每一分的信息。每一行數(shù)據(jù)含有比賽編號、盤數(shù)、局數(shù)、分、球員雙方的名稱等基本信息。本文將此數(shù)據(jù)集中的每行分別以兩個球員作為主體,拆分為兩行,將數(shù)據(jù)集整理成共含有了14568行的新數(shù)據(jù)集。則新數(shù)據(jù)集的各行擁有唯一主體,稱為球員,同一分中的另一方被稱為對手。數(shù)據(jù)集中與比賽表現(xiàn)相關(guān)的變量符號及含義如表1、表2、表3所示。此外,本文還定義了兩個組合變量:Server_count×Server,Server×Speed_no,分別記為Server_no,Speed。根據(jù)假設(shè)5,P1_ace,P1_break等變量含有的特殊信息已蘊含在比分中,故不需要添加額外變量。本文利用隨機森林填補了speed_no中含有的752個缺失值。經(jīng)過檢驗,未發(fā)現(xiàn)不符合常識的離群值,故不進行其他處理。三、“勢頭”的衡量及比賽結(jié)果的估計(一)基于TOPSIS熵權(quán)法的“勢頭”的量化估計考慮到“勢頭”是一種比賽狀態(tài),本文利用與比賽表現(xiàn)相關(guān)的變量來估計球員在比賽指定時刻的“勢頭”的多少。根據(jù)假設(shè)3與4,每一分所處位置不影響球員狀態(tài),故本文能夠把每一分的信息作為被評價對象,并利用TOPSIS熵權(quán)法給出一個比賽狀態(tài)評分。評分越高說明球員在這一分的“勢頭”越大,表現(xiàn)得越好,贏的可能性也越大。此評分就是“勢頭”的一個量化指標。1.熵權(quán)法為指標賦權(quán)指標權(quán)重的確定是TOPSIS的重要環(huán)節(jié),而采用熵權(quán)法可有效消除主觀判斷的影響。它利用熵值判斷指標的離散程度,并把熵值更大的指標賦予更高的權(quán)重。接下來采用此方法計算權(quán)重。共有14568個被評價的分,24個評價指標。首先構(gòu)建判斷矩陣:X=(xij)14568*24(i=1,2,…,14568;j=1,2,…,24)。對判斷矩陣進行標準化處理,得到xij'=xijxjmax其中xjmax指第j個指標的最大值。接下來計算信息熵Hj=-k∑14568i=1pijlnpij,j=1,2,…,24其中pij=xij'∑14568i=1xij',k=1ln14568。進一步得到第j個指標的權(quán)重ωj=1-Hj∑24j=11-Hj其中ωj∈[0,1],且∑24j=1ωj=1。指標權(quán)重計算結(jié)果如表4所示。最后,計算出加權(quán)矩陣R=(rij)14568×24其中rij=ωj*xij'(i=1,2,…,14568;j=1,2,…,24)。2.基于TOPSIS的“勢頭”的量化估計首先將指標轉(zhuǎn)化成數(shù)值越大越好的極大型數(shù)據(jù),并進行標準化。接下來使用TOPSIS對球員的比賽狀態(tài)進行評價。首先確定各指標的最優(yōu)理想解A+和最劣理想解A-。由于所有指標均已轉(zhuǎn)化為極大型數(shù)據(jù),所以各指標中最大值代表最優(yōu)情況,最小值代表最劣情況,即A+j=max(r1j,r1j,…,r14568j),A-j=min(r1j,r1j,…,r14568j)然后計算每個球到A+與A-的距離D+i=∑24j=1(A+j-rij)2,D-i=∑24j=1(A-j-rij)2進一步能夠計算出球員在第i分時刻的比賽狀態(tài)評分Ci=D-iD+i+D-i,Ci∈[0,1]其中,Ci值越大表征第i分時刻球員的表現(xiàn)水平越優(yōu)。決賽前14分阿爾卡拉斯的比賽狀態(tài)評分及其排序如表5所示。每一分的比賽狀態(tài)評分量化了每個球員在特定時間下的表現(xiàn)水平,從而描述了球員在此刻的“勢頭”的多少。至此,本文已找出衡量“勢頭”的指標,即C。3.模型可視化為觀察球員的表現(xiàn)水平隨比賽進程的波動情況,繪制決賽中兩球員比賽狀態(tài)評分折線圖與散點圖如圖1。為便于觀察球員表現(xiàn)水平的整體走勢,右圖中擬合出了C的回歸直線。由此可看出,隨著比賽的進展,阿爾卡拉斯的比賽狀態(tài)評分呈現(xiàn)上升趨勢,說明表現(xiàn)狀態(tài)在不斷提升,這與其最終獲勝的結(jié)果相符。(二)預測比賽結(jié)果的Logistic回歸模型1.模型建立為探究“勢頭”對比賽結(jié)果的作用,現(xiàn)用C來預測比賽下一分的輸贏情況。注意到同一比賽中的兩個球員的“勢頭”的差距,即他們比賽狀態(tài)評分之差,能反映每一分的輸贏情況。于是,將球員與對手在第i分時的比賽狀態(tài)評分相減,并記為ΔCi(i=1,2,…,14568),則ΔCi越大說明球員在第i分打得越好,贏的可能性越大。記ΔC為所有ΔCi(i=1,2,…,14568)的集合。令outcome=1,當此分中選手獲勝時0,當此分中對手獲勝時。根據(jù)outcome的取值分類0和1,可以將樣本點分loss和win兩類。繪制箱線圖與小提琴圖如圖2。由圖可看出,在win類別中,大部分ΔCi取值為正,說明當球員在此分中獲勝時,其比賽狀態(tài)評分高于對手的評分;反之,loss中大部分ΔCi為負值,這與常識相符。因此能進一步建立模型。將outcome看作因變量,把ΔC當作自變量,建立Logistic模型其中β0與β1的估計值如表6所示。其中所有系數(shù)均是顯著的。2.10折交叉驗證為評估模型的預測效果,現(xiàn)進行10折交叉驗證。首先將樣本集隨機地劃分為樣本量相同的10部分[3],把前9部分當作訓練集,用于建立模型及擬合參數(shù);最后1部分當作測試集,以此來估計平均預測準確率。其次,繪制ROC曲線如圖3所示,由圖可得到用于判斷預測類別的最優(yōu)閾值=0.020。于是,對于測試集的樣本點,如果它的后驗概率≥0.020,則此點的outcome被判為1;否則,outcome被判為0。將預測得到的outcome與測試集中outcome的真實值進行比較,計算得到預測準確率為0.8333。此外,計算得到AUC為0.929,非常接近1,說明此模型有很強的二元分類能力,區(qū)分兩個類別的表現(xiàn)很好,且ROC曲線是可靠的[4]。最后將上述操作重復200次,計算得到平均預測準確率為87.9%,說明模型比較穩(wěn)健且預測效果不錯。四、轉(zhuǎn)折點的識別與“勢頭”的刻畫因素(一)基于核回歸方法的轉(zhuǎn)折點識別前文已說明“勢頭”會對比賽結(jié)果造成影響,接下來的目的是描述“勢頭”如何在比賽中發(fā)揮作用。具體來說,希望找到在“勢頭”不斷作用下,比賽走勢從有利于某一方轉(zhuǎn)化為另一方的具體時刻,即比賽的“轉(zhuǎn)折點”。從直觀上來看,當一方選手的表現(xiàn)得更好時,比賽走勢更有利于這一方。故首先考慮用球員比賽狀態(tài)評分的差值當作自變量。但由圖1右圖可以看出,C變化特別大且迅速,故直接使用ΔC作為自變量難以識別出ΔC正負號的變化規(guī)律。因此接下來對C進行核回歸,使得ΔC的變化更加平滑,便于識別轉(zhuǎn)折點的發(fā)生。本文把C當作因變量,把分當作自變量,進行核回歸擬合,記擬合后的比賽狀態(tài)評分為RC,并繪制同一場比賽雙方的核回歸曲線如圖4所示。兩條曲線的交點就是轉(zhuǎn)折點發(fā)生的時刻,距離轉(zhuǎn)折點最近的分就是“勢頭”扭轉(zhuǎn)比賽局勢的那一分。為簡化表達,本文把上述距離轉(zhuǎn)折時刻最近的分簡稱為轉(zhuǎn)折點。(二)基于BPNN的自變量重要性的評估為了找到對“勢頭”影響較大的指標,并計算出每個指標影響的大小,本文采用BPNN。此算法具有大規(guī)模并行結(jié)構(gòu)、分布式存儲等特點[5],有很強的分類能力。為充分利用在轉(zhuǎn)折點出現(xiàn)之前的ΔRC隨比賽進程不斷減小的信息,本文把轉(zhuǎn)折點與其前兩個點一起看作“轉(zhuǎn)折時刻”。定義出用于判斷點是否位于轉(zhuǎn)折時刻的指標reversion=1,此點位于轉(zhuǎn)折時刻且ΔRC由負轉(zhuǎn)正0,此點不位于轉(zhuǎn)折時刻-1,此點位于轉(zhuǎn)折時刻且ΔRC由正轉(zhuǎn)負為了探究哪些因素影響轉(zhuǎn)折時刻,現(xiàn)把reversion當做因變量,使用reversion=1或-1的點對應的數(shù)據(jù),把各項指標當做自變量,使用BPNN對reversion的分類進行預測。計算得到預測準確率為75.9%。在進行BPNN時,訓練集的樣本點被分為幾個批次,每個批次依次進行訓練。而權(quán)重更新就是在兩個訓練批次切換之間進行的。[6]這些權(quán)重可以被理解為每個指標解釋了多少因變量的變化,即每個指標對轉(zhuǎn)折時刻的影響有多大。于是,指標的權(quán)重就是其重要性的一種量化。經(jīng)過正態(tài)化的自變量重要性如表7所示。此外,為便于直觀地觀察自變量重要性的排序,繪制柱狀圖如圖5。從圖5可以看出,重要性最高的自變量是P1_continue_score,即球員連續(xù)得分與失分次數(shù),占比達到17%。研究表明每局比賽中“連續(xù)得兩分”和“連續(xù)失兩分”是技戰(zhàn)術(shù)變化的關(guān)鍵時機[7],此處從運動員“勢頭”的角度來驗證了此結(jié)論。當選手在比賽中連續(xù)得分時次數(shù)越多時,他獲勝的概率越大。這是因為連續(xù)得分能夠使球員更加有斗志,即增加了“勢頭”,從而他獲勝的可能性也越高。因此,在運動員日常比賽中,應更加關(guān)注此因素,在球員連續(xù)得分時把握“勢頭”,一鼓作氣;在連續(xù)失分時及時調(diào)整狀態(tài),恢復動力。重要性占比第二的變量是球員在破發(fā)點的情況,占比為11%。相關(guān)文獻說明高水平球員在破發(fā)點關(guān)鍵分上的獲勝率高于其他分數(shù),即高水平球員在比賽的重要時刻能夠表現(xiàn)出更好的狀態(tài),且這種能力具有相對的穩(wěn)定性[8]。于是,在關(guān)鍵時刻以良好的狀態(tài)面對壓力,把握住每個破發(fā)點,能夠為球員增加“勢頭”,提升獲勝概率。對手打出ACE球的次數(shù)是重要性排名第三的變量,占比9%。當對手打出ACE球的次數(shù)增加時,球員的“勢頭”也會發(fā)生較大改變,從而影響了比賽結(jié)果。這為球員的訓練提供了兩點建議:第一,提高接發(fā)球的能力,降低比賽中對手打出ACE球的頻率,能夠減少“勢頭”的衰減;第二,鍛煉球員在對手打出ACE球之后的狀態(tài)調(diào)節(jié)能力,盡量保持“勢頭”的穩(wěn)定,嘗試發(fā)揮其積極作用,從而扭轉(zhuǎn)比賽的不利走勢。五、結(jié)論1.任意時刻的運動員“勢頭”的多少能夠用比賽狀態(tài)評分C衡量,C∈[0,1],且C越高說明此分中球員的表現(xiàn)越好。2.在網(wǎng)球選手及賽況的研究中,過去的理論將比賽中的球員每一分的表現(xiàn)看作是相互獨立的,但現(xiàn)在越來越多研究表明,過去比賽的分數(shù)、表現(xiàn)等因素都會影響球員接下來的比賽狀態(tài)。[9]“勢頭”為球員提供激勵與動力,影響了比賽每一分的結(jié)果??赏ㄟ^如下模型預測任意分的比賽結(jié)果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年中國煙草總公司內(nèi)蒙古自治區(qū)公司第二批次應屆高校畢業(yè)生招聘擬錄用人員筆試參考題庫附帶答案詳解
- 2024年8月福建廈門集美發(fā)展集團有限公司招聘考試筆試參考題庫附帶答案詳解
- 第18課《冷戰(zhàn)與國際格局的演變》教學設(shè)計-2023-2024學年高一下學期統(tǒng)編版(2019)必修中外歷史綱要下
- 2024年12月廣東東莞市茶山人社醫(yī)保分局公開招聘勞動監(jiān)察協(xié)管員1人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 2024年12月2025浙江湖州市長興縣綜合行政執(zhí)法局公開招聘輔助執(zhí)法人員8人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 2025年貴州裝備制造職業(yè)學院單招職業(yè)技能測試題庫1套
- 醫(yī)技三基三嚴模擬試題與參考答案
- 勞動和社會保障概論習題庫含答案
- 動物普通病學習題庫(含參考答案)
- 2024國家電投福建核電招聘69人筆試參考題庫附帶答案詳解
- DeepSeek1天開發(fā)快速入門
- 2025書記員招聘考試題庫及參考答案
- 2024-2025年第二學期數(shù)學教研組工作計劃
- 2025輔警招聘公安基礎(chǔ)知識題庫附含參考答案
- GB/T 44927-2024知識管理體系要求
- 2025年環(huán)衛(wèi)工作計劃
- 2024年07月山東省泰山財產(chǎn)保險股份有限公司2024年夏季校園招考29名工作人員筆試歷年參考題庫附帶答案詳解
- 品質(zhì)巡檢培訓課件
- 醫(yī)療器械生產(chǎn)企業(yè)并購合同
- 2025版新能源汽車充電站建設(shè)合同含政府補貼及稅收優(yōu)惠條款
- 初驗整改報告格式范文
評論
0/150
提交評論