




已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
關(guān)于某競賽網(wǎng)評結(jié)果的建模與分析摘 要本文建立了某競賽網(wǎng)評結(jié)果的數(shù)學(xué)模型,分析了網(wǎng)評成績與最終成績的關(guān)系,提出了評價評委的相關(guān)指標(biāo)體系,考察了各競賽試題間評委的差異性。對于問題1,要求給出網(wǎng)評成績與最終成績的相關(guān)性。注意到網(wǎng)評成績中每份論文有四個評委的具體分?jǐn)?shù),而最終成績只有該試卷的獲獎等級。為了使得網(wǎng)評成績和最終成績具有可比性,我們首先將每份試卷的網(wǎng)評成績的標(biāo)準(zhǔn)分求平均值,并根據(jù)網(wǎng)評成績的平均標(biāo)準(zhǔn)分進(jìn)行排序;然后根據(jù)獲獎的比例將網(wǎng)評成績轉(zhuǎn)換成獲獎的等級;最后將網(wǎng)評成績的獲獎等級與最終獲獎等級進(jìn)行比對,計算出網(wǎng)評成績和最終成績的絕對差值,并構(gòu)造一個吻合度指標(biāo)和差異性指標(biāo)對網(wǎng)評成績與最終成績的相關(guān)性進(jìn)行度量,另外計算了person相關(guān)系數(shù)、spearman相關(guān)系數(shù)以及kendall tau-b相關(guān)系數(shù)等統(tǒng)計學(xué)指標(biāo),從另外一方面來度量網(wǎng)評成績與最終成績的相關(guān)度。對于問題2,要求給出評價評委基本素質(zhì)的指標(biāo)體系。由于我們可用的數(shù)據(jù)僅為各評委所評試卷的分?jǐn)?shù)以及該試卷的最終成績,為了度量該評委的基本素質(zhì),我們從三方面提出評價評委的指標(biāo)體系:評委評分的寬嚴(yán)度;評委所評試卷與他人評卷的評分偏離度;該評委所評試卷的網(wǎng)評成績與終評成績的差異度。由于標(biāo)準(zhǔn)分的折算已經(jīng)對評委評分寬嚴(yán)度進(jìn)行了修改,因此我們提出三個指標(biāo)來評價評委的評卷質(zhì)量:評委評分偏離度,評委吻合度指數(shù)和評委差異度指數(shù)。對于問題3,我們根據(jù)問題2的三個評價指標(biāo)建立數(shù)學(xué)模型,利用附件中的評審數(shù)據(jù)計算每個評委的評分偏離度,評委吻合度指數(shù)和評委差異度指數(shù)等三個指標(biāo)值。根據(jù)這三個指標(biāo)值對評委進(jìn)行排序,并根據(jù)排序結(jié)果進(jìn)行聚類分析,并評選出優(yōu)秀評委。對于問題4,為了分析不同題目之間評委的整體表現(xiàn)的差異程度,我們根據(jù)評價評委的指標(biāo)值進(jìn)行方差分析,從方差分析的結(jié)果分析出現(xiàn)差異的主要原因。對于問題5,由于現(xiàn)有方案的終評成績是網(wǎng)評成績與集中評審成績的加權(quán)平均,其權(quán)重為,我們提出一般的網(wǎng)評和集中評審分?jǐn)?shù)的加權(quán)平均公式,并分析了網(wǎng)評成績的權(quán)重系數(shù)對終評成績的影響。最后建立了最優(yōu)權(quán)重系數(shù)的貝葉斯模型,討論了最優(yōu)權(quán)重的確定方法,并給出了相關(guān)結(jié)論。最后,我們對全文進(jìn)行了總結(jié)。關(guān)鍵詞:網(wǎng)評成績,差異度指數(shù),吻合度指數(shù),評分偏離度,方差分析。 目 錄一、問題重述與分析1二、模型的假設(shè)與符號說明3三、模型的建立及求解43.1 問題一模型建立與求解43.2 度量評委基本素質(zhì)指標(biāo)體系的建立93.3 問題三的模型建立與求解113.4 問題四模型建立與求解153.5 問題五的數(shù)學(xué)模型19四、模型的推廣及優(yōu)缺點(diǎn)分析23參考文獻(xiàn)24附錄25一、問題重述與分析某競賽的評閱過程分兩階段進(jìn)行,分別稱為網(wǎng)評階段與集中評審階段。在網(wǎng)評階段,競賽論文被隨機(jī)平均分配給每位評委,每份競賽論文由四位評委評閱,每位評委以“百分制”記分,通過標(biāo)準(zhǔn)分計算公式將評委的“原始分”轉(zhuǎn)換成“標(biāo)準(zhǔn)分”,按照標(biāo)準(zhǔn)分總分排序,前55%的論文進(jìn)入集中評審。集中評審階段每份論文由三位評委按“百分制”獨(dú)立評審,所有評委評審結(jié)束后,換算成標(biāo)準(zhǔn)分,最后將每份論文的三個標(biāo)準(zhǔn)分與網(wǎng)評中該論文的平均標(biāo)準(zhǔn)分一起求平均分,即為該論文的最終成績。請完成以下建模任務(wù):1. 競賽組織者希望知道網(wǎng)評成績與最終成績的相關(guān)性,請根據(jù)附件中的評審結(jié)果,給出相應(yīng)的結(jié)論,并對網(wǎng)評結(jié)果作出評價。2. 從不同角度出發(fā),對競賽評委有不同的基本素質(zhì)要求,請給出合理的度量評委基本素質(zhì)的指標(biāo)體系。3. 建立評價評委基本素質(zhì)的數(shù)學(xué)模型,并將其運(yùn)用于附件中的評審數(shù)據(jù),給出相應(yīng)的結(jié)論。4. 附件中abcde表示不同題目,試分析不同題目的評委的整體表現(xiàn)之間是否存在顯著差異?如果存在,分析出現(xiàn)差異的可能原因。5. 試分析將網(wǎng)評成績加入總成績的利弊,并對如何更有效地利用網(wǎng)評成績給出相應(yīng)的建模結(jié)論。對于問題1,要求給出網(wǎng)評成績與最終成績的相關(guān)性,注意到網(wǎng)評成績中每份試卷有四個評委的具體分?jǐn)?shù),而最終成績只有該試卷的獲獎等級。為了使得網(wǎng)評成績和最終成績具有可比性,我們首先將每份試卷的網(wǎng)評成績的標(biāo)準(zhǔn)分求平均值,并根據(jù)網(wǎng)評成績的平均標(biāo)準(zhǔn)分進(jìn)行排序;然后根據(jù)獲獎的比例將網(wǎng)評成績轉(zhuǎn)換成網(wǎng)評獲獎的等級;最后將網(wǎng)評成績的獲獎等級與最終獲獎等級進(jìn)行比對,計算出網(wǎng)評成績和最終成績的絕對差值,并構(gòu)造一個吻合度指標(biāo)和差異性指標(biāo)對網(wǎng)評成績與最終成績的相關(guān)性進(jìn)行度量。此外我們計算了網(wǎng)評成績和最終成績的person相關(guān)系數(shù)、spearman相關(guān)系數(shù)以及kendall tau-b等級相關(guān)系數(shù),從另外一方面來度量網(wǎng)評成績與最終成績的相關(guān)度。有關(guān)相關(guān)系數(shù)的定義,可參考文獻(xiàn)1。對于問題2,要求給出評價評委基本素質(zhì)的指標(biāo)體系。由于我們可用的數(shù)據(jù)僅為各評委在網(wǎng)評階段對每份試卷所評的具體分?jǐn)?shù)以及該試卷的最終成績,為了度量該評委的基本素質(zhì),我們從三個方面提出評價評委的指標(biāo)體系:(1)評委評分的寬嚴(yán)度,度量每位評委的對論文的評閱時偏松還是偏嚴(yán),有關(guān)評卷寬嚴(yán)度的度量可參考文獻(xiàn)2;(2)評委所評試卷與他人評卷的差異。考慮每個評委所評的所有試卷,由于每份試卷在網(wǎng)評階段是有四個評委評分,因此該評委所評試卷與其他三位評委所評試卷的分?jǐn)?shù)差異大小反映了該評委的評卷質(zhì)量;(3)該評委所評試卷的網(wǎng)評成績的獲獎等級與終評成績的獲獎等級的差異也反應(yīng)了該評委評閱試卷的質(zhì)量。這里又包括兩個指標(biāo):吻合度指數(shù)和差異度指數(shù)。吻合度指數(shù)是指該評委所評試卷的網(wǎng)評獲獎等級與最終獲獎等級相吻合的所占其所評試卷的比例。但由于該評委所評試卷的網(wǎng)評成績和終評成績可能相差不同的等級,因此差異度指標(biāo)反映了該評委的總體得分。由于標(biāo)準(zhǔn)分的折算已經(jīng)對評委評分寬嚴(yán)度進(jìn)行了修改,因此我們提出三個指標(biāo)來評價評委的評卷質(zhì)量:評委評分偏離度,評委吻合度指數(shù)和評委差異度指數(shù)。對于問題3,我們根據(jù)問題2的評價指標(biāo)體系建立數(shù)學(xué)模型,利用附件中的評審數(shù)據(jù)計算每個評委的評分偏離度,吻合度指數(shù)和差異度指數(shù)三個指標(biāo)值。根據(jù)這三個指標(biāo)值對評委進(jìn)行排序,并根據(jù)排序結(jié)果進(jìn)行聚類分析,并評選出優(yōu)秀評委。有關(guān)模型的建立,我們可參考文獻(xiàn)3-5。對于問題4,為了分析不同題目之間評委的整體表現(xiàn)的差異程度,我們根據(jù)評價評委的指標(biāo)值進(jìn)行方差分析,從方差分析的結(jié)果分析出現(xiàn)差異的主要原因。我們可用spss統(tǒng)計軟件進(jìn)行方差分析,有關(guān)軟件的運(yùn)用可參考文獻(xiàn)6。對于問題5,為了度量網(wǎng)評成績加入總成績的利弊,根據(jù)現(xiàn)有評分方案,計算網(wǎng)評成績在最終成績中所占的作用,另外,我們可提出一般的網(wǎng)評和集中評審分?jǐn)?shù)的加權(quán)平均公式,建立最優(yōu)權(quán)重系數(shù)的數(shù)學(xué)模型,從而給出相關(guān)結(jié)論。二、模型的假設(shè)與符號說明為了對網(wǎng)評成績建立更合理的數(shù)學(xué)模型,我們提出下面的假設(shè)。假設(shè)1:每個評委所評分?jǐn)?shù)都是自身基本素質(zhì)的體現(xiàn);假設(shè)2:集中評審的評委都是優(yōu)秀評委,所評分?jǐn)?shù)是考生真實分?jǐn)?shù)的反映;假設(shè)3:標(biāo)準(zhǔn)分折算公式是科學(xué)合理的;假設(shè)4:每道題的評價難度基本相等;假設(shè)5:所有評委評分都是獨(dú)立進(jìn)行的,即各評委評出的論文分?jǐn)?shù)是相互獨(dú)立的。為了書寫的方便,我們引入下面的記號:符號符號說明總的論文份數(shù)總的評委位數(shù)第位評委對第份論文的網(wǎng)評原始分第位評委對第份論文的網(wǎng)評標(biāo)準(zhǔn)分第位評委網(wǎng)評的論文份數(shù)第份論文的網(wǎng)評平均標(biāo)準(zhǔn)分 第份論文的最終標(biāo)準(zhǔn)分 第份論文的集中評審的平均標(biāo)準(zhǔn)分 論文的網(wǎng)評標(biāo)準(zhǔn)分在最終成績中考慮的權(quán)重因子三、模型的建立及求解3.1 問題一模型建立與求解為了分析網(wǎng)評成績與最終成績的相關(guān)性,使兩者具有可比性,我們首先要對最終成績進(jìn)行量化,并對網(wǎng)評原始分進(jìn)行數(shù)據(jù)處理。對最終成績進(jìn)行量化處理如下:由于網(wǎng)評成績是每位評委的具體分值,而終評成績是獲獎等級,為了使網(wǎng)評成績與終評成績進(jìn)行比較,我們的思想是將網(wǎng)評的平均標(biāo)準(zhǔn)分也換算成獲獎等級。然后根據(jù)網(wǎng)評等級和終評等級進(jìn)行比對,差異小則表明網(wǎng)評成績與終評成績相關(guān)度高;反之則說明網(wǎng)評成績與終評成績相關(guān)度低。具體的步驟分為以下幾步。()將網(wǎng)評原始分換算成標(biāo)準(zhǔn)分。設(shè)表示第位評委所評試卷份數(shù),而為總試卷數(shù),則第位評委所評份試卷的原始分求出相應(yīng)的均值和標(biāo)準(zhǔn)差分別為:, (1)其中為第位評委對第份論文的網(wǎng)評原始分,這里。()根據(jù)標(biāo)準(zhǔn)分計算公式,得到第位評委對第份論文的評審標(biāo)準(zhǔn)分為.(2)()由于每份論文僅有4位評委對其評閱,因此中僅有4個數(shù)不為零,根據(jù)每個網(wǎng)評成績的標(biāo)準(zhǔn)分,可得到第份論文的網(wǎng)評平均標(biāo)準(zhǔn)分為。(3)()根據(jù)附件中每份論文的最終成績,可得到各題獲獎各獎項的獲獎比例及獲獎份數(shù),如表3.1-表3.5:表3.1 a題獲獎比例與試卷數(shù)a題獲獎等級一等獎二等獎三等獎不獲獎獲獎比例4.225%16.34%21.69%57.745%獲獎試卷數(shù)155877205表3.2 b題獲獎比例與試卷數(shù)b題獲獎等級一等獎二等獎三等獎不獲獎獲獎比例2.0498%17.7891%22.4012%57.7599%獲獎試卷數(shù)28243306789表3.3 c題獲獎比例與試卷數(shù)c題獲獎等級一等獎二等獎三等獎不獲獎獲獎比例3.6885%18.0318%21.3115%56.9682%獲獎試卷數(shù)1888104278表3.4 d題獲獎比例與試卷數(shù)d題獲獎等級一等獎二等獎三等獎不獲獎獲獎比例1.9895%17.9637%23.0544%43.0076%獲獎試卷數(shù)34307394974表3.5 e題獲獎比例與試卷數(shù)e題獲獎等級一等獎二等獎三等獎不獲獎獲獎比例2.5052%17.9541%22.3382%42.7975%獲獎試卷數(shù)24172213549()根據(jù)網(wǎng)評成績平均標(biāo)準(zhǔn)分可對試卷進(jìn)行排序,并根據(jù)該題的獲獎比例確定網(wǎng)評成績的獲獎情況,得到網(wǎng)評成績的向量,其中 ()根據(jù)網(wǎng)評成績向量和終評成績向量進(jìn)行比對,若與吻合度高,則說明網(wǎng)評成績與終評成績相關(guān)度高,否則說明網(wǎng)評成績與終評成績相關(guān)度低。為了更加客觀全面地度量網(wǎng)評成績與終評成績的相關(guān)性,我們分別定義了吻合度指數(shù)和差異度指數(shù),統(tǒng)計學(xué)相關(guān)性指標(biāo):person相關(guān)系數(shù)、spearman相關(guān)系數(shù)以及kendall tau-b相關(guān)系數(shù)等,并分別就五道題的網(wǎng)評數(shù)據(jù)進(jìn)行計算。(1)吻合度指數(shù)與差異度指數(shù)為了度量網(wǎng)評成績與最終成績的相關(guān)性,我們需要對網(wǎng)評成績與終評成績進(jìn)行比對。對每道題的網(wǎng)評成績與終評成績,定義向量:,則向量中分量的數(shù)值表示網(wǎng)評成績和終評成績的差異值,可能取值為0,1,2,3,其中表示第份試卷的網(wǎng)評成績與終評成績的等級差值。統(tǒng)計中0,1,2,3的個數(shù)和比例,得到下面的結(jié)果:表3.6 網(wǎng)評成績與終評成績的絕對差值所占比例等級差值絕對吻合相差一級相差二級相差三級a題比例0.67330.30420.02250b題比例0.74380.24160.01460c題比例0.70290.25210.04300.0020d題比例0.42360.34640.21120.0187e題比例0.74740.23900.01360根據(jù)上面表格中的比例,做出a題網(wǎng)評成績與終評成績的吻合度比例的餅圖如下:圖3.1 a題網(wǎng)評與終評吻合度分析圖類似地,畫出其他各題的吻合度比例圖如下:圖3.2 各題網(wǎng)評與終評吻合度分析圖從上面的餅圖可以看出,藍(lán)色區(qū)域表示絕對吻合占有最大的比例,說明網(wǎng)評成績與終評成績具有較強(qiáng)的相關(guān)性。記表示的分量中0的個數(shù),定義吻合度指數(shù)和差異度指數(shù)分別為:,以及= (4)顯然,越大反映網(wǎng)評成績與終評成績相關(guān)度越大,且;而越大則反映網(wǎng)評成績與終評成績的相關(guān)性越低。另外,值僅反映了網(wǎng)評成績與終評成績的一致性,而沒有度量網(wǎng)評成績與終評成績的差異度;但差異度指數(shù)正好補(bǔ)充了這一缺點(diǎn),不僅反映了網(wǎng)評成績與終評成績的不一致性,而且在數(shù)值上度量了網(wǎng)評成績與終評成績的差異度。我們分別計算各題的吻合度指數(shù)和差異度指數(shù)得到下面的表3.7:表3.7各題的吻合度指數(shù)和差異度指數(shù)題目a題b題c題d題e題吻合度指數(shù)67.33%74.38%70.29%42.36%74.74%差異度指數(shù)34.93%27.09%34.43%82.50%26.62%根據(jù)吻合度指數(shù),我們得到各題的網(wǎng)評成績與終評成績的排序為:e題b 題c題a題d題。即e題的網(wǎng)評成績與終評成績的相關(guān)性是最高的,d題的網(wǎng)評成績與終評成績相關(guān)度最低。根據(jù)差異度指數(shù)對各題的網(wǎng)評成績與終評成績的排序為:e題b 題c題a題d題。即e題的網(wǎng)評成績與終評成績的相關(guān)性是最高的,d題的網(wǎng)評成績與終評成績相關(guān)度最低。與根據(jù)吻合度指數(shù)得到的相關(guān)性結(jié)果相同。(2)統(tǒng)計學(xué)相關(guān)性指標(biāo)為了從統(tǒng)計學(xué)上度量網(wǎng)評成績與終評成績的相關(guān)性,我們定義一些相關(guān)性統(tǒng)計指標(biāo):person相關(guān)系數(shù)、spearman以及kendall tau-b等級相關(guān)系數(shù)。person相關(guān)系數(shù)是度量兩個向量線性相關(guān)程度的指標(biāo),定義為:,(5)其中。person相關(guān)系數(shù)的取值在-1和1之間,度量了向量和的相關(guān)性,當(dāng)為正且越大則表明網(wǎng)評成績與終評成績相關(guān)度越高;而越小并近似為零時,說明網(wǎng)評成績與終評成績相關(guān)度很低;當(dāng)為負(fù)數(shù)越大,說明網(wǎng)評成績與終評成績呈現(xiàn)負(fù)相關(guān)。若把向量和的分量進(jìn)行排序后得到秩向量,并根據(jù)秩向量定義相關(guān)系數(shù),這種相關(guān)系數(shù)稱為spearman相關(guān)系數(shù),定義為:,(6)其中分別為的秩。因為spearman相關(guān)系數(shù)是根據(jù)秩定義的,因此不受量綱的影響。 另外,我們定義kendall tau等級相關(guān)系數(shù)為,(7)其中為次序一致的個數(shù)。根據(jù)上述三種相關(guān)系數(shù)的定義,我們得到a、b、c、d、e題的結(jié)果如下表:.表3.8 不同方法下的相關(guān)性檢驗結(jié)果題目pearsonspearmankendall tau-ba0.75390.75200.6939b0.78830.80700.7524c0.71960.76210.7001d0.03730.03140.0284e0.8004081410.7586由表3.8可看出網(wǎng)評成績與最終成績呈正相關(guān),且a題、b題、c題和e題的相關(guān)系數(shù)都大于0.5,說明兩者有較強(qiáng)的相關(guān)性,其中b題的相關(guān)度最大。而d題的相關(guān)度最小。3.2 度量評委基本素質(zhì)指標(biāo)體系的建立本小節(jié)我們將建立評價評委的指標(biāo)體系。由于我們可用的數(shù)據(jù)僅為各評委所評論文的分?jǐn)?shù)以及該試卷的最終成績,為了度量評委的基本素質(zhì),我們從兩方面提出評價評委的指標(biāo)體系:評委所評試卷與他人評卷的差異,提出評閱寬嚴(yán)度指標(biāo)和評分偏離度指標(biāo)。該評委所評試卷的網(wǎng)評成績的獲獎等級與終評成績的差異,提出評委吻合度指數(shù)及評委差異度指數(shù)。(1)評閱標(biāo)準(zhǔn)的寬嚴(yán)度集中趨勢和離散趨勢是數(shù)據(jù)分布的兩個基本特征。集中趨勢反映了一組數(shù)據(jù)的中心位置,即一組數(shù)據(jù)的代表值。在專家網(wǎng)評過程中,集中趨勢反映的是評委對評分標(biāo)準(zhǔn)把握的寬嚴(yán)程度,即總的說來,其對論文的評定是偏松還是偏嚴(yán),但對寬嚴(yán)問題,我們首先要找到一個參照點(diǎn),然后把評委的評分與這個參照點(diǎn)比較,才可能確定其寬嚴(yán)程度。這里我們采取區(qū)間估計和假設(shè)檢驗的思想,若將所有評委對第份論文的評分看為一個總體,可假設(shè)該總體是服從正態(tài)分布的,且均值為該論文的實際成績。此時某個評委對該論文的評定成績可看為個體。若該個體與總體均值相差很大,則認(rèn)為該評委對論文的評定不是很準(zhǔn)確。因此,給定一個標(biāo)準(zhǔn),若,則表示該評委對論文的評審過寬;若,則表示該評委對論文的評審過嚴(yán),且越小代表該評委對論文的評審結(jié)果越準(zhǔn)確。定義為評委對第份論文網(wǎng)評結(jié)果的偏差。由于每位評委不只評一份論文,因此可用其平均偏差來度量評委的寬嚴(yán)度。因此給定標(biāo)準(zhǔn),若,則認(rèn)為評委偏松;若,則表示評委偏嚴(yán);若,則表示評委評閱寬嚴(yán)度適中。由于未知,我們?nèi)粲贸ピu委的其他三位評委的平均分來估計,令,其中表示除去評委的其他三位評委的平均分。因此,若,則可認(rèn)為評委相對其他評委偏松,若,則表示評委相對其他評委偏嚴(yán),若,則表示評委評閱寬嚴(yán)度適中。(2)評委評分偏離度根據(jù)評閱標(biāo)準(zhǔn)寬嚴(yán)的分析,絕對值度量了第個評委相對其他評委評分的偏離度。定義稱為評委的平均偏離度。該數(shù)值度量評委與其他評委評閱的差異。的值越小,表示評委相對其他評委的離差越小,可作為一個度量評委基本素質(zhì)的指標(biāo)體系。(3)評委吻合度指數(shù)根據(jù)問題1吻合度的定義,我們可對每位評委定義其評定吻合度,即可定義第位評委的吻合度指數(shù)為該評委評閱的所有論文的網(wǎng)評成績與最終成績完全吻合的論文份數(shù)在其評閱的所有論文中所占的比例。可作為評價每位評委基本素質(zhì)的一個指標(biāo)體系,某評委的吻合度指數(shù)越高,代表其評分更準(zhǔn)確。(4)評委差異度指數(shù)同樣地,根據(jù)問題1差異度指數(shù)的定義,我們可分別對每位評委定義其差異度指數(shù),即為該評委評閱的所有論文的網(wǎng)評成績與最終成績之差的絕對值的平均值。也可作為度量評委基本素質(zhì)的一個指標(biāo)體系。3.3 問題三的模型建立與求解根據(jù)上一節(jié)我們對評價評委基本素質(zhì)的指標(biāo)體系的分析可知,評閱標(biāo)準(zhǔn)的寬嚴(yán)指標(biāo)值并不能反映該評委的綜合素質(zhì),并且對原始分的標(biāo)準(zhǔn)化后基本能消除寬嚴(yán)度對論文評審的影響。下面我們根據(jù)評委評分偏離度、評委吻合度指數(shù)和評委差異度指數(shù)等三個指標(biāo)建立三個數(shù)學(xué)模型,來度量各評委的基本素質(zhì),并運(yùn)用于附件中的評審數(shù)據(jù)。(1) 評委評分偏離度指數(shù)如上面所分析的,我們可對第位評委建立評分偏離度模型:(8)其中表示除去評委的其他三位評委的平均分。越小,表示評委相對其他評委的差異越小。(2)評委吻合度指數(shù)根據(jù)問題1建立的模型及問題2建立的評價評委基本素質(zhì)的指標(biāo)體系我們可對每位評委分別建立其吻合度指數(shù)模型:,(9)其中為第位評委參加評閱的所有份論文中,網(wǎng)評成績與最終成績差值為零的個數(shù)。值越大,表示第位評委的網(wǎng)評成績更準(zhǔn)確。(3)評委差異度同樣引用問題1的記號,向量,其中表示第份試卷的網(wǎng)評成績與終評成績的等級差值,可能取值為0,1,2,3。我們定義差異度指數(shù)模型為:。(10)越小,表明第位評委的網(wǎng)評成績越有效,即與所評論文的真實水平更接近。根據(jù)上述三個評價評委基本素質(zhì)的數(shù)學(xué)模型,我們首先對a題計算每位評委的各評價指標(biāo)值并進(jìn)行排名,得到結(jié)果如下表3.9。表3.9 a題評委基本素質(zhì)指標(biāo)值及排名名次評委評委評委1a033.8278a060.7379a140.28432a063.8579a140.7255a130.28433a144.0571a130.7157a060.3014a074.0727a010.7129a030.31075a124.2725a020.71a010.31686a134.5206a090.6961a020.337a094.7778a040.69a090.33338a084.9844a030.6893a040.349a045.0244a100.6634a100.366310a025.2674a080.6569a080.372511a115.4333a070.65a070.3812a015.4468a120.6238a120.386113a056.7566a110.6078a110.411814a107.7309a050.5446a050.4752從上表中可以看出,從評委評分偏離度來看,最優(yōu)閱卷評委的前三名是a03,a06和a14,而從評委吻合度指標(biāo)排名的前三名則是a06,a14和a13,從評委差異度排名的前三名則為a14,a13和a06。因此選取不同的指標(biāo)對評委的評價得出的結(jié)論是不同的。若綜合考慮評委評分偏離度、評委吻合度和評委差異度三個指標(biāo)對評委用spss軟件進(jìn)行聚類分析,則可以得到下面的聚類圖3.3。圖3.3 a題評委聚類樹狀圖根據(jù)上面聚類圖,可將a題評委分為四類:優(yōu)秀,良好,中等和較差,結(jié)果如下表。表3.10 a題評委綜合三個指標(biāo)的聚類結(jié)果聚類等級優(yōu)秀良好中等較差評委序號a06,a14,a13,a01a02,a09,a04,a03,a08,a07,a12,a11a10a05同理,分別計算b題、c題、d題、e題的各指標(biāo)值并進(jìn)行排名(結(jié)果見附錄1),然后綜合三個指標(biāo)對評委的基本素質(zhì)進(jìn)行聚類(聚類圖見附錄2),能夠篩選出優(yōu)秀評委,結(jié)果如下:表3.11 bcde題評委綜合三個指標(biāo)的聚類結(jié)果聚類等級優(yōu)秀良好中等較差b題評委序號b19,b29,b30,b38,b42,b46,b54b03,b08,b11,b12,b13,b15,b22,b25,b26,b27,b28,b31,b37,b40,b45,b49,b50,b51,b52,b53b01,b02,b04,b05,b06,b07,b09,b10,b14,b16,b17,b18,b20,b21,b23,b24,b32,b33,b34,b35,b36,b39,b41,b43,b44,b47,b48,b55c題評委序號c12,c14,c17,c02,c09c11,c13,c15,c20,c03,c04c01,c10,c18,c05,c06,c07,c08c16,c19d題評委序號d01,d06,d07,d12,d19,d33,d35,d41,d44,d45,d46,d51d03,d05,d10,d16,d24,d26,d29,d36,d37,d40,d42,d49,d54,d55,d57,d63,d64,d68d02,d04,d08,d09,d11,d13,d20,d21,d22,d25,d27,d28,d31,d32,d34,d38,d39,d43,d47,d48,d50,d52,d53,d56,d58,d59,d60,d62,d65,d66,d69d14,d15,d17,d18,d23,d30,d61,d67e題評委序號e07,e09,e18,e19,e20,e21,e30,e38e01,e02,e03,e22,e23,e26,e27,e32e04,e05,e06,e10,e11,e12,e13,e15,e16,e17,e24,e28,e29,e31,e35,e36,e37e08,e14,e25,e33,e34根據(jù)上面的聚類結(jié)果,我們?nèi)菀椎玫礁黝}評委的素質(zhì)表現(xiàn),并對評委的表現(xiàn)進(jìn)行評價或者評選優(yōu)秀評委。3.4 問題四模型建立與求解本節(jié)主要解決五個不同題目的評委的整體表現(xiàn)之間是否存在顯著性差異,我們可根據(jù)問題3中各評委的評價指標(biāo)得分運(yùn)用方差分析的方法進(jìn)行判斷。有關(guān)方差分析的方法可參考文獻(xiàn)7。由于進(jìn)行方差分析要滿足一些基本假定,即正態(tài)性、方差齊性、獨(dú)立性假設(shè),由于各評委評分是相互獨(dú)立的,因此獨(dú)立性假設(shè)滿足。下面我們首先對指標(biāo)得分進(jìn)行正態(tài)性及方差齊性檢驗。以評委的評分偏離度為例,我們將abcde看成五個總體,每個總體中若干個評委的評分偏離度看成總體的獨(dú)立同分布樣本,設(shè)不同題目的樣本容量分別為,樣本分別為,表示第題第位評委的評分偏離度。首先運(yùn)用matlab軟件對五個題目的評委評分偏離度畫出相應(yīng)的qq-plot(分位數(shù)-分位數(shù)圖),如圖3.4,其中不同的圖形標(biāo)記代表不同題目對應(yīng)的qq-plot。圖3.4 評委評分偏離度的正態(tài)性檢驗qq-plot從上面的qq-plot可以看出,這五個題目的評分偏離度的qq-plot都近似為直線,因此可以假設(shè)這些總體的評分偏離度都服從正態(tài)分布。同樣的,可畫出評委的吻合度指數(shù)及差異度指數(shù)的qq-plot,如圖3.5-3.6,由圖可看出不同題目下,這兩個指標(biāo)的qq-plot都近似為直線,因此,也可以假設(shè)這些總體的吻合度指數(shù)及差異度指數(shù)都服從正態(tài)分布。且由吻合度指數(shù)的qq-plot可看出d題的吻合度指數(shù)明顯大于其他題目的。圖3.5 評委吻合度指數(shù)的正態(tài)性檢驗qq-plot圖3.6 評委差異度指數(shù)的正態(tài)性檢驗qq-plot下面進(jìn)行方差齊性檢驗。同樣以偏離度為例,設(shè)第個題目(總體)的評分偏離度服從正態(tài)分布。為了對五個總體的均值進(jìn)行方差分析,我們首先做下面的方差齊性檢驗: vs 方差齊性檢驗有多種方法,最常用的是bartlett檢驗,檢驗統(tǒng)計量為,(11)其中,為因子水平數(shù),為第題目的樣本方差,為自由度,為組內(nèi)偏差平方和,表達(dá)式為。對給定的顯著性水平,我們做上述檢驗,結(jié)果如表3.12:表3.12 各評價指標(biāo)的方差齊性檢驗結(jié)果統(tǒng)計量df1df2顯著性偏離度1.4284191.226吻合度1.7404191.143差異度4.8404191.011因此該檢驗的為0.226,顯然大于0.05,根據(jù)假設(shè)檢驗的思想,則接收原假設(shè),即可認(rèn)為這五個總體的方差相等。同樣的,對另外兩個指標(biāo)得分做方差齊性檢驗,得到結(jié)果如表3.12,認(rèn)為這五個總體的吻合度得分及差異度得分的方差均相等。設(shè)第個題目(總體)的評分偏離度服從正態(tài)分布。即各個總體的評分偏離度具有相同的方差。為了說明不同題目(總體)在評分偏離度上的表現(xiàn),則我們的目標(biāo)是檢驗下面的假設(shè): vs 從統(tǒng)計學(xué)上看,將這五個題目的總體看成評委評分偏離度的五個水平,因此為了檢驗,實際上就是對這五個總體做方差分析。根據(jù)樣本數(shù)據(jù),運(yùn)用spss對上述假設(shè)做方差分析,得到方差分析表如下:表3.13評委評分各指標(biāo)的方差分析結(jié)果平方和df均方f顯著性偏離度組間28.50847.12714.016.000組內(nèi)97.121191.508總數(shù)125.630195吻合度組間4.30341.076575.886.000組內(nèi).357191.002總數(shù)4.660195差異度組間12.96143.240860.826.000組內(nèi).719191.004總數(shù)13.680195由上表可看出值均為零,因此拒絕原假設(shè)。即認(rèn)為不同題目的評委在評分偏離度、吻合度、差異度上的表現(xiàn)均存在顯著性差異。為了分析題目兩兩之間的差異,我們進(jìn)行多重比較,即做下面的假設(shè)檢驗: 由于不同題目的樣本容量不同,我們采用重復(fù)數(shù)不等情況的s法,這是scheffe在1953年提出的多重比較法。若給定顯著性水平,令,.當(dāng)時,拒絕原假設(shè),即認(rèn)為題目與題目的評委之間存在顯著性差異,否則保留原假設(shè),認(rèn)為兩題的評委之間不存在顯著性差異。我們運(yùn)用spss對不同題目兩兩之間進(jìn)行檢驗,得到結(jié)果如表3.14。表3.14各題目之間偏離度方差分析表題目f值p值題目f值p值ab13.430.000bd1.370.244ac.078.782be.955.331ad18.764.000cd39.211.000ae15.094.000ce36.152.000bc30.613.000de.003.960由表可得出,從偏離度角度分析,ab、ad、ae、bc、cd、ce題目的評委整體表現(xiàn)存在顯著性差異,ac、bd、be、de題目的評委之間不存在顯著性差異。因此,我們可判斷ac題目評委之間不存在顯著性差異,bde題目的評委之間不存在顯著性差異。由此分析可能產(chǎn)生顯著性差異的原因,可以從兩個方面考慮:一方面是客觀環(huán)境的因素,即評閱ac題目的評委與評閱bde題目的評委在不同的環(huán)境下評閱。另一方面,注意到不同的題目的難度不同,在評閱時可能引起的評委之間的分歧也不同。均方很小的題目表明評委在評閱時產(chǎn)生的分歧比較小,而均方較大的題目表明題目的難易程度有較大差別,導(dǎo)致評委在評閱試卷時產(chǎn)生的分歧較大,也說明題目的題型傾向于更加靈活。類似地,我們可以對五個題目兩兩之間的評委吻合度和評委差異度做方差分析,得到結(jié)果分別如表3.15及表3.16,分析兩種結(jié)果均與從偏離度角度分析的結(jié)果相同。表3.15 各題目之間吻合度方差分析表題目f值p值題目f值p值ab24.142.000bd.991.301ac3.840.059be.169.682ad341.556.000cd672.379.000ae35.095.000ce23.622.000bc13.560.000de.725.547表3.16 各題目之間差異度方差分析表題目f值p值題目f值p值ab24.815.000bd.916.361ac.002.963be.225.637ad475.693.000cd643.595.000ae38.429.000ce44.857.000bc32.254.000de.292.6113.5.問題五的數(shù)學(xué)模型問題5中要求分析網(wǎng)評成績加入總成績的利弊,并對如何更有效地利用網(wǎng)評成績給出相應(yīng)的結(jié)論。在目前的方案中,集中評審階段每份論文由三位評委按“百分制”獨(dú)立評審,把每位評委的給出的分?jǐn)?shù)全部換算成標(biāo)準(zhǔn)分,然后將每份論文的三個標(biāo)準(zhǔn)分與網(wǎng)評中該論文的平均標(biāo)準(zhǔn)分加在一起,求得的平均分就作為該論文的最終成績。設(shè)第份論文的最終標(biāo)準(zhǔn)成績?yōu)?,集中評審的成績標(biāo)準(zhǔn)分為,則現(xiàn)在方案的最終成績可用下面的公式來表述:其中 分別表示第份論文在集中評審階段由三位評委給出成績換算得到的標(biāo)準(zhǔn)分, 表示第份論文在集中評審階段由三位評委給出成績的平均標(biāo)準(zhǔn)分。根據(jù)上式,最終成績實際上是網(wǎng)評平均成績和終評平均成績的加權(quán)平均,且網(wǎng)評平均標(biāo)準(zhǔn)分在最終成績中所占的權(quán)重因子為 。為了進(jìn)一步分析將網(wǎng)評成績在最終成績中所起的作用,定義最終成績?yōu)? 其中權(quán)重因子的取值范圍為 。從上面公式中可以看出,當(dāng)增大時,意味著第份論文的網(wǎng)評平均標(biāo)準(zhǔn)分對總成績的影響會增大,反之,當(dāng)減小時,意味著第份論文的網(wǎng)評平均標(biāo)準(zhǔn)分對總成績的影響會減小。特別地,當(dāng)時,說明網(wǎng)評成績不加入總成績,第份論文的最終成績只由集中評審階段的三位評委的平均標(biāo)準(zhǔn)分決定。當(dāng) 時,只考慮第份論文的網(wǎng)評平均標(biāo)準(zhǔn)分,不考慮集中評審階段的平均標(biāo)準(zhǔn)分。顯然,的選取對終評成績具有很大的影響。那么,如何選取最優(yōu)的權(quán)重因子呢?的選取又跟那些因素有關(guān)?下面我們建立權(quán)重因子的貝葉斯模型,探討網(wǎng)評成績對終評成績的影響。假設(shè)某份論文的真實成績?yōu)?,由于論文成績的異質(zhì)性(參考文獻(xiàn)3),假設(shè)本身也是隨機(jī)變量,服從正態(tài)分布。一般地,假設(shè)在網(wǎng)評階段有位評委對該論文進(jìn)行評分,則在給定條件下,第個評委對該論文所評的網(wǎng)評標(biāo)準(zhǔn)分相互獨(dú)立并服從,;而在集中評審時有位評委對論文進(jìn)行評分,且假設(shè)其評分標(biāo)準(zhǔn)成績相互獨(dú)立且服從,。假設(shè)網(wǎng)評成績在終評成績中所占比例為,即終評成績?yōu)椋渲校?即是的一個加權(quán)估計。我們求解下面的最優(yōu)化問題.定理1:在上面的模型中,網(wǎng)評成績在終評成績中所占的最優(yōu)比例為.(12)因此論文真實分?jǐn)?shù)的最優(yōu)估計為.(13)證明:令,對關(guān)于求導(dǎo)并令導(dǎo)數(shù)為零,可解出最優(yōu)權(quán)重為.根據(jù)條件期望公式有,以及.因此可得.證畢。從定理1可以看出,影響權(quán)重因子的因素包括:(a)每份論文的網(wǎng)評評委個數(shù);(b)每份論文的集中評審評委個數(shù);(c)網(wǎng)評評委的方差;(d)集中評審評委的方差;(e)試卷分?jǐn)?shù)本身的方差。根據(jù)的表達(dá)式,我們得到下面的結(jié)論。推論1:網(wǎng)評成績的權(quán)重因子可以表達(dá)為是的增函數(shù),即網(wǎng)評的評委個數(shù)越多,則網(wǎng)評成績所占的比重越大。這是符合實際情況的。因為網(wǎng)評的評委越多,則評審出來的成績就更加真實,具有代表性。推論2:網(wǎng)評成績的權(quán)重因子是網(wǎng)評專家的評分方差的減函數(shù),是集中評審專家的評分方差的增函數(shù)。顯然,方差在某種意義上代表了評審專家的評閱水平,方差越小表示該評委專家的評分越準(zhǔn)確。因此網(wǎng)評專家的水平越高則應(yīng)對網(wǎng)評成績賦予更大的權(quán)重,反之集中評審專家的水平越高則應(yīng)對網(wǎng)評成績賦予更小的權(quán)重。 推論3:網(wǎng)評成績的權(quán)重因子是試卷分?jǐn)?shù)本身方差的增函數(shù)。根據(jù)定理1和以上三個推論,我們可以根據(jù)具體的情況設(shè)計最優(yōu)的權(quán)重因子,使得最終的成績評價更加合理。當(dāng)然,由于中的方差,和是未知的,若有集中評審的數(shù)據(jù),則可根據(jù)貝葉斯統(tǒng)計的方法對這些參數(shù)進(jìn)行估計。可參考文獻(xiàn)8-9。四、模型的推廣及優(yōu)缺點(diǎn)分析本文對某競賽網(wǎng)評的結(jié)果建立了數(shù)學(xué)模型,并討論了網(wǎng)評成績與終評成績的相關(guān)度,根據(jù)評審數(shù)據(jù)分析了網(wǎng)評的評委專家的綜合素質(zhì),最后給出了分析了網(wǎng)評成績加入總成績的利弊,利用貝葉斯統(tǒng)計的方法建立了網(wǎng)評成績在總成績中的最優(yōu)權(quán)重模型,得到了最優(yōu)權(quán)重的確定方法。本模型可推廣到人才選拔、公司招聘、公務(wù)員錄用等相關(guān)領(lǐng)域。本模型不僅給出了競賽論文的網(wǎng)評成績的定性分析,更重要的是從數(shù)學(xué)上建立了模型,定量分析了網(wǎng)評成績與最終成績的相關(guān)度,定量分析了評委的綜合素質(zhì)情況,還建立了網(wǎng)評成績的最優(yōu)占比模型,在實際中直接運(yùn)用。然而,本題沒有給出論文的集中評審數(shù)據(jù),使得無法估計出最優(yōu)權(quán)重中的方差參數(shù),僅僅能分析得到影響網(wǎng)評成績的最優(yōu)權(quán)重的因素。參考文獻(xiàn)1 何曉群.多元統(tǒng)計分析(第二版)m.北京:中國人民大學(xué)出版社,2008.9.2 趙海燕,芮男.雙評作文題網(wǎng)上閱卷評卷教師評卷水平評價維度的確定j.評價與測量,2009(02):12-17.3 姚澤清,鄭旭東,趙穎.全國大學(xué)生數(shù)學(xué)建模競賽題與優(yōu)秀論文評析m.北京:國防工業(yè)出版社,2012.4 方道元,韋明俊.數(shù)學(xué)建模:方法導(dǎo)引與案例分析m.浙江大學(xué)出版社2011.5 姜啟源,謝金星,葉俊.數(shù)學(xué)模型(第4版)m.高等教育出版社,2011.6 汪曉銀,鄒庭榮,周保平.數(shù)學(xué)軟件與數(shù)學(xué)實驗(第二版)m,北京:科學(xué)出版式,2012.8.7 周紀(jì)薌,茆詩松.質(zhì)量管理統(tǒng)計方法(第二版)m.中國統(tǒng)計出版社,2008.10.8 鄭駿.貝葉斯(bayes)學(xué)派的統(tǒng)計思想j. 數(shù)學(xué)通報. 1994(07):36-38.9 王洪春.貝葉斯公式與貝葉斯統(tǒng)計j. 重慶科技學(xué)院學(xué)報(自然科學(xué)版). 2010,12(03):203-205.附錄附錄1:bcde四題的評委基本素質(zhì)指標(biāo)值及排名b題評委基本素質(zhì)指標(biāo)值及排名名次評委評委評委名次評委評委評委1b552.5867b450.86b450.1429b454.0369b330.74b210.272b093.2309b220.8416b220.168330b234.1425b470.74b070.27183b243.2457b260.8317b260.168331b514.1721b160.7353b160.27454b173.3048b400.8317b400.168332b314.1724b300.7353b300.28435b443.3888b130.8218b130.19833b084.1892b480.7327b350.28716b413.3896b520.8b520.234b274.2314b070.7282b470.297b023.4701b150.7941b280.205935b344.3292b090.7255b140.298b203.5131b280.7941b150.215736b054.3424b340.7228b340.2979b363.5381b120.79b120.2237b504.3471b350.7228b060.310b073.5559b080.78b080.2238b134.3721b060.72b090.303911b483.5766b190.78b190.2339b224.4188b140.72b170.303912b333.5886b420.78b420.2340b164.432b360.72b180.303913b323.6454b010.7723b290.230841b154.4346b170.7157b480.306914b253.6507b020.7723b020.237642b354.5633b180.7157b360.3115b143.6689b430.77b550.237643b114.5892b390.7129b320.3116b043.7672b290.7692b430.2444b264.6421b200.7059b200.313717b533.774b240.7677b100.245145b464.7277b110.703b390.316818b183.7747b100.7647b010.247546b124.7605b270.703b270.316819b013.8195b460.7647b380.247547b034.8016b490.703b110.326720b283.8568b380.7624b240.252548b495.0935b320.7b510.3321b473.8628b550.7624b230.257449b375.0989b510.69b490.336622b213.8908b540.7549b040.257450b425.1799b030.6832b030.336623b103.9078b230.7525b050.257451b195.2049b370.6765b310.346524b393.9308b210.75b440.2652b385.2235b310.6733b530.346525b063.9693b440.75b330.2653b545.4769b250.6634b250.356426b433.9716b410.7451b460.264754b305.55
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)品開發(fā)進(jìn)度跟蹤表-新產(chǎn)品開發(fā)流程
- 薪資詳情與獎金補(bǔ)助證明書(6篇)
- 移民招聘考試試題及答案
- 醫(yī)院中級考試試題及答案
- 六一創(chuàng)意集體活動方案
- 六一夾珠子活動方案
- 醫(yī)學(xué)考試試題及答案詳解
- 六一扶貧活動方案
- 六一校園集體活動方案
- 六一活動小食品活動方案
- 通信員工安全試題及答案
- 2025年洗紋身協(xié)議書
- 工會廠務(wù)公開課件
- 桃花源記的試題及答案
- 工廠計件獎罰管理制度
- GA/T 2014-2023道路交通信號配時運(yùn)行管理規(guī)范
- 【9語二?!勘本┦袞|城區(qū)2025年6月份中考二模語文試卷
- 2025年湖南省普通高中學(xué)業(yè)水平合格性考試仿真(三)數(shù)學(xué)試卷(含答案)
- 2025黑龍江省交通投資集團(tuán)限公司招聘348人易考易錯模擬試題(共500題)試卷后附參考答案
- 江蘇省南京2022年中考?xì)v史試卷(解析版)
- 《老年人認(rèn)知記憶訓(xùn)練》課件
評論
0/150
提交評論