版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
--基于模糊集與聚類分析的大學生成績影響因素的研究摘要隨著教育的發(fā)展與普及,大學生也越來越多,1949年,新中國成立,全國大學生人數(shù)僅有11.7萬;1978年,改革開放,全國大學生人數(shù)增長到86.7萬;而去年,中國大學生在校人數(shù)達到3700萬![1]隨著大學生人數(shù)的快速增長,暴露出來的問題也越來越多,如:學科專業(yè)的設置優(yōu)化不夠好,科研水平不夠強,成果轉(zhuǎn)化率不夠高。事實上,這類問題直接或間接的和大學生的綜合素質(zhì)、學習能力和科研能力。然而,由于網(wǎng)絡的普及,創(chuàng)造了豐富的垃圾網(wǎng)絡,同時由于大學生思想懈怠的原因,學生的整體素質(zhì)有所下降。而最直觀反應出大學生的整體素質(zhì)與能力無疑就是其平時考試的成績,而影響大學生的最終成績的因素也是多種多樣的,找出這些因素及其影響方式,并在這些地方進行優(yōu)化與發(fā)展,可以明顯提升大學生的綜合素質(zhì)與能力本文選取13個可能存在的影響成績的因素,首先對收集的數(shù)據(jù)進行模糊化處理,隨機選取數(shù)據(jù),進行屬性值的初始化處理,然后對處理后的數(shù)據(jù)進行主成分分析及聚類分析,最后找出影響大學生成績的主要因素和次要因素。關鍵詞:學生成績;影響因素;模糊集;聚類分析;主成分分析;方差分析
TheStudyofLoanPricinginCommercialBankwithRAROCModelAbstractWiththedevelopmentandpopularizationofeducation,therearemoreandmorecollegestudents.In1949,thePeople'sRepublicofChinawasestablished,andthenumberofcollegestudentsnationwidewasonly117,000;in1978,thenumberofcollegestudentsnationwideincreasedto867,000;Thenumberofschoolsreaches37million![1]Withtherapidincreaseinthenumberofcollegestudents,moreandmoreproblemshavealsobeenexposed,suchas:theoptimizationofthesettingofdisciplinesisnotgoodenough,thelevelofscientificresearchisnotstrongenough,andtheconversionrateofresultsisnothighenough.Alltheseproblemshaveadirectorindirectrelationshipwiththeoverallqualityofcollegestudents,learningabilityandscientificresearchability.However,duetothepopularityoftheInternet,thecreationofInternetspam,andtheslackingofcollegestudents’thoughts,theoverallqualityofcollegestudentshasdeclined.Themostintuitivereflectionoftheoverallqualityandabilityofcollegestudentsisundoubtedlytheirusualtestscores,andthefactorsthataffectthefinalscoreofcollegestudentsarealsodiverse.Findoutthesefactorsandtheirimpactmethods,andoptimizeanddevelopintheseplaces,Cansignificantlyimprovetheoverallqualityandabilityofcollegestudents.Thisarticleselects13possiblefactorsthataffectperformance,firstfuzzifiesthecollecteddata,randomlyselectsthedata,initializestheattributevalues,thenperformsprincipalcomponentanalysisandclusteranalysisontheprocesseddata,andfinallyfindsOutofthemainfactorsandsecondaryfactorsthataffecttheperformanceofcollegestudents.KeyWords:Studentperformance;influencingfactors;fuzzyset;clusteranalysis;principalcomponentanalysis;varianceanalysis目錄1緒論 11.1課題背景及意義 11.2國內(nèi)外研究現(xiàn)狀 21.2.1國外相關研究現(xiàn)狀 21.2.2國內(nèi)相關研究現(xiàn)狀 31.3論文的內(nèi)容 42商業(yè)銀行貸款定價的理論與發(fā)展 62.1貸款定價的理論基礎 62.1.1古典利率理論 62.1.2凱恩斯的流動性偏好理論 62.1.3新古典可貸資金利率理論 72.2貸款定價理論的發(fā)展 72.2.1成本加成定價模型 72.2.2價格領導模型 82.2.3客戶盈利性分析模型 93RAROC貸款定價模型及修正 103.1RAROC貸款定價模型 103.2RAROC貸款定價模型的修正 123.2.1“經(jīng)濟資本占用成本”風險因子的修正 123.2.2基于巴塞爾協(xié)議Ⅲ的修正 133.2.3預期損失和經(jīng)濟資本的確定方法 144RAROC模型修正后的實證分析 174.1模擬案例 174.2單筆初始RAROC貸款定價 174.3修正后的單筆RAROC貸款定價 20結論 22致謝 23參考文獻 24附錄 26目錄按章、節(jié)、條三級標題編寫,要求標題層次清晰。目錄中的標題要與正文中標題一致。目錄中應包括緒論、論文主體、結論、致謝、參考文獻、附錄等。1緒論1.1課題背景及意義隨著我國高校教育改革的不斷深入,全國大部分高校的招生規(guī)模迅速發(fā)展,招生專業(yè)和招生人數(shù)都大幅增加。近年來,隨著高等教育的普及、平民化進程的加快,特別是自1999年以來,全國高校大面積擴招,使大學教育的方式由精英式教育變?yōu)榇蟊娀逃?,導致大學生數(shù)量急速增長,然而,高等教育的質(zhì)量不容樂觀。目前,為了適應市場經(jīng)濟的要求,各高校都正面臨著一個難題——改革,而高校體制改革中的核心環(huán)節(jié)是教學資源管理制度的改革。教學管理水平的強弱,直接影響著課堂教學環(huán)境質(zhì)量的提升,從而影響到人才培養(yǎng)的進程。而各地方新建的本科院校,大多是由多個兄弟院校合并而成,整頓資源后的高校在招生專業(yè)和招生人數(shù)上都急劇攀升,可是管理水平卻滯后許多。高等教育的發(fā)展前途堪憂,特別是地方高校,面臨著教師人才隊伍的流失及信息的滯后,想要快速發(fā)展和提升,路還漫漫。進入地方本科院校的大學生,首先,和其他院校的學生一樣,大學生活更加豐富多彩,人際關系也復雜。但是,地方高校的學生相比于重點大學、綜合性大學的學生,高考成績較差,大學起點較低。另外,市場對人才的需求隨著市場經(jīng)濟的發(fā)展也發(fā)生著翻天覆地的變化,沒有響亮的名牌稱號,沒有一技之長,特別是中國教育主要還是以成績來衡量的體制下,學生的學業(yè)成績尤顯重要。學生沒有好的學業(yè)成績,就業(yè)難度增加,心理問題加大。正是在這種背景下,大學生學業(yè)成績的影響因素成為眾多教育研究者的關注熱點,各種觀點和爭論也層出不窮。在這種情況下,需要運用教育學、統(tǒng)計學、經(jīng)濟學的理論視角,對此問題進行深入的研究、理性的思考和客觀冷靜的判斷。眾所周知,人們的普遍觀點是:人生的第一個大的轉(zhuǎn)折點就是高考,以前有“高考改變命運”“鯉魚躍龍門”等說法,說的就是通過高考,改變自己的出身。高考成績作為進入大學的唯一依據(jù),其作用不言而喻??忌虾玫拇髮W,前途無量。但現(xiàn)在隨著高校招生的大眾化,高考成績優(yōu)異的學生在大學的學習未必能取得較好的學業(yè)成績。本科階段學習成績的好壞直接影響到學生的全面發(fā)展及綜合能力的提升。高考成績和大學成績的相關性問題的研究上,可以研究高考成績對大學學業(yè)成績的影響狀況,可在一定程度上反映出大學學習情況,指導教師教學,學生學習等。本研究主要從高考成績和大學學業(yè)成績相關性及對大學生成績與高考成績的回歸分析兩方面進行數(shù)據(jù)的研究分析,從而探討其間的關聯(lián)性及影響程度,提出建設性的意見。探討學業(yè)成績與高考成績的相關性問題作為本研究的首要問題。此外,高考時填報的專業(yè)志愿也極大地影響著大學生的學業(yè)成績,專業(yè)志愿的填報很大程度上反映出學生對該專業(yè)的向往程度,從而影響著大學生進入大學后的學習狀態(tài)。經(jīng)筆者了解到,有些學生由于奉父母之命填報某專業(yè)就讀,進入大學后想要轉(zhuǎn)入自己喜愛的專業(yè),父母也不同意,礙于父母父母的影響,仍留在原專業(yè)讀,專業(yè)課成績掛起了紅燈,導致畢業(yè)都成問題。還有很多的高考生在填報高考志愿時具有較大的盲目性,不是根據(jù)自己的優(yōu)勢填報自己適合的專業(yè),而是盲目的跟風填報社會熱門專業(yè),導致熱門專業(yè)更熱門,冷門專業(yè)更無人問津的局面。有些高考生對自己的優(yōu)勢和劣勢也看不太清楚,對大學和專業(yè)認識不清。很難做出準確的抉擇。有調(diào)查顯示,如果學生能有一個自由和開放的專業(yè)選擇機會,學生們往往會選擇他們熱愛的專業(yè)就讀,獲得更好的學業(yè)成績。相反,則會因為沒有專業(yè)興趣而逃學、厭學,無法繼續(xù)學習下去,無法獲得相應學分,甚至不能順利畢業(yè)等。本研究提出的問題:高考填報的專業(yè)志愿與大學學業(yè)成績的關系如何?專業(yè)志愿生與調(diào)劑生的大學學業(yè)成績?nèi)绾??高校在教育管理和教學改革中應采取怎樣的措施來幫助學生提高學業(yè)成績?1.2國內(nèi)外研究現(xiàn)狀目前國內(nèi)外在研究大學生學業(yè)成績方面進行了比較系統(tǒng)的研究,主要集中在以下方面:有學生學習態(tài)度方面與學業(yè)成績的研究;有學生心理研究;有對專業(yè)的偏好程度與學業(yè)成績的研究;有家庭環(huán)境對學業(yè)成績的影響研究;有智力因素和非智力因素對學生學業(yè)成績影響的研究等。大學生課程成績及其影響因素向來為教育界所關注,國內(nèi)外有不少學者從不同角度分析了各種因素對大學生課程成績的影響情況,如:Angus、武錫環(huán)等運用回歸分析法討論了各種人格因素以及學生個性對其學習成績的影響:汪朝杰、張文穎等運用相關性分析和回歸分析探討了生源地、性別、高考成績等因素對大學生學習成績的影響:祝振兵、王普霞用回歸分析法、顯著性檢驗法與驗證性因素分析研究了課堂公正以及大學生學習方式對其學習成績的影響:劉巧芝、楊云蘇等分別設立了學習目的、學習態(tài)度等八因素模型以及數(shù)學自我效能、數(shù)學焦慮等三因素模型,運用相關分析法等方法分析了上述因素對大學生學習成績的影響。但是上述文獻往往是預先設定某一個方面或某幾個方面的因素,然后運用各種方法實證分析預設因素是否對大學生學習成績有影響以及有影響的因素影響程度大小,缺少客觀地提取成績影響因子的研究。張雪霞雖從預設因素中運用因子分析和方差分析法提取出了4個學習成績的主要影響因素,但其預設因素涉及的方面比較窄,僅涉及學風、教風以及考風等3方面。[2]1.3論文的內(nèi)容本文一共分為六個部分。第一部分為緒論,主要鋪敘了研究內(nèi)容、文獻綜述、研究途徑與研究工具、研究意義。明確研究內(nèi)容為大學生學習成績受個人、學校和家庭3個層面各種因素的影響。第二部分主要介紹本文所運用的一些數(shù)據(jù)處理的研究基礎,例如模糊集與隸屬函數(shù)的概念、聚類分析及數(shù)據(jù)結果所依據(jù)的理論等。并運用模糊數(shù)學、模糊聚類分析、聚類分析和主成分分析法從預設的潛在成績影響因素中提取出13個主要影響因子。對研究所依據(jù)的數(shù)學模型和數(shù)據(jù)分析原理進行詳細說明。第三部分為本文的重點部分。對不同高校、不同年級本科學生的高考成績和學業(yè)成績進行數(shù)據(jù)處理分析,運用數(shù)據(jù)挖掘中的聚類分析技術可以從這些數(shù)據(jù)集中提取因素的分類知識。首先通過對不同類型原始數(shù)據(jù)的模糊處理,建立不同的隸屬函數(shù)進而將數(shù)據(jù)初始化,再通過歐幾里得距離公式建立模糊矩陣,進而用模糊聚類分析技術對這些不確定性數(shù)據(jù)進行較切合實際的數(shù)學描述,從而能較好地處理影響因素的分類問題。第四部分通過模擬案例對修正后的RAROC貸款定價模型進行了實證分析,將修正后的結果與修正前的結果進行了對比。第四部分利用主成分分析、聚類分析與因子分析相結合的方法,既有利于分析主成分的意義,又可以消除變量間的相互影響,比較適合如本篇論文所研究的這類影響因素較多的降維問題.本文中首先對預設的13種因素進行R型聚類;再對各因素進行主成分分析,并從每一類因素中提取主成分,最后將各類主成分合成以得到大學生學習成績主要影響因子。通過對學業(yè)成績與高考成績的多元線性回歸分析,進一步分析成績對大學學業(yè)成績的影響程度。第五部分也為論文的主體部分,本章將進一步對第四部分分析出來的六個因素組進行方差分析,通過方差分析的方法,在六個因素組中分別尋找其中對于大學生學習成績影響最大的因素,從而完成本篇論文的主要目的,尋找影響大學生學習成績的主要因素。第六部分既為結論部分,總結全文并概括研究結論,并提出提高高校本科生學業(yè)成績的有效措施。2研究基礎2.1模糊集2.1.1定義首先給定一個論域,那么從到單位區(qū)間[0,1]的一個映射,稱為上的一個模糊集,或的一個模糊子集。映射(函數(shù))叫做模糊集的隸屬函數(shù):對每個,叫做元素對模糊集的隸屬度。的值越接近于1,表示隸屬于的程度越大;的值越接近于0,表示隸屬于的程度越小。2.1.2表示方法模糊集的常用表示法有下述幾種:(1)解析法,也即給出隸屬函數(shù)的具體表達式。(2)Zadeh記法,例如。分母是論域中的元素,分子是該元素對應的隸屬度。有時候,若隸屬度為0,該項可以忽略不寫。(3)序偶法,例如,序偶對的前者是論域中的元素,后者是該元素對應的隸屬度。(4)向量法,在有限論域的場合,給論域中元素規(guī)定一個表達的順序,那么可以將上述序偶法簡寫為隸屬度的向量式,如。2.2隸屬度函數(shù)2.2.1定義論域中的任一元素,都有一個數(shù)與之對應,則稱為上的模糊集,對于,我們就稱之為對的隸屬度。當在中發(fā)生變動時,就是一個函數(shù),稱為的隸屬函數(shù)。隸屬度的大小離1越接近,表示屬于的程度越高;相反的,的大小離0越接近,表示屬于的程度越低。用取值于區(qū)間的隸屬函數(shù)定量表示屬于的程度高低。隸屬度屬于模糊數(shù)學評價函數(shù)里的概念:模糊綜合評價方法是一種對受多種因素影響的事物做出全面評價的較為優(yōu)秀的多因素決策方法,評價結果不是絕對地肯定或否定,而是以一個模糊集合來表示就是它的特點。[3]2.2.2基本分類模糊控制應用的基礎是隸屬度函數(shù),能否用好模糊控制的關鍵之一就是能否構造準確的隸屬度函數(shù)。雖然說隸屬度函數(shù)的確定過程應該是不帶主觀因素的,但不同的人對于同一個模糊概念的理解又各不相同,所以,隸屬度函數(shù)的確定又不可避免的帶有部分主觀因素。隸屬度函數(shù)的確立迄今為止還并沒有一套成熟的方法,大多數(shù)系統(tǒng)仍舊是在經(jīng)驗與試驗的基礎上確立的。所以,不同的人針對同一個模糊概念會建立不完全相同的隸屬度函數(shù),盡管隸屬度函數(shù)不完全相同,但只要反映的模糊概念相同,在處理實際模糊信息的問題中仍然殊途同歸,可以得到一個相同的結果。下面介紹幾種較為常用的方法:(一)隸屬度函數(shù)模糊統(tǒng)計模糊統(tǒng)計法的基本思想是:在論域上有一個確定元素和一個可變動的清晰集合,對于確定元素是否屬于清晰集合作出清晰的判斷。雖然不同的試驗者確定的清晰集合的邊界不同,但確定的不同邊界都對應于同一個模糊集。模糊統(tǒng)計法的計算步驟是:在每次統(tǒng)計中,固定,相對的,變化的值,作n次試驗,按下式進行計算統(tǒng)計結果:對的隸屬頻率=的次數(shù)/試驗總次數(shù)n隸屬頻率隨著n的增大會逐漸趨向穩(wěn)定,對的隸屬度值就是這個穩(wěn)定值。模糊概念中的隸屬程度可以通過這種方法較直觀地反映,但相對于其較為簡單的算法,它的計算量會相當大。[4](二)專家經(jīng)驗根據(jù)有經(jīng)驗的人的實際經(jīng)驗給出模糊信息的處理算式或相應權系數(shù)值來確定隸屬函數(shù)的另一種行之有效的方法——專家經(jīng)驗法。在大多數(shù)情況下,首先初步確定一個較為接近最后結果的隸屬函數(shù),然后再通過“學習”和實踐檢驗逐步修改和完善,最后的得出較為準確的隸屬函數(shù),而每次實踐的結果正是檢驗和調(diào)整隸屬函數(shù)的依據(jù)。(三)隸屬度函數(shù)二元對比排序第三種方法是一種更加較實用的確定隸屬度函數(shù)的方法——二元對比排序法。它通過對多個事物之間的兩兩對比來確定某種特征下的順序,由此來決定這些事物對該特征的隸屬函數(shù)的大體形狀。根據(jù)對比測度不同,二元對比排序法可分為相對比較法、相似優(yōu)先對比法、優(yōu)先關系定序法和對比平均法等2.3聚類分析2.3.1定義聚類分析是指簡化數(shù)據(jù)對象的集合分組為由類似的對象組成的多個類的分析過程。聚類(Clustering)就是一種尋找數(shù)據(jù)之間內(nèi)在結構的技術,其把全體數(shù)據(jù)實例組織成一些被稱作為簇的相似組。處于同一個簇中的數(shù)據(jù)實例彼此相似,處于不同簇中的實例彼此差距較大。而聚類通過定義一個距離或者相似性系數(shù)來定義數(shù)據(jù)之間的相似性。圖2.1顯示了一個按照數(shù)據(jù)對象之間的距離進行聚類的示例,并將距離相近的數(shù)據(jù)對象劃分為一個簇。圖2.1聚類分析聚類分析可以被應用在數(shù)據(jù)預處理過程中,可以通過聚類分析的方法處理有著較復雜結構的多維數(shù)據(jù)。比如:對數(shù)據(jù)進行聚集,使復雜結構數(shù)據(jù)標準化。尋找數(shù)據(jù)項之間的依賴關系時也可以使用聚類分析的方法,從而去除或合并有密切依賴關系的數(shù)據(jù)項。聚類分析也可以為某些數(shù)據(jù)挖掘方法(如關聯(lián)規(guī)則、粗糙集方法),提供預處理功能。在商業(yè)上,聚類分析被用來發(fā)現(xiàn)不同的客戶群,是細分市場的有效工具,而且在研究消費者行為,尋找新的潛在市場行,能對不同的客戶群的特征進行刻畫。在生物上,聚類分析被用來對動植物及它們的基因進行分類,并能獲取對種群固有結構的認識。在保險行業(yè)上,它可以根據(jù)住宅類型、價值、地理位置來鑒定城市的房產(chǎn)分組,同時可以通過平均消費來鑒定汽車保險單持有者的分組。在互聯(lián)網(wǎng)應用上,聚類分析可以在網(wǎng)上進行文檔歸類。在電子商務上,聚類分析通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,從而幫助電子商務企業(yè)了解自己的客戶,向客戶提供更合適的服務。[5]2.3.2聚類分析方法的類別目前已經(jīng)有大量的聚類算法被人們發(fā)明出來。在具體的問題中,可以通過比較數(shù)據(jù)的類型、聚類的目的和具體應用方面來確定具體使用的聚類算法?,F(xiàn)階段聚類算法主要分為5大類:基于劃分的聚類方法、基于層次的聚類方法、基于密度的聚類方法、基于網(wǎng)格的聚類方法和基于模型的聚類方法?;趧澐值木垲惙椒ɑ趧澐值木垲惙椒ㄊ且环N自頂向下的方法,對于給定的n個數(shù)據(jù)對象的數(shù)據(jù)集,將數(shù)據(jù)對象組織成k(k≤n)個分區(qū),其中,每個分區(qū)代表一個簇。圖2.1就是基于劃分的聚類方法的示意圖?;趧澐值木垲惙椒ㄖ?,最經(jīng)典的就是k-平均(k-means)算法和k-中心(k-medoids)算法,很多算法都是由這兩個算法改進而來的。基于劃分的聚類方法的優(yōu)點是,收斂速度快,缺點是,它要求類別數(shù)目k可以合理地估計,并且初始中心的選擇和噪聲會對聚類結果產(chǎn)生很大影響。基于層次的聚類方法基于層次的聚類方法是指對給定的數(shù)據(jù)進行層次分解,直到滿足某種條件為止。該算法根據(jù)層次分解的順序分為自底向上法和自頂向下法,即凝聚式層次聚類算法和分裂式層次聚類算法。(1)自底向上法。首先,每個數(shù)據(jù)對象都是一個簇,計算數(shù)據(jù)對象之間的距離,每次將距離最近的點合并到同一個簇。然后,計算簇與簇之間的距離,將距離最近的簇合并為一個大簇。不停地合并,直到合成了一個簇,或者達到某個終止條件為止。簇與簇的距離的計算方法有最短距離法、中間距離法、類平均法等,其中,最短距離法是將簇與簇的距離定義為簇與簇之間數(shù)據(jù)對象的最短距離。自底向上法的代表算法是AGNES(AGglomerativeNESing)算法。(2)自頂向下法。該方法在一開始所有個體都屬于一個簇,然后逐漸細分為更小的簇,直到最終每個數(shù)據(jù)對象都在不同的簇中,或者達到某個終止條件為止。自頂向下法的代表算法是DIANA(DivisiveANAlysis)算法?;趯哟蔚木垲愃惴ǖ闹饕獌?yōu)點包括,距離和規(guī)則的相似度容易定義,限制少,不需要預先制定簇的個數(shù),可以發(fā)現(xiàn)簇的層次關系?;趯哟蔚木垲愃惴ǖ闹饕秉c包括,計算復雜度太高,奇異值也能產(chǎn)生很大影響,算法很可能聚類成鏈狀。圖2.2層次聚類算法基于密度的聚類方法基于密度的聚類方法的主要目標是尋找被低密度區(qū)域分離的高密度區(qū)域。與基于距離的聚類算法不同的是,基于距離的聚類算法的聚類結果是球狀的簇,而基于密度的聚類算法可以發(fā)現(xiàn)任意形狀的簇。基于密度的聚類方法是從數(shù)據(jù)對象分布區(qū)域的密度著手的。如果給定類中的數(shù)據(jù)對象在給定的范圍區(qū)域中,則數(shù)據(jù)對象的密度超過某一閾值就繼續(xù)聚類。這種方法通過連接密度較大的區(qū)域,能夠形成不同形狀的簇,而且可以消除孤立點和噪聲對聚類質(zhì)量的影響,以及發(fā)現(xiàn)任意形狀的簇,如圖2.3所示。基于密度的聚類方法中最具代表性的是DBSAN算法、OPTICS算法和DENCLUE算法。圖2.2是基于層次的聚類算法的示意圖,上方是顯示的是AGNES算法的步驟,下方是DIANA算法的步驟。這兩種方法沒有優(yōu)劣之分,只是在實際應用的時候要根據(jù)數(shù)據(jù)特點及想要的簇的個數(shù),來考慮是自底而上更快還是自頂而下更快。圖2.3密度聚類算法基于網(wǎng)格的聚類方法基于網(wǎng)格的聚類方法將空間量化為有限數(shù)目的單元,可以形成一個網(wǎng)格結構,所有聚類都在網(wǎng)格上進行。基本思想就是將每個屬性的可能值分割成許多相鄰的區(qū)間,并創(chuàng)建網(wǎng)格單元的集合。每個對象落入一個網(wǎng)格單元,網(wǎng)格單元對應的屬性空間包含該對象的值,如圖2.4所示?;诰W(wǎng)格的聚類方法的主要優(yōu)點是處理速度快,其處理時間獨立于數(shù)據(jù)對象數(shù),而僅依賴于量化空間中的每一維的單元數(shù)。這類算法的缺點是只能發(fā)現(xiàn)邊界是水平或垂直的簇,而不能檢測到斜邊界。另外,在處理高維數(shù)據(jù)時,網(wǎng)格單元的數(shù)目會隨著屬性維數(shù)的增長而成指數(shù)級增長。圖2.4基于網(wǎng)格的聚類算法基于模型的聚類方法基于模型的聚類方法是試圖優(yōu)化給定的數(shù)據(jù)和某些數(shù)學模型之間的適應性的。該方法給每一個簇假定了一個模型,然后尋找數(shù)據(jù)對給定模型的最佳擬合。假定的模型可能是代表數(shù)據(jù)對象在空間分布情況的密度函數(shù)或者其他函數(shù)。這種方法的基本原理就是假定目標數(shù)據(jù)集是由一系列潛在的概率分布所決定的。圖2.5對基于劃分的聚類方法和基于模型的聚類方法進行了對比。左側(cè)給出的結果是基于距離的聚類方法,核心原則就是將距離近的點聚在一起。右側(cè)給出的基于概率分布模型的聚類方法,這里采用的概率分布模型是有一定弧度的橢圓。圖2.5聚類方法對比示意圖2.5中標出了兩個實心的點,這兩點的距離很近,在基于距離的聚類方法中,它們聚在一個簇中,但基于概率分布模型的聚類方法則將它們分在不同的簇中,這是為了滿足特定的概率分布模型。在基于模型的聚類方法中,簇的數(shù)目是基于標準的統(tǒng)計數(shù)字自動決定的,噪聲或孤立點也是通過統(tǒng)計數(shù)字來分析的?;谀P偷木垲惙椒ㄔ噲D優(yōu)化給定的數(shù)據(jù)和某些數(shù)據(jù)模型之間的適應性。2.4相關分析相關分析是研究兩種或多種現(xiàn)象之間相互關系,并探討其關聯(lián)方向以及相關程度,是一種統(tǒng)計方法,專門用來研究隨機變量的相關性。相關系數(shù)是用來衡量變量之間相關程度的指標。樣本相關系數(shù)用r表示,取值范圍為[-1,1]。相關系數(shù)的絕對值越大,變量之間的線性相關程度越高;相關系數(shù)的絕對值越接近0,相關性越小,變量之間的線性相關程度越低。如兩者呈正相關,r呈正值,r=1時為完全正相關;如兩者呈負相關則r呈負值,而r=-1時為完全負相關。完全正相關或負相關時,所有圖點都在直線回歸線上;點的分布在直線回歸線上下越離散,r的絕對值越小。當r=0時,說明兩個變量之間無直線關系。一般來說,可以將兩變量間相關性的強弱分為以下幾個級別:當∣r∣≥0.8時,視為高度相關;當0.5≤∣r∣<0.8時,視為中度相關;當0.3≤∣r∣<0.5時,視為低度相關;當0<∣r∣<0.3,表明兩個變量之間的相關程度極弱,在實際應用中可視為不相關。2.5方差分析由方差分析(AnalysisofVariance,簡稱ANOVA),又稱“變異數(shù)分析”,是R.A.Fisher發(fā)明的,用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗。由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結果形成影響的可控因素。方差分析的基本原理是認為不同處理組的均數(shù)間的差別基本來源有兩個:(1)實驗條件,即不同的處理造成的差異,稱為組間差異。用變量在各組的均值與總均值之偏差平方和的總和表示,記作SSb,組間自由度dfb。(2)隨機誤差,如測量誤差造成的差異或個體間的差異,稱為組內(nèi)差異,用變量在各組的均值與該組內(nèi)變量值之偏差平方和的總和表示,記作SSw,組內(nèi)自由度dfw。總偏差平方和SSt=SSb+SSw。組內(nèi)SSw、組間SSb除以各自的自由度(組內(nèi)dfw=n-m,組間dfb=m-1,其中n為樣本總數(shù),m為組數(shù)),得到其均方MSw和MSb,一種情況是處理沒有作用,即各組樣本均來自同一總體,MSb/MSw≈1。另一種情況是處理確實有作用,組間均方是由于誤差與不同處理共同導致的結果,即各樣本來自不同總體。那么,MSb>>MSw(遠遠大于)。MSb/MSw比值構成F分布。用F值與其臨界值比較,推斷各樣本是否來自相同的總體如果經(jīng)過計算,組間均方遠遠大于組內(nèi)均方,則推翻原假設,說明樣本來自不同的正態(tài)總體,說明處理造成均值的差異有統(tǒng)計意義。否則承認原假設,樣本來自相同總體,處理間無差異。
3對成績影響因素的模糊聚類分析學生成績擁有大量的因素影響數(shù)據(jù)。在這些海量數(shù)據(jù)中,隱藏著大量的有價值的因素信息。聚類分析技術可以將性質(zhì)、特征近似的數(shù)據(jù)對象歸屬在相同的群集中,利用此技術能有效的分辨出最重要的影響因素,為相應因素提供更為針對性的改善,從而并最終達到提高學生成績的目的。由于在不同學生的數(shù)據(jù)中存在大量的模糊性概念,例如父母對學業(yè)關注程度、學生學習興趣、作業(yè)完成情況、宿舍氛圍等這些數(shù)據(jù)難以采用經(jīng)典數(shù)學的集合論對其進行定義和劃分,所以采用模糊聚類分析技術可以對這些不確定性數(shù)據(jù)進行較切合實際的數(shù)學描述,從而能較好地找出影響學生成績的因素。3.1原始數(shù)據(jù)的模糊處理將原始學生成績影響因素數(shù)據(jù)分為4種類型,分別是布爾型、數(shù)值型、類屬型和空值。利用隸屬函數(shù)實現(xiàn)這4種類型的數(shù)據(jù)的初始化處理。3.1.1布爾屬性的的隸屬函數(shù)布爾屬性值相對來說較為簡單,在本次分析中僅有“課前是否預習”,“你是否參加社團和學生會”是以布爾形式存在。設是整個數(shù)據(jù)域,n為中數(shù)據(jù)的總個數(shù),是“是”或者“否”的個數(shù),則隸屬函數(shù)為(3.1)3.1.2數(shù)值屬性的隸屬函數(shù)數(shù)值屬性值包括很多種情形,如與導師交流次數(shù)(每月)、自習次數(shù)(每周)、與導師交流時長(每次)等都是以數(shù)值形式存在的??梢詫?shù)值屬性值進行分類,相同的數(shù)值屬性值可以劃分同一類。設是整個數(shù)據(jù)域,n為中數(shù)據(jù)的總個數(shù),是總類數(shù),是第個類,是類包含的屬性值的個數(shù),則屬性值的隸屬函數(shù)為(3.2)3.1.3類屬屬性值的隸屬函數(shù)類屬屬性值是一種分類的屬性,如:父母受教育程度、父母對學業(yè)關注程度、個人學習興趣、自我學習滿意程度、作業(yè)完成程度等,這些值都是從有限分類集中取得某一類值。將相同屬性值劃分為同一類,其隸屬函數(shù)主要考慮各類屬性值個數(shù)在總的分類集中所占的比例。設是整個數(shù)據(jù)域,n為中數(shù)據(jù)的總個數(shù);是屬性的分類數(shù),是第個類,是類包含的屬性值的個數(shù),則類屬屬性值的隸屬函數(shù)為:(3-3)3.1.4空值屬性值的隸屬函數(shù)空值屬性值對應于其所屬的屬性值特性,前面上述的3種屬性值中都可能出現(xiàn)空值。如果某個屬性的空值個數(shù)和總的元素個數(shù)之比例超過限定閩值,可以在聚類分析時不考慮此屬性;對于比例低于的屬性,可根據(jù)空值的個數(shù)所占總數(shù)的比例,設定3個等級(高、中、低),高比例對應最高隸屬度,中比例對應中等隸屬度,低比例對應最低隸屬度,其隸屬函數(shù)如公式(1)所示,式中是第個元素、第個屬性的屬性值,為空值所占比例,對應高比例閩值,對應低比例閾值.(3-4)3.1.5學生成績影響因素數(shù)據(jù)的模糊處理下面通過實例來分析學生成績因素影響的模糊處理過程,為了討論方便,采用14個屬性作為分類屬性,回收問卷數(shù)為211份,問卷填寫數(shù)205份。因數(shù)據(jù)偏多,故只選取前50人、6因素數(shù)據(jù)呈現(xiàn),研究分析依然按205人、12因素分析。表3.1學生成績影響因素數(shù)據(jù)序號父母受教育程度父母對學業(yè)關注程度課前是否主動預習自習次數(shù)(每周)學習興趣與導師交流時長(每次)……1大學十分關注否5很感興趣1.52初中較為關注是5一般23小學從不關注是0很感興趣14博士十分關注否7一般15初中較為關注是5沒興趣1.56大學十分關注否5一般27小學從不關注否7一般19高中偶爾關注否5一般210高中偶爾關注是3一般1.511初中較為關注是5沒興趣1.512大學十分關注否7一般213初中較為關注否5沒興趣1.514初中較為關注否5很感興趣1.515博士十分關注否3很感興趣1.516研究生十分關注是0很感興趣1.517小學從不關注否5一般1.518高中偶爾關注是1一般220高中偶爾關注否5一般1.521小學從不關注是5一般222大學十分關注是5一般223大學十分關注否1沒興趣224研究生十分關注否7一般225高中偶爾關注是7很感興趣1.526小學從不關注否7一般127高中偶爾關注否5沒興趣1.528研究生十分關注否1沒興趣129高中偶爾關注否1沒興趣230初中較為關注是5一般131博士十分關注是3一般1.532大學十分關注否5很感興趣233大學十分關注是5沒興趣1.534高中偶爾關注否5沒興趣135初中較為關注是1沒興趣136初中較為關注否5沒興趣137大學十分關注否5一般138大學十分關注是7一般139初中較為關注否5沒興趣1.540博士十分關注是3很感興趣241初中較為關注是7很感興趣1.542高中偶爾關注否3一般1.543博士十分關注否0一般144博士十分關注否5一般245小學從不關注否3一般1.546博士十分關注否3沒興趣147高中偶爾關注否5沒興趣1.548小學從不關注否5沒興趣249博士十分關注否5一般1.550博士十分關注是0沒興趣1.5…………3.1.5屬性值的初始化處理(一)布爾屬性值(1)課前是否主動預習(2)您是否參加社團和學生會呢(二)類屬屬性值(1)父母文化程度(2)父母對學業(yè)關注程度(3)學習興趣(4)逃課次數(shù)(5)自我學習滿意程度(6)作業(yè)完成情況(7)宿舍同學學習態(tài)度對你的影響 (三)數(shù)值屬性值(1)與導師交流次數(shù)(每月),根據(jù)屬性值的取值劃分區(qū)間為:[0,3];:[4,8];:[9,12](2)自習次數(shù)(每周),根據(jù)屬性值的取值劃分區(qū)間為::[0,2];:[3,5];:[6,7](3)與導師交流時間(每次),根據(jù)屬性值的取值劃分區(qū)間為::[0,1];:[1,1.8];:[1.8,2.5](4)高考成績,根據(jù)屬性值的取值劃分區(qū)間為::[400,500];:[500,600];:[600,750](四)空值屬性無3.1.6初始化數(shù)據(jù)表3.2學生成績影響因素初始化數(shù)據(jù)序號父母受教育程度父母對學業(yè)關注程度課前是否主動預習自習次數(shù)(每周)學習興趣與導師交流時長(每次)……10.14630.31210.73170.53170.22440.419520.2390.23560.26820.53170.39020.287830.19510.19510.26820.25850.22440.292740.0780.31210.73170.20980.39020.292750.2390.23560.26820.53170.39110.419560.14630.31210.73170.53170.39020.287870.19510.19510.73170.20980.39020.292790.25370.25370.73170.53170.39020.2878100.25370.25370.26820.53170.39020.4195110.2390.23560.26820.53170.39110.4195120.14630.31210.73170.20980.39020.2878130.2390.23560.73170.53170.39110.4195140.2390.23560.73170.53170.22440.4195150.0780.31210.73170.53170.22440.4195160.08780.31210.26820.25850.22440.4195170.19510.19510.73170.53170.39020.4195180.25370.25370.26820.25850.39020.2878200.25370.25370.73170.53170.39020.4195210.19510.19510.26820.53170.39020.2878220.14630.31210.26820.53170.39020.2878230.14630.31210.73170.25850.39110.2878240.08780.31210.73170.20980.39020.2878250.25370.25370.26820.20980.22440.4195260.19510.19510.73170.20980.39020.2927270.25370.25370.73170.53170.39110.4195280.08780.31210.73170.25850.39110.2927290.25370.25370.73170.25850.39110.2878300.2390.23560.26820.53170.39020.2927310.0780.31210.26820.53170.39020.4195320.14630.31210.73170.53170.22440.2878330.14630.31210.26820.53170.39110.4195340.25370.25370.73170.53170.39110.2927350.2390.23560.26820.25850.39110.2927360.2390.23560.73170.53170.39110.2927370.14630.31210.73170.53170.39020.2927380.14630.31210.26820.20980.39020.2927390.2390.23560.73170.53170.39110.4195400.0780.31210.26820.53170.22440.2878410.2390.23560.26820.20980.22440.4195420.25370.25370.73170.53170.39020.4195430.0780.31210.73170.25850.39020.2927440.0780.31210.73170.53170.39020.2878450.19510.19510.73170.53170.39020.4195460.0780.31210.73170.53170.39110.2927470.25370.25370.73170.53170.39110.4195480.19510.19510.73170.53170.39110.2878490.0780.31210.73170.53170.39020.4195500.0780.31210.26820.25850.39110.4195…………3.2初始化數(shù)據(jù)的聚類在數(shù)據(jù)的初始化完成以后,就可以進行聚類,采用模糊矩陣聚類方法。設論域為(表3.2),元素個數(shù)為(15),進行聚類的步驟如下:3.2.1建立論域U的的模糊相似關系矩陣RR的階數(shù)為,利用歐幾里得距離公式,可以計算R矩陣的元素,式中m是屬性個數(shù),是第i行、第k列的屬性值。經(jīng)過計算后,得到R矩陣如表3.3所示(3.5)表3.3模糊相似關系矩陣1.000.191.000.120.181.000.170.140.181.000.120.180.040.181.000.180.130.140.130.141.000.140.150.170.090.170.111.000.170.180.140.210.150.200.211.000.170.140.130.190.130.180.200.121.000.200.060.170.130.170.120.160.190.151.000.120.190.140.130.140.190.160.160.130.181.000.080.190.110.160.110.180.150.160.150.190.111.000.160.140.120.190.120.170.200.120.020.150.130.151.000.130.180.150.150.150.200.170.140.120.170.080.090.121.000.180.180.190.140.210.160.110.180.220.180.200.160.220.181.000.180.090.150.150.160.090.130.190.160.120.200.170.160.190.161.000.120.160.090.200.090.150.180.130.110.170.160.130.100.140.200.151.000.150.160.170.100.170.120.070.220.210.160.170.150.200.180.120.130.191.000.130.180.060.180.050.130.170.150.120.180.140.120.110.150.200.160.080.181.000.170.130.190.050.190.140.100.190.180.120.140.150.180.130.120.140.190.120.191.003.3聚類(1)取,對成績影響因素劃分6類:第一因素組群:父母對學業(yè)關注程度、父母受教育程度;第二因素組群:高考成績;第三因素組群:與導師交流時長(每次)、與導師交流次數(shù)(每月);第四因素組群:作業(yè)情況、學習興趣、逃課次數(shù)(每周)、上課前是否主動預習、自習次數(shù)(每周);第五因素組群:自我學習滿意程度、宿舍同學學習態(tài)度對你的影響;第六因素組群:是否參加社團和學生會;(2)取λ=0.773,對成績影響因素劃分4類:第一因素組群:父母對學業(yè)關注程度、父母受教育程度;第二因素組群:高考成績;第三因素組群:與導師交流時長(每次)、與導師交流次數(shù)(每月)、作業(yè)情況、學習興趣、逃課次數(shù)(每周)、上課前是否主動預習、自習次數(shù)(每周)、自我學習滿意程度;第四因素組群:是否參加社團和學生會、宿舍同學學習態(tài)度對你的影響;綜上,在一定條件下,學生成績影響因素劃分是一項重要措施。λ越大分層越詳細,針對性越強。模糊聚類分析恰好反映了學生成績的影響因素劃分,便于進行下一步更為關鍵影響因素的探究,也便于制定一系列幫助學生提高學生成績的措施。
4不同因素對成績影響的主成分分析及聚類分析本章主要研究學校、學生、教師和社會各個方面對學生成績的影響,研究范圍雖然廣泛,但卻沒有體現(xiàn)出主體因素,因子分析就是通過對諸多因素的相關性研究,用提取的少數(shù)幾個因素來表示原來因素的主要信息,以達到濃縮數(shù)據(jù)的目的,因子分析的基本問題就是要確定因子載荷,下面主要對影響學生成績的各種因素進行因子分析,并對其分析結果進行解釋,具體的分析步驟和結果如下:4.1研究對象采用整群抽樣的方式在不同大學、不同年級學生中隨機抽取了240個人,共發(fā)放問卷300份,回收有效問卷205份。調(diào)查對象涉及不同學校、不同專業(yè),通過與學生交流、對學生的觀察以及參考文獻,設計了涵蓋個人、學校、家庭和社會4個層面的13個學習成績潛在影響因素(分別用表示,詳情見表4.1)的調(diào)查表;對于每個因素,調(diào)查表中分別設置了2—4個選擇支以供選擇。4.2調(diào)查過程與分析方法調(diào)查采用網(wǎng)絡問卷測試的方式,在身邊同學協(xié)助下填寫進行。調(diào)查問卷當場回收后,利用EXCEL進行問卷統(tǒng)計以及數(shù)據(jù)轉(zhuǎn)換,形成了量化問卷統(tǒng)計表,并采用SPSS21.0和SAS8.0作為數(shù)據(jù)管理與分析軟件。4.3調(diào)查問卷量化問卷量化工作區(qū)分了成績正面影響因素和負面影響因素,對于成績正面影響因素各選擇支按照影響越積極賦值越大,對于負面影響因素按照影響越大賦值越小的原則進行賦值。調(diào)查表賦值后可以得到一份包括13個因素、205個樣本的量化調(diào)查表.(見表4.1)4.4學習成績影響因子的提取聚類分析與主成分分析相結合的降維方法既有利于分析主成分的意義,又可以消除變量間的復共線性,比較適合影響因素較多的降維問題。文中首先對預設的13個因素進行R型聚類,再對每一類因素分別進行主成分分析,從每一類因素中客觀提取主成分,最后合成各類主成分以得到大學生學習成績主要影響因子。4.5因素聚類分析4.5.1聚類方法及聚類個數(shù)的確定聚類分析(CA)是一種統(tǒng)計分析技術,它是研究“物以類聚”的一種方法,其中使用最多的是層次聚類法。層次聚類分析法(HCA)的基本思想是,通過研究觀察對象之間的親疏程度,逐步將相似的對象聚合在一起,直至聚為一類。親疏程度的計算包括2類:樣本間距離和小類間距離,樣本間距離的測量方法有歐氏距離、歐氏距離平方、CITYBLOCK距離(布洛克距離)和MAHAL距離(馬氏距離)等。小類間距離的測量方法有最短距離法、最長距離法、中間距離法、重心法和離差平方和法(Ward法)等。本研究采用SPSS21.0軟件實現(xiàn)聚類分析,樣本間距離和小類間距離分別采用歐式距離平方和ward法測量。結合聚類分析半偏尺統(tǒng)計量、偽F統(tǒng)計量以及偽統(tǒng)計量來確定聚類個數(shù)。圖4.1聚類分析譜系圖圖4.2聚類分析水平冰柱圖(部分數(shù)據(jù))4.6.2聚類結果對所有因素進行Ward聚類分析,綜合各統(tǒng)計量對于聚類數(shù)的建議,確定聚類數(shù)為4,因素聚類結果見表4.1。表4.1ANOVAANOVA聚類誤差F顯著性均方自由度均方自由度父母受教育程度.0011.004203.139.709父母對學業(yè)關注程度.0001.002203.097.756學習興趣3.7611.023203163.123.000與導師交流次數(shù)(每月).6771.01920335.733.000自習次數(shù)(每周).0131.0052032.625.107與導師交流時長(每次).0021.004203.460.498逃課次數(shù)(每周).0001.001203.062.803自我學習滿意程度.0021.005203.285.594作業(yè)情況.0001.011203.042.837上課前是否主動預習.0001.001203.033.855您是否參加社團和學生會呢?.0001.022203.003.960宿舍同學學習態(tài)度對你的影響1.0381.02620339.595.000高考成績.0011.013203.072.789由于已選擇聚類以使不同聚類中個案之間的差異最大化,因此F檢驗只應該用于描述目的。實測顯著性水平并未因此進行修正,所以無法解釋為針對“聚類平均值相等”這一假設的檢驗。表4.2最終聚類中心最終聚類中心因素聚類12父母受教育程度.1933.1966父母對學業(yè)關注程度.2570.2551學習興趣.7317.4588與導師交流次數(shù)(每月).3396.4554自習次數(shù)(每周).3603.3445與導師交流時長(每次).3418.3479逃課次數(shù)(每周).2748.2758自我學習滿意程度.3569.3514作業(yè)情況.3637.3668上課前是否主動預習.2572.2562您是否參加社團和學生會呢?.5468.5478宿舍同學學習態(tài)度對你的影響.4810.3376高考成績.4023.4066表4.3因素聚類表類別因素第一類A1、A2第二類A3第三類A4、A12第四類A5、A6、A7、A8、A9第五類A10、A11第六類A13各因子與預設因素的線性關系為:X1=0.789A3+0.755A4+0.606A11+0.439A12…………X2=0.19A9—0.477A12+0.821A5十0.28A6—0.225A3—0.128A9(4.1)4.7主成分分析及因子分析4.7.1主成分提取原則按照因素向量相關系數(shù)矩陣特征值大于l的原則挑選,每一類因素的主成分。4.7.2提取主成分信息結果表4.4因素名稱及公因子方差公因子方差代碼因素初始提取A1父母對學業(yè)關注程度1.000.796A2父母受教育程度1.000.808A3高考成績1.000.602A4與導師交流時長(每次)1.000.504A5作業(yè)情況1.000.617A6學習興趣1.000.469A7逃課次數(shù)(每周)1.000.507A8上課前是否主動預習1.000.670A9自習次數(shù)(每周)1.000.187A10自我學習滿意程度1.000.635A11宿舍同學學習態(tài)度對你的影響1.000.587A12與導師交流次數(shù)(每月)1.000.621A13您是否參加社團和學生會呢?1.000.604提取方法:主成分分析法。表4.513因素總方差解釋總方差解釋成分初始特征值提取載荷平方和旋轉(zhuǎn)載荷平方和總計方差百分比累積%總計方差百分比累積%總計方差百分比累積%11.75413.49513.4951.75413.49513.4951.72113.24213.24221.2829.85931.3531.2829.85923.3531.2219.39322.63531.2469.58246.9351.2469.58232.9351.1979.20831.84241.1839.10359.0381.1839.10342.0381.1688.98840.83151.0768.27668.3141.0768.27650.3141.1678.97349.80461.0678.21071.1231.0678.21058.5241.1348.72058.5247.9877.59078.1148.9357.19182.3049.8926.85985.16310.8046.18888.35011.7605.84792.19712.6855.26697.46313.3302.537100.000提取方法:主成分分析法從表4.5的分析結果可以看出,前6個主成分的特征值大于1,它們的累積貢獻率為71.123%。由于前6個主成份的特征值較大,解釋了全部方差的71.123%,因此我們用前6個主成份來評價影響學生線性代數(shù)成績的因素,即約71.123%的總方差可以由這6個潛在因子進行解釋。4.7.3因子分析結果在各因子表達式(4.1)中按照因素系數(shù)絕對值從大到小的原則提取構成各因子的主要影響因素,并由此為各因子命名(見表4.6)。表4.6旋轉(zhuǎn)成分矩陣旋轉(zhuǎn)后的成分矩陣a代碼因素成分123456A1父母對學業(yè)關注程度.890-.060.024-.026-.032.102A2父母受教育程度.884-.017.082.051-.043.058A3高考成績.107.724.037.018-.125-.228A4與導師交流時長(每次)-.136.215.674.046.140.213A5作業(yè)情況.237-.267.104.563-.054-.205A6學習興趣-.016-.082.756.638.041.047A7逃課次數(shù)(每周).014-.012-.680.797.064-.044A8上課前是否主動預習-.151.003-.237.686-.128.264A9自習次數(shù)(每周).014-.052-.391A10自我學習滿意程度-.012.298.010-.162.741.074A11宿舍同學學習態(tài)度對你的影響.151-.206-.057.366.543.082A12與導師交流次數(shù)(每月).119.289.815.090-.507.375A13您是否參加社團和學生會呢?.022.012.133.046-.006.775提取方法:主成分分析法。旋轉(zhuǎn)方法:凱撒正態(tài)化最大方差法。a.旋轉(zhuǎn)在9次迭代后已收斂。通過愷撒正態(tài)化最大方差法,得到了原來13個變量在6個因子上新的因子負荷.從表3的分析結果可以看出:因子1支配的變量有、,因子2支配的變量有,因子3支配的變量有、,因子4支配的變量、、、、,因子5支配的變量有、,因子6支配的變量有,故可以認為,因子1反映學生父母各方面的情況,稱為家庭因子;因子2反映高考成績方面的情況,稱為高考成績因子;因子3反映的是學生與導師交流方面的情況,稱為成績被關注因子;因子4反映的是學生作業(yè)及主動學習情況,稱為求知欲與專注度因子;因子5反映的是宿舍同學影響及自我滿意度情況,稱為學習滿意度及受宿舍影響因子;因子6反映的是學校學生環(huán)境情況,稱為學校人文環(huán)境因子。表4.7主要影響因素與因子命名表代碼因素因素命名X1A1、A2家庭因子X2A3高考成績因子X3A4、A12成績被關注因子X4A5、A6、A7、A8、A9求知欲與專注度因子X5A10、A11學習滿意度及受宿舍影響因子X6A13學校人文環(huán)境因子通過探索性因子分析,從這13個影響學生學習成績的變量中找出了個潛在因子,它們分別是:家庭因子、高考成績因子、成績被關注因子、求知欲與專注度因子、學習滿意度及受宿舍影響因子、學校人文環(huán)境因子。它們之間沒有交叉影響,即每一個變量只受一個潛在因子影響,因此這六個潛在因子是影響所研究學生群體成績的主要因素。
5不同因素對成績影響的方差分析下面通過方差分析對潛在因子所包含的因素進行方差分析,以便得出所研究的因素中哪個因素在潛在因子中的影響力最大,從而為學校教學質(zhì)量和學生成績的提高,提供一些有效的指導意見。運用SPSS軟件,對不同因子所包含的因素進行方差分析,可以得到如下結果:5.1對家庭影響因子A1、A2多因素方差分析表5.1組間效應值(主體間效應的檢驗)主體間效應檢驗因變量:V15源III類平方和自由度均方F顯著性修正模型.019a5.004.729.602截距17.685117.6853352.802.000父母受教育程度37.348215.002.317.529父母對學業(yè)關注程度45.1252.33.1210.510.0.881父母受教育程度*父母對學業(yè)關注程度.0000...誤差1.050199.005總計241.889205修正后總計100.069204a.R方=.018(調(diào)整后R方=-.007)從表5.1中可以看出,因素A1在家庭因子A1、A2中的效應最顯著,即因素A1對學生成績的影響大于因素A2。5.2成績被關注因子A4、A12的多因素方差分析表5.2組間效應值(主體間效應的檢驗)主體間效應檢驗因變量:V15源III類平方和自由度均方F顯著性修正模型.017a8.002.399.920截距15.768115.7682938.283.000與導師交流次數(shù)(每月).0042.002.394.675與導師交流時長(每次).0032.002.799.742與導師交流次數(shù)(每月)*與導師交流時長(每次).0114.003.518.723誤差1.052196.005總計19.889205修正后總計1.069204a.R方=.016(調(diào)整后R方=-.024)從表5.2中可以看出,因素A12在成績被關注因子A4、A12中的效應最顯著,即因素A12對學生成績的影響大于因素A4。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度天然氣儲備庫安全運營管理合同
- 二零二五年度工業(yè)設備安裝與調(diào)試服務合同3篇
- 二零二五版快遞企業(yè)快遞物品安全防護合同大全3篇
- 2025年度城市綜合體門頭廣告品牌形象改造合同3篇
- 2025年度拆遷安置房交易全程跟蹤服務合同協(xié)議3篇
- 個人消費性借款合同(2024版)9篇
- 二零二五年度可再生能源發(fā)電特許經(jīng)營合作協(xié)議合同范本
- 二零二五年度醫(yī)療健康信息化運維保障合同2篇
- 2025版商業(yè)物業(yè)安全責任書(含應急預案)3篇
- 2025年度個性化產(chǎn)后恢復與新生兒護理個人月嫂服務協(xié)議4篇
- 《裝配式蒸壓加氣混凝土外墻板保溫系統(tǒng)構造》中
- T-CSTM 01124-2024 油氣管道工程用工廠預制袖管三通
- 2019版新人教版高中英語必修+選擇性必修共7冊詞匯表匯總(帶音標)
- 新譯林版高中英語必修二全冊短語匯總
- 基于自適應神經(jīng)網(wǎng)絡模糊推理系統(tǒng)的游客規(guī)模預測研究
- 河道保潔服務投標方案(完整技術標)
- 品管圈(QCC)案例-縮短接臺手術送手術時間
- 精神科病程記錄
- 閱讀理解特訓卷-英語四年級上冊譯林版三起含答案
- 清華大學考博英語歷年真題詳解
- 人教版三年級上冊口算題(全冊完整20份 )
評論
0/150
提交評論