




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、基于5語言的學(xué)生成績分析摘 要:學(xué)生考試成績是檢驗教師教學(xué)效果的重要指標(biāo),客觀準(zhǔn)確地分析學(xué)生成績是每一個教師的職 責(zé).依據(jù)R語言特點及數(shù)據(jù)處理過程,運用R語言對沈陽市某小學(xué)四年級學(xué)生期末成績進行描述性、相 關(guān)性和差異性分析,并根據(jù)教學(xué)實際需要將數(shù)據(jù)生成箱形圖和直方圖,由圖形分析考試成績是否兩級分 化,在某一成績段是否集中;同一學(xué)生不同科目的成績是否相關(guān),是否偏科等等.實踐表明,采用R語言 分析學(xué)生成績能夠顯示其隱藏的問題,為教師提高學(xué)生成績提供參考依據(jù),從而達到提高教學(xué)效果的目 的關(guān)鍵詞:R語言;成績分析;箱形圖;直方圖;星圖;pairs圖0引言學(xué)生成績作為檢驗教師教學(xué)效果的產(chǎn)物,直接反映學(xué)生
2、對知識的掌握情況及教師的教學(xué)水 平.近些年,有關(guān)教學(xué)的探索更多關(guān)注于新的教學(xué)手段,針對教學(xué)效果的分析,尤其是有關(guān)分析 方法的研究較少.隨著人工智能和大數(shù)據(jù)時代的到來,為教師利用數(shù)據(jù)統(tǒng)計分析手段,從大量的 學(xué)生成績中提取重要數(shù)據(jù),發(fā)現(xiàn)成績中隱藏的問題,提高學(xué)生成績,提供了新的思路.本文中嘗 試引入R語言對學(xué)生成績進行統(tǒng)計分析M ,為教學(xué)人員探索新的統(tǒng)計方法提供參考.R語言特點數(shù)據(jù)分析是指采用合適方法對從海量數(shù)據(jù)中收集的大量數(shù)據(jù)進行分析、整理、歸納,抽取有 價值的信息的過程.R語言作為一種強大的編程語言,不僅可提供大量多樣的數(shù)據(jù)統(tǒng)計分析方 式,還可生成圖例,其主要特點有: 開源免費的軟件可從官網(wǎng)下
3、載,安裝簡單快捷,而且其強大的R語言包均可根據(jù)需要 從網(wǎng)上下載,支持多操作系統(tǒng)環(huán)境;具有強大可自定義樣式的繪圖功能,可利用函數(shù)將統(tǒng)計分析的計算數(shù)據(jù)生成想要的圖, 并根據(jù)修改函數(shù)中的參數(shù),自定義圖樣式; 操作流程簡單,無需編寫大量代碼,用戶只要了解所需函數(shù)的參數(shù)意義,即可生成對應(yīng) 圖例.R語言數(shù)據(jù)處理數(shù)據(jù)源是R語言進行統(tǒng)計分析的核心資源.考慮到大學(xué)課程成績存在一定主觀性,相比之下 小學(xué)期末考試更嚴格、更真實,成績趨于客觀,因此本研究選擇沈陽市某小學(xué)四年級期末考試成績作為數(shù)據(jù)源進行統(tǒng)計分析.2. 1 數(shù)據(jù)收集根據(jù)教學(xué)人員的需要,從眾多列成績中選取主要數(shù)據(jù)信息,包括序號(num)、姓名 (name)
4、、班級(class)、數(shù)學(xué)(math)、語文(chn)、英語(eng),將收集的數(shù)據(jù)存為.xls文件 或.csv文件.收集數(shù)據(jù)時,出現(xiàn)的缺失值可刪除或按空缺值等方式處理.2. 2 數(shù)據(jù)讀入numnameclassmathchnengchr1劉芷瑞4. 32822. 5392趙羽菲4. 398951003姜欣彤4. 39887984宋虹霏4. 39887975施依含4. 39391976賈倩雯4. 39()91997局震4. 398919()8工習(xí)鑒4. 310()SO999李澤溪4. 39688931()李彥燕4. 3958795# .with105 more rows圖1 R語言生成學(xué)生成績
5、R語言支持.xls、. csv和.txt等多種文件類型導(dǎo)入.導(dǎo)入 文件前需要加載對應(yīng)的R語言包,編寫代碼時需將導(dǎo)入文件 賦值給變量,導(dǎo)入的變量類型以數(shù)據(jù)框形式存在.本文以導(dǎo)入. xls文件為例,利用R語言read _excel ()函數(shù)實現(xiàn)導(dǎo)入代碼 如下:library( read_excel)scoresV 6 read_excel(scoresdata. xlsx)導(dǎo)入后查看數(shù)據(jù),見圖1.數(shù)據(jù)共105行,查看變量內(nèi)容時R語言僅顯示10行,隱 藏95行.每列除顯示導(dǎo)入數(shù)據(jù)時填寫的列名外,還顯示屬性 類型,其中name為字符型,其余均為數(shù)據(jù)框.2. 3 數(shù)據(jù)提取讀入數(shù)據(jù)后,需對有用數(shù)據(jù)進行提取
6、運算.例如,在統(tǒng)計 分析成績時,姓名、序號、班級等屬性不應(yīng)參加統(tǒng)計分析,但函數(shù)無這些屬性就無法進行歸類統(tǒng)計分析,在眾多數(shù)據(jù)中提取所要數(shù)據(jù),可應(yīng)用R語言中c () 將所需數(shù)據(jù)連接在一起,通過如下代碼提取數(shù)據(jù):scores.data V6 scoresc(4 % 6)scores.data“scores &c (4% 6)表示提取scores變量中46列的數(shù)據(jù)賦值給變量scores. data.R語言成績分析與圖形繪制學(xué)生成績是反映教學(xué)成果的客觀數(shù)據(jù).目前,大多數(shù)學(xué)校采取Excel錄入、匯總、計算的方 式管理與分析學(xué)生成績,雖能計算出需要的最終數(shù)據(jù),但是缺乏對成績的客觀分析與直觀反映.針對這一問題
7、,本文提出了基于R語言的統(tǒng)計分析方法以提高教學(xué)效果&466.3. 1 各科成績描述)分析3. 1. 1 統(tǒng)計成績信息Min.:25. 00Min.:16. 00Min.:24. 00lsl Qu.:78. 501st. Qu. :62. 001st. Qu.:59. 00Median:89. 00Median:74. 00Median:91.00Mean:83. 77Mean:70. 04Mean:78.643rd Qu.:94. 003rd Qu. : 84. 003rd Qu.:96. 00Max.:100. 00Max.:95. 00Max.:100. 00mathchneng圖2 su
8、nmary函數(shù)生成學(xué)生成績傳統(tǒng)數(shù)據(jù)計算一般通過Excel表格分列對各科進 行求和、求平均值、求最大值和最小值的分類計算, 工作略顯繁瑣.這里以沈陽某小學(xué)四年級成績?yōu)槔? 將43名學(xué)生成績導(dǎo)入R語言環(huán)境中,導(dǎo)入的數(shù)據(jù)變 量以數(shù)據(jù)框的形式存在.R語言可通過summary () 函數(shù)完成各科成績的初步計算,實現(xiàn)代碼如下summary (scores c (4 % 6)生成的計算數(shù)據(jù)見圖 2.通過生成數(shù)據(jù)可直觀看到,在整個四年級數(shù)學(xué)、語文和英語(科考試成績中,除最大值、最 小值和平均值外,還計算出科目成績的中間值(Median)、1/4位數(shù)(1st Qu.)和3/4位數(shù)(3stQu.),為分析、了解學(xué)
9、生整體情況提供了便捷的數(shù)據(jù)計算服務(wù),提高了教學(xué)決策的準(zhǔn)確性. 3.1.2繪制成績箱形圖為更加直觀地向決策者提供數(shù)據(jù)依據(jù),R語言boxplot ()函數(shù)可根據(jù)導(dǎo)入的成績數(shù)據(jù)生成 箱形圖,即根據(jù)數(shù)據(jù)的分布情況生成統(tǒng)計圖.上述通過summary ()函數(shù)計算出各科成績的重要 屬性值,生成的箱形圖如圖3所示,實現(xiàn)運行代碼如下:boxplot (math class, data = scoris)boxp l ot (ing class, data=scores)boxplot (chn class, data=scores)箱形圖將計算得到的描述性統(tǒng)計量進行更直觀地展示.圖3中分別顯示各班級數(shù)學(xué)、語文
10、、 英語成績與班級的信息:長方形外部的上下兩條橫線分別表示該班級的最高分和最低分,長方形 的上下邊框分別表示該班級成績的1/4位數(shù)(1st Qu.)和3/4位數(shù)(3st Qu.),長方形內(nèi)部黑橫 線表示該班級成績的中間數(shù),圖形中的空心白圓點表示異常數(shù)據(jù).除箱形圖規(guī)定的線形和圖形含 義外,還可從圖形中看到隱藏的信息,例如長方形的面積大小決定該班級本科目成績是否在某成 績段集中,如果面積過大表示成績涉及范圍較大.3. 1. 3繪制成績直方圖hist (math, freq = FALSE)lines (density (math) , col=blum)rug (jitter (math)R語言的
11、強大不僅體現(xiàn)在便捷的數(shù)據(jù)計算,還體現(xiàn)在可依據(jù)頻數(shù)生成可視的直方圖逍.根據(jù) 導(dǎo)入的數(shù)學(xué)、語文和英語成績,利用R語言的hist ()函數(shù)、lmes ()函數(shù)和rug ()函數(shù)生成 整體成績直方圖,如圖4所示,運行代碼如下:(a)數(shù)學(xué)成績整體點.方圖(b)語文成績整體直方圖(c)英語成績整體點.方圖圖4數(shù)學(xué)、語文、英語成績分布直方圖通過成績直方圖可直觀看出,橫坐標(biāo)為成績段,縱坐標(biāo)為密度,各科成績圖形及密度曲線由分數(shù)段人數(shù)決定.數(shù)學(xué)成績除個別學(xué)生,大部分均已及格,并且在及格人數(shù)中很多學(xué)生的成績集中在85分以上,90分以上偏多;語文成績雖呈正態(tài)分布趨勢,但是存在一些成績不及格的學(xué)生,大 部分學(xué)生在659
12、0分之間,80分以上偏多;英語成績分布呈現(xiàn)兩極化,成績不及格和90分以 上的均偏多,6080分之間學(xué)生較少.3. 2 成績相關(guān)性分析成績是檢驗教學(xué)成果的重要指標(biāo).有效利用技術(shù)手段從大量的成績中發(fā)現(xiàn)科目之間的關(guān)聯(lián)! 挖掘隱藏信息,是提升成績、提高教學(xué)效果的重要方式. 數(shù)據(jù)中發(fā)現(xiàn)科目之間的相關(guān)性,為決策者提供分析依據(jù).cor (scores ,subjects) 生成的相關(guān)性數(shù)據(jù)見圖5.通常認為,數(shù)學(xué)成績好的小學(xué)生語文和英語的成績 都不會很差.通過R語言各科成績的相關(guān)性分析看出, 數(shù)學(xué)與語文、數(shù)學(xué)與英語的相關(guān)系數(shù)均超過了 0. 6,根 據(jù)統(tǒng)計學(xué)的規(guī)定,相關(guān)系數(shù)區(qū)域0.60.8屬于有很強 的相關(guān)性,
13、說明在該年級中數(shù)學(xué)學(xué)得好的學(xué)生,其數(shù)學(xué) 成績與語文成績、英語成績存在一定的相關(guān)性.通過R 語言生成的成績相關(guān)性如圖6所示,運行代碼如下:pairs (scores ,subjects )3. 3 成績差異分析利用starts ()函數(shù)可根據(jù)學(xué)生的成績生成星圖,教學(xué)人員通過星圖可直觀了解學(xué)生是否偏 科、是否優(yōu)秀.本文中生成的星圖如圖7所示,運行代碼如下:利用R語言cor ()函數(shù),可從導(dǎo)入的 運行代碼如下:chn mathengchn 1.0000000 0. 7221382math 0.7221382 1.0000000eng 0.5870535 0. 6940769 圖50. 58705350. 69407691. 0000000cor函數(shù)計算學(xué)生績相關(guān)性分析stars ( scores)星圖一般表示多個相互獨立的變量個體,每個連接角與中心點的軸線越長,數(shù)值就越大,生 成的星圖就越大,各科成績分別對著數(shù)據(jù)的維度.圖7中,第一排第二個學(xué)生、第二排第二個學(xué)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 驀然回首的中考語文作文
- 印刷設(shè)備環(huán)境適應(yīng)性測試與評估考核試卷
- 海洋工程節(jié)能減排策略考核試卷
- 生活中的樂趣初三語文作文
- 煉焦廠的環(huán)境監(jiān)測與預(yù)警系統(tǒng)考核試卷
- 影視錄放設(shè)備的智能圖像識別技術(shù)改進考核試卷
- 清潔服務(wù)團隊建設(shè)與溝通考核試卷
- 電氣設(shè)備智能電網(wǎng)協(xié)同控制技術(shù)考核試卷
- 生態(tài)系統(tǒng)健康評估與維護考核試卷
- 種子種苗產(chǎn)業(yè)發(fā)展的政策環(huán)境分析考核試卷
- 2024年高考化學(xué)真題完全解讀(全國甲卷)
- 2024能源互聯(lián)網(wǎng)智慧電力云服務(wù)平臺建設(shè)規(guī)范及標(biāo)準(zhǔn)
- 靜電噴涂培訓(xùn)
- 各專業(yè)文件準(zhǔn)備目錄-急診內(nèi)科藥物臨床試驗機構(gòu)GCP SOP
- 心肺復(fù)蘇術(shù)課件2024新版
- 湖北開放大學(xué)2024年《漢語基礎(chǔ)#》形考作業(yè)1-4試題
- 中國銀聯(lián)招聘筆試題庫2024
- 2024安徽制造業(yè)發(fā)展報告
- 四年級下冊道德與法治(教學(xué)設(shè)計+素材)第8課《這些東西哪里來》(第二課時)
- 高職旅游專業(yè)《旅行社經(jīng)營管理》說課稿
- DB65-T 4785-2024 耕地質(zhì)量等級調(diào)查評價技術(shù)規(guī)范
評論
0/150
提交評論