基于數(shù)據(jù)挖掘技術(shù)學(xué)情分析_第1頁(yè)
基于數(shù)據(jù)挖掘技術(shù)學(xué)情分析_第2頁(yè)
基于數(shù)據(jù)挖掘技術(shù)學(xué)情分析_第3頁(yè)
基于數(shù)據(jù)挖掘技術(shù)學(xué)情分析_第4頁(yè)
基于數(shù)據(jù)挖掘技術(shù)學(xué)情分析_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于數(shù)據(jù)挖掘技術(shù)學(xué)情分析摘要:近年來(lái)數(shù)據(jù)挖掘技術(shù)被廣泛應(yīng)用在數(shù)據(jù)分析中,大大提高了數(shù)據(jù)分析的質(zhì)量。提出將數(shù)據(jù)挖掘技術(shù)應(yīng)用到學(xué)情分析系統(tǒng)中,改變以往學(xué)情的片面分析狀況,深層次挖掘教育數(shù)據(jù)中的不可見信息,發(fā)現(xiàn)教育過程中存在的問題和隱含的教育教學(xué)規(guī)律,從而為學(xué)校管理者提供良好的決策支持并制定科學(xué)合理的改革策略,更好地滿足學(xué)生需求和科學(xué)地指導(dǎo)教師教學(xué) 關(guān)鍵詞:學(xué)情分析;需求分析;數(shù)據(jù)采集;數(shù)據(jù)挖掘 隨著信息技術(shù)的發(fā)展,數(shù)據(jù)的產(chǎn)生速度加快,數(shù)據(jù)的規(guī)模也變得日益龐大,依據(jù)行業(yè)的不同,分為金融、醫(yī)療、電信、教育等數(shù)據(jù),而教育數(shù)據(jù)的研究和應(yīng)用還屬于起步階段。學(xué)情分析正是針對(duì)教育數(shù)據(jù)開展的,利用數(shù)據(jù)挖掘技術(shù)進(jìn)行

2、學(xué)情分析能夠深層次挖掘教育數(shù)據(jù)中的不可見信息,發(fā)現(xiàn)教育過程中存在的問題和隱含的教育教學(xué)規(guī)律,從而優(yōu)化教育管理、促進(jìn)和完善教育教學(xué)改革、加快學(xué)校信息化建設(shè)、提升教學(xué)質(zhì)量。 1學(xué)情分析概述 1.1基本概念?!皩W(xué)情”最早出現(xiàn)在20世紀(jì)80年代初,當(dāng)時(shí)“學(xué)情”是指對(duì)學(xué)生學(xué)習(xí)情況的了解,進(jìn)而指導(dǎo)學(xué)生的學(xué)習(xí)方法,這是一種靜態(tài)的描述。隨著學(xué)情研究的深入,有專家指出,學(xué)情應(yīng)該是指學(xué)生的知識(shí)基礎(chǔ)、學(xué)習(xí)方法、心理狀態(tài)、理解能力、學(xué)習(xí)興趣等1。學(xué)情研究,這一概念體現(xiàn)出學(xué)情組成因素由單一向多樣轉(zhuǎn)變?!皩W(xué)情分析”概念最初出現(xiàn)在教學(xué)設(shè)計(jì)理論中,在國(guó)外主要用“學(xué)習(xí)者分析”、“學(xué)生特征分析”、“學(xué)生特點(diǎn)分析”等概念。目前,學(xué)

3、情分析的定義沒有形成科學(xué)的、統(tǒng)一的界定,一般廣義的“學(xué)情分析”是指把學(xué)生作為“人”做全面分析,涉及生理、心理、社會(huì)因素等多個(gè)維度,包括個(gè)性特征、心理狀態(tài)、學(xué)習(xí)方式、成長(zhǎng)環(huán)境等各方面的研究。狹義的“學(xué)情分析”是指對(duì)學(xué)生的學(xué)習(xí)情況進(jìn)行分析。12學(xué)情分析的傳統(tǒng)方法。目前,傳統(tǒng)的學(xué)情分析方法主要有調(diào)查法、觀察法、測(cè)試法、實(shí)驗(yàn)法、材料分析法、個(gè)案分析法、經(jīng)驗(yàn)梳理法及訪談法等。其中調(diào)查法是使用最多的一種量化研究方法,也是目前學(xué)校普遍采用的方法。隨著網(wǎng)絡(luò)的快速發(fā)展,調(diào)查法主要采用問卷調(diào)查,其特點(diǎn)是問卷的發(fā)放和回收方便,統(tǒng)計(jì)分析能夠自動(dòng)化,能更及時(shí)捕捉學(xué)生的狀態(tài)信息。觀察法主要是基于量規(guī)的課堂觀察法;材料分析

4、法是通過學(xué)生課堂回答問題、課程相關(guān)成績(jī)、課后作業(yè)等相關(guān)材料,深入了解學(xué)生學(xué)習(xí)狀態(tài);訪談法是通過與教師和學(xué)生進(jìn)行交流,了解真實(shí)學(xué)情、分析的思路和方法、具體實(shí)踐行為,以便及時(shí)調(diào)整教學(xué)的實(shí)施行為。 2學(xué)情分析系統(tǒng)的目標(biāo) 為全面、客觀、科學(xué)、實(shí)時(shí)地分析學(xué)情,系統(tǒng)擬對(duì)學(xué)生的知識(shí)儲(chǔ)備、學(xué)習(xí)需要、學(xué)習(xí)狀態(tài)、學(xué)習(xí)能力、學(xué)習(xí)結(jié)果和生活環(huán)境等方面了解和分析,即展開廣義的學(xué)情分析。這里的部分?jǐn)?shù)據(jù)可以通過學(xué)校相關(guān)信息系統(tǒng)獲得,例如學(xué)習(xí)結(jié)果可以用出勤情況、作業(yè)成績(jī)、測(cè)試成績(jī)等來(lái)量化體現(xiàn),但類似知識(shí)儲(chǔ)備、學(xué)習(xí)需要等情況都沒有現(xiàn)成的數(shù)據(jù),或者沒有量化的數(shù)據(jù)。由于學(xué)校的學(xué)生人數(shù)龐大,要獲得這些情況,采用問卷調(diào)查方法是最合適的

5、方法。調(diào)查問卷包括學(xué)生和教師評(píng)價(jià)問卷、心理健康問卷、課程相關(guān)調(diào)查問卷、生活相關(guān)調(diào)查問卷、畢業(yè)生就業(yè)調(diào)查問卷等,問卷種類較多、調(diào)查人員范圍不同。因此采用網(wǎng)絡(luò)在線問卷調(diào)查是現(xiàn)在最便捷的方法,能夠得到全面、合理、客觀的學(xué)情數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)收集的信息化、自動(dòng)化、網(wǎng)絡(luò)化,也為以后的學(xué)情分析提供詳細(xì)數(shù)據(jù)支持。系統(tǒng)作為一個(gè)學(xué)情分析的有力工具,通過對(duì)學(xué)情數(shù)據(jù)的深度分析挖掘有價(jià)值的信息是主要目標(biāo),目前數(shù)據(jù)挖掘技術(shù)是最科學(xué)、合理的分析方法,也是公認(rèn)的智能分析最有效的方法。該技術(shù)就是利用存儲(chǔ)的數(shù)據(jù)進(jìn)行挖掘計(jì)算,通過計(jì)算機(jī)應(yīng)用程序,把復(fù)雜的統(tǒng)計(jì)技術(shù)、挖掘算法封裝起來(lái)2。基于以上分析,本系統(tǒng)整體目標(biāo)是通過網(wǎng)絡(luò)問卷并結(jié)合學(xué)

6、校相關(guān)信息系統(tǒng)已存儲(chǔ)的信息收集學(xué)情數(shù)據(jù),再對(duì)這些基礎(chǔ)數(shù)據(jù)進(jìn)行深度挖掘,挖掘得到的信息將幫助學(xué)校有針對(duì)性、實(shí)時(shí)地了解學(xué)生具體情況和發(fā)展變化,從而為學(xué)校管理者提供良好的決策支持并制定科學(xué)合理的改革策略,更好地滿足學(xué)生需求和科學(xué)地指導(dǎo)教師教學(xué)。 3需求分析 需求分析是進(jìn)行系統(tǒng)設(shè)計(jì)的基礎(chǔ),主要確定系統(tǒng)擬發(fā)揮的作用,以及要實(shí)現(xiàn)的具體操作。系統(tǒng)旨在將學(xué)生和教師的客觀和主觀數(shù)據(jù)進(jìn)行收集和深度分析,以便全方位地了解學(xué)情。31數(shù)據(jù)來(lái)源。該系統(tǒng)所有學(xué)情數(shù)據(jù)主要來(lái)源于學(xué)校相關(guān)信息系統(tǒng)和調(diào)查問卷,具體如下:(1)學(xué)校已有的信息系統(tǒng)主要有教學(xué)管理系統(tǒng)、學(xué)生管理系統(tǒng)、一卡通系統(tǒng)、圖書管理系統(tǒng)等。這些系統(tǒng)已經(jīng)存儲(chǔ)了大量關(guān)于

7、學(xué)生、教師的數(shù)據(jù),包括學(xué)生的基本信息、課程、成績(jī)、在校表現(xiàn)情況,教師的基本信息、教學(xué)安排和教學(xué)效果信息等3,這些數(shù)據(jù)通過校園網(wǎng)絡(luò)進(jìn)行整體導(dǎo)出并存儲(chǔ)在學(xué)情分析系統(tǒng)。因?yàn)檫@些系統(tǒng)數(shù)據(jù)隨時(shí)有更新,可以設(shè)置定時(shí)導(dǎo)入學(xué)情分析系統(tǒng)。(2)調(diào)查問卷這里把教學(xué)人員和教輔人員都?xì)w為教師。為實(shí)現(xiàn)全面的學(xué)情分析,不同工作職責(zé)的教師都需要了解自己負(fù)責(zé)的相關(guān)信息,所以他們?cè)O(shè)計(jì)的問卷內(nèi)容是不同的,調(diào)查的對(duì)象也是不同的。按照學(xué)校的情況,具體的調(diào)查問卷內(nèi)容大致涉及以下3個(gè)方面:1)負(fù)責(zé)教學(xué)的教師需要了解所授課班級(jí)的學(xué)生情況。問卷調(diào)查的內(nèi)容主要是學(xué)生已經(jīng)具備的知識(shí)和技能、課程學(xué)習(xí)中對(duì)知識(shí)的理解和掌握程度、學(xué)習(xí)中存在的疑問和困難

8、、學(xué)習(xí)的收獲和體驗(yàn)等。2)教務(wù)管理的教師需要針對(duì)不同系部、專業(yè)或班級(jí)學(xué)生及教師進(jìn)行調(diào)查。針對(duì)學(xué)生的問卷內(nèi)容主要涉及學(xué)生對(duì)所學(xué)專業(yè)的課程設(shè)置、授課教師的教學(xué)能力和教學(xué)效果、整體的教學(xué)管理等方面的意見;針對(duì)教師的問卷內(nèi)容涉及教師對(duì)人才培養(yǎng)、課程設(shè)置、教學(xué)安排、教學(xué)管理的意見,以及教學(xué)中存在的問題。3)事務(wù)管理的教師根據(jù)管理職責(zé)范圍不同,會(huì)對(duì)學(xué)生進(jìn)行調(diào)查。問卷內(nèi)容主要是關(guān)于學(xué)生的心理健康和日常生活管理、圖書服務(wù)、學(xué)校環(huán)境、其他事務(wù)管理的滿意度和意見。32系統(tǒng)用戶。系統(tǒng)主要供教師和學(xué)生使用,系統(tǒng)的維護(hù)和管理也由教師負(fù)責(zé),為方便區(qū)分,這些教師被稱為系統(tǒng)管理員。所以系統(tǒng)共設(shè)置3類用戶,分別是系統(tǒng)管理員、教

9、師、學(xué)生,他們的權(quán)限各有區(qū)別。系統(tǒng)管理員權(quán)限最大,擁有系統(tǒng)所有數(shù)據(jù)的管理和操作權(quán)利;學(xué)生操作最少,只參與填寫問卷和查詢自己可見的問卷;教師主要是問卷的設(shè)計(jì)、發(fā)放、回收問卷并分析結(jié)果。3.3關(guān)鍵功能。依據(jù)以上系統(tǒng)目標(biāo)的分析,本系統(tǒng)中應(yīng)該包括收集數(shù)據(jù)、管理數(shù)據(jù)和分析數(shù)據(jù)3部分,所以應(yīng)該具備具體的功能如下:(1)數(shù)據(jù)采集功能:一部分從學(xué)校相關(guān)信息系統(tǒng)導(dǎo)入數(shù)據(jù),另一方面采集問卷數(shù)據(jù)。問卷數(shù)據(jù)的采集包括問卷內(nèi)容的參考數(shù)據(jù)收集,問卷數(shù)據(jù)的回收和爬取。問卷內(nèi)容的設(shè)計(jì)可以參考學(xué)校的校園論壇等交流平臺(tái)的內(nèi)容,這就需要對(duì)交流平臺(tái)的數(shù)據(jù)進(jìn)行收集和分類匯總,以便制定科學(xué)合理的問卷。問卷回收歸入在問卷管理。(2)數(shù)據(jù)管

10、理功能:數(shù)據(jù)包括學(xué)生和教師的基本信息,學(xué)生成績(jī)等信息系統(tǒng)的已有數(shù)據(jù)和問卷數(shù)據(jù)。學(xué)生和教師的基本信息歸為用戶數(shù)據(jù),學(xué)生成績(jī)等信息系統(tǒng)的已有數(shù)據(jù)和問卷數(shù)據(jù)歸為學(xué)情行為數(shù)據(jù)。所以數(shù)據(jù)管理包括用戶管理和學(xué)情行為數(shù)據(jù)的管理。1)用戶管理:實(shí)現(xiàn)用戶基本信息的增加、修改、刪除和權(quán)限控制的功能。2)學(xué)情行為數(shù)據(jù)管理:包括數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)編輯。學(xué)生成績(jī)等已有數(shù)據(jù)直接存儲(chǔ);但問卷數(shù)據(jù)需要編輯,包括問卷增加和修改、問卷審核、問卷發(fā)放、問卷填寫、問卷查詢、問卷自動(dòng)回收。問卷增加和修改部分包括問卷的內(nèi)容設(shè)計(jì)、生成新問卷、刪除、修改問卷、問卷導(dǎo)入和導(dǎo)出。為保證問卷內(nèi)容的合理合法,問卷需要經(jīng)過審核后才可以發(fā)放。為保障問卷數(shù)據(jù)

11、的合法性、準(zhǔn)確性,已經(jīng)審核通過的問卷將會(huì)被凍結(jié)修改操作。發(fā)放問卷時(shí)要注明填寫的截止時(shí)間和調(diào)查對(duì)象,到截止時(shí)間就自動(dòng)回收問卷。為保證問卷的質(zhì)量,限制同一問卷每人只能提交一次。對(duì)于發(fā)放和填寫問卷的用戶,可以查看自己操作過的問卷。(3)數(shù)據(jù)分析功能:對(duì)信息系統(tǒng)導(dǎo)入的數(shù)據(jù)和回收的問卷數(shù)據(jù)先分別處理和分析,再聯(lián)合分析。問卷數(shù)據(jù)先篩選有效問卷,然后對(duì)有效問卷的結(jié)果依據(jù)指定的范圍進(jìn)行分析,以此滿足不同需要。最后對(duì)分析結(jié)果進(jìn)行存儲(chǔ)和反饋,采用數(shù)據(jù)可視化技術(shù)按照要求繪制不同類型的統(tǒng)計(jì)圖表,供相關(guān)人員查看。34系統(tǒng)的非功能性需求。系統(tǒng)的非功能性需求無(wú)法直觀表現(xiàn),而通過一定的指標(biāo)如穩(wěn)定性、安全性、可靠性、可適應(yīng)性等

12、表現(xiàn)出來(lái)4。系統(tǒng)只供學(xué)校內(nèi)部使用,系統(tǒng)使用者數(shù)量大,使用頻率高,涉及用戶的隱私數(shù)據(jù),所以主要考慮穩(wěn)定性、方便性、安全性、擴(kuò)展性,以便為用戶提供友好的使用界面,保證系統(tǒng)保持平穩(wěn)、無(wú)誤地運(yùn)行,保證數(shù)據(jù)的安全,容易維護(hù)和擴(kuò)展功能 4系統(tǒng)整體設(shè)計(jì) 根據(jù)以上分析,學(xué)情分析系統(tǒng)需要具備數(shù)據(jù)采集、數(shù)據(jù)管理、數(shù)據(jù)分析、登錄管理4個(gè)功能模塊,每個(gè)模塊的作用設(shè)計(jì)如下:(1)登錄管理:包括身份信息的驗(yàn)證和登錄界面的展示。為保證數(shù)據(jù)的安全和用戶的合法性,登錄系統(tǒng)需提供用戶名和密碼,驗(yàn)證通過后,依據(jù)用戶身份分配訪問權(quán)限,進(jìn)入相應(yīng)的主界面。(2)數(shù)據(jù)采集:主要是相關(guān)信息系統(tǒng)的數(shù)據(jù)導(dǎo)入和已有問卷的導(dǎo)入,問卷數(shù)據(jù)的爬取,相關(guān)

13、交流平臺(tái)的數(shù)據(jù)采集。(3)數(shù)據(jù)管理:包括問卷管理、用戶管理、角色管理、數(shù)據(jù)庫(kù)管理。問卷管理實(shí)現(xiàn)調(diào)查問卷相關(guān)的系列功能。用戶管理用于設(shè)置和維護(hù)用戶信息,包括角色設(shè)置和用戶所屬部門設(shè)置。角色管理用于規(guī)劃角色、權(quán)限和設(shè)置角色的權(quán)限。數(shù)據(jù)庫(kù)管理實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)、備份和恢復(fù)。(4)數(shù)據(jù)分析:包括對(duì)各種數(shù)據(jù)的處理和單獨(dú)分析,相關(guān)數(shù)據(jù)的關(guān)聯(lián)分析。 5關(guān)鍵技術(shù) 為實(shí)現(xiàn)系統(tǒng)的目標(biāo),本系統(tǒng)中采用的關(guān)鍵技術(shù)主要是數(shù)據(jù)采集、分析和反饋方面的技術(shù)。5.1數(shù)據(jù)采集。在保證校園網(wǎng)暢通的情況下,與相關(guān)信息系統(tǒng)對(duì)接并整體導(dǎo)入數(shù)據(jù),這里主要是類似學(xué)生成績(jī)的結(jié)構(gòu)化數(shù)據(jù)。而在線網(wǎng)絡(luò)問卷的數(shù)據(jù)和交流平臺(tái)的數(shù)據(jù)大多是文本數(shù)據(jù),而文本數(shù)據(jù)正

14、是非結(jié)構(gòu)化數(shù)據(jù)的代表5。使用Python網(wǎng)絡(luò)爬蟲技術(shù)采集相關(guān)數(shù)據(jù)。5.2數(shù)據(jù)挖掘和文本挖掘。像學(xué)生成績(jī)等結(jié)構(gòu)化數(shù)據(jù)采用關(guān)聯(lián)技術(shù)和聚類技術(shù)可以進(jìn)行分析;文本數(shù)據(jù)處理需采用文本挖掘的相關(guān)技術(shù)進(jìn)行分析。文本挖掘包括文本預(yù)處理和文本分析,預(yù)處理主要包括分句、分詞、特征表示和提取等。文本分析采用文本聚類和分類方法。5.3數(shù)據(jù)可視化。數(shù)據(jù)可視化是數(shù)據(jù)挖掘結(jié)果的直觀呈現(xiàn),可以將數(shù)據(jù)間的復(fù)雜關(guān)系形象地表示出來(lái),是一種非常實(shí)用的結(jié)果反饋方法。而統(tǒng)計(jì)圖表是數(shù)據(jù)可視化中不可缺少的基本組成元素,在很多大型的復(fù)雜可視化系統(tǒng)中仍然被廣泛使用6。系統(tǒng)中主要對(duì)分析結(jié)果進(jìn)行圖形化的呈現(xiàn),使得使用者對(duì)結(jié)果容易理解,并方便總結(jié)。 6結(jié)語(yǔ) 主要研究利用數(shù)據(jù)挖掘技術(shù)開發(fā)學(xué)情分析系統(tǒng),從系統(tǒng)的需求分析設(shè)計(jì)系統(tǒng)整體功能,為系統(tǒng)的詳細(xì)設(shè)計(jì)和開發(fā)實(shí)現(xiàn)奠定基礎(chǔ)。該系統(tǒng)的開發(fā)體現(xiàn)了教育數(shù)據(jù)挖掘的發(fā)展和應(yīng)用,改變以往學(xué)情的片面分析狀況,能夠促進(jìn)和深化學(xué)校學(xué)生學(xué)習(xí)、教師教學(xué)實(shí)踐及幫助相關(guān)部門提供合理的計(jì)劃和建議7。 參考文獻(xiàn) 1馬文杰.鮑建生.“學(xué)情分析”:功能、內(nèi)容和方法J.教育科學(xué)研究,2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論