


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于Kmeans和CBR方法的高校就業(yè)預(yù)測(cè)模型應(yīng)用研究【摘要】提出運(yùn)用Keans聚類算法和BR案例推理方法對(duì)高校學(xué)生就業(yè)趨向進(jìn)展預(yù)測(cè)。針對(duì)采集的高校就業(yè)信息的高維海量數(shù)據(jù),首先使用Keans聚類方法將已就業(yè)數(shù)據(jù)劃分成不同的就業(yè)類別,從而極大地減少了特征分析工作量。對(duì)未就業(yè)數(shù)據(jù)進(jìn)展預(yù)測(cè)時(shí),先計(jì)算跟每一聚類中心的間隔 值,從而得到其適宜的分類,再在每一類中進(jìn)展BR推理,最后得出對(duì)其的預(yù)測(cè)分類結(jié)果。實(shí)驗(yàn)結(jié)果說(shuō)明,提出的算法預(yù)測(cè)結(jié)果較為準(zhǔn)確,為高校就業(yè)指導(dǎo)提供了幫助?!娟P(guān)鍵詞】Keans聚類BR推理高校就業(yè)預(yù)測(cè)隨著高校的擴(kuò)招,我國(guó)高等教育已經(jīng)由精英教育轉(zhuǎn)向群眾教育,從1999年開(kāi)始,高等學(xué)校的辦學(xué)規(guī)模
2、、招生規(guī)模逐步擴(kuò)大。而由此帶來(lái)了應(yīng)屆畢業(yè)生的就業(yè)形勢(shì)一年比一年嚴(yán)峻,2022年,全國(guó)普通高等畢業(yè)生達(dá)630萬(wàn),比2022年的611萬(wàn)又增加了19萬(wàn)人1。面對(duì)如此大的就業(yè)壓力,各個(gè)高校也加強(qiáng)了就業(yè)指導(dǎo)方面的工作。不少高校開(kāi)展了對(duì)學(xué)生的就業(yè)指導(dǎo),如搜集、挑選有效的需求信息,為畢業(yè)生提供指導(dǎo)與咨詢等,以進(jìn)步學(xué)校的就業(yè)率。但很多高校就業(yè)工作還只是做了面上工作,缺乏實(shí)際效果,并不能真正解決學(xué)生的實(shí)際問(wèn)題。目前,很多高校都在使用就業(yè)管理系統(tǒng)、學(xué)籍管理系統(tǒng)等數(shù)據(jù)庫(kù)幫助工作,但這些數(shù)據(jù)庫(kù)往往還停留在簡(jiǎn)單的統(tǒng)計(jì)、查詢等功能上。由于畢業(yè)生就業(yè)工作涉及的數(shù)據(jù)量非常宏大,而且時(shí)間集中,僅靠傳統(tǒng)的數(shù)學(xué)和統(tǒng)計(jì)手段已經(jīng)不夠
3、。如何運(yùn)用數(shù)據(jù)庫(kù)中的數(shù)據(jù)得到對(duì)就業(yè)指導(dǎo)有用的信息成為了一個(gè)非常有實(shí)際意義的研究?jī)?nèi)容,而數(shù)據(jù)挖掘技術(shù)可在高校就業(yè)預(yù)測(cè)中有很好的應(yīng)用前景。本文首先用Keans2方法對(duì)往年已就業(yè)學(xué)生進(jìn)展聚類,對(duì)每一類特征進(jìn)展分析,得到其就業(yè)特征信息。對(duì)未就業(yè)學(xué)生進(jìn)展預(yù)測(cè)時(shí),先將其與每一類中心點(diǎn)計(jì)算間隔 ,將其分入某一類,在同一類中再用BR3進(jìn)展案例推理,從而得出其與哪幾個(gè)個(gè)案最相似,用這些成功就業(yè)的特征作為該學(xué)生的預(yù)測(cè)結(jié)果,而且還可以根據(jù)這些學(xué)生特征給新同學(xué)一個(gè)建議。本文構(gòu)造如下,第1節(jié)介紹基于Keans和BR的高校就業(yè)預(yù)測(cè)模型,第2節(jié)給出實(shí)驗(yàn)結(jié)果和分析,最后一節(jié)給出結(jié)論。1基于Keans和BR的高校就業(yè)預(yù)測(cè)模型學(xué)
4、生管理和就業(yè)數(shù)據(jù)數(shù)據(jù)量龐大,因此需要使用數(shù)據(jù)挖掘知識(shí)進(jìn)展處理,使用數(shù)據(jù)挖掘?qū)W(xué)生管理和就業(yè)數(shù)據(jù)進(jìn)展管理的概念流程如圖1所示。在圖1的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)庫(kù)中,可以使用多種算法,如決策樹(shù)算法4、關(guān)聯(lián)規(guī)那么算法5、SV(SupprtVetrahine,支持向量機(jī))6算法等等。本文重點(diǎn)是對(duì)就業(yè)數(shù)據(jù)進(jìn)展預(yù)測(cè),因此提出了使用Keans聚類算法和BR算法,以得到較好的預(yù)測(cè)結(jié)果。Keans(K均值)聚類算法是一種基于劃分的聚類算法,建立在最小化誤差平方和的準(zhǔn)那么上。其過(guò)程是先隨機(jī)選擇一些初始代表點(diǎn)作為初始聚類中心,然后計(jì)算其余樣本點(diǎn)與各中心點(diǎn)的間隔 ,把它們分到最近(間隔 最小)的類中去;然后對(duì)每一類中的樣本
5、點(diǎn)計(jì)算均值,把這個(gè)均值作為新的聚類中心點(diǎn);反復(fù)迭代,直到聚類中心點(diǎn)不再改變或者到達(dá)迭代最大步數(shù)。Keans聚類算法的效率很高,時(shí)間復(fù)雜度為(tkn),其中n是樣本數(shù),k是聚類的類數(shù),t是算法迭代次數(shù)(tBR(ase-BasedReasning,基于案例推理)方法是對(duì)已經(jīng)發(fā)生的“歷史與待求解問(wèn)題進(jìn)展相似性匹配,利用相似的一個(gè)或假設(shè)干個(gè)“歷史對(duì)待求解問(wèn)題進(jìn)展解答。當(dāng)給定一個(gè)待求解問(wèn)題,BR首先檢查是否存在一個(gè)同樣的訓(xùn)練案例。假設(shè)找到一個(gè),那么返回附在該案例上的解。假設(shè)找不到同樣的案例,那么BR將搜索具有類似于新案例的訓(xùn)練案例。概念上講,這些訓(xùn)練案例可以視為新案例的鄰接者。BR試圖組合臨近的訓(xùn)練案例
6、,提出新案例的解。假設(shè)解之間出現(xiàn)不相容,可能需要回溯搜索其他解。BR的主要難點(diǎn)包括找到一個(gè)好的相似性度量,開(kāi)發(fā)對(duì)訓(xùn)練案例索引的有效技術(shù)和組合解的方法。本文提出的基于Keans和BR的高校就業(yè)預(yù)測(cè)模型的流程示意圖如圖2所示,首先用Keans方法對(duì)往年已就業(yè)學(xué)生進(jìn)展聚類,對(duì)未就業(yè)學(xué)生進(jìn)展預(yù)測(cè)時(shí),先將其與每一類中心點(diǎn)計(jì)算間隔 ,將其分入某一類,在同一類中再用BR進(jìn)展案例推理。2實(shí)驗(yàn)結(jié)果和分析數(shù)據(jù)挑選自最近幾年實(shí)際的就業(yè)信息,共320個(gè)樣本,部分樣本數(shù)據(jù)例子如表1:2.1數(shù)據(jù)預(yù)處理首先要把數(shù)據(jù)進(jìn)展預(yù)處理,不是數(shù)值型的數(shù)據(jù)轉(zhuǎn)換成數(shù)值型數(shù)據(jù)。如性別男用0代表,女用1表示,獲獎(jiǎng)情況我們也將其數(shù)值化,考慮用獲
7、獎(jiǎng)的次數(shù)來(lái)交換獲獎(jiǎng)這個(gè)屬性,社會(huì)工作也是如此.對(duì)特長(zhǎng)我們簡(jiǎn)單用有特長(zhǎng)(數(shù)值1表示)、無(wú)特長(zhǎng)(數(shù)值0表示)來(lái)區(qū)分。生源地那么與工作單位所在地進(jìn)展比照,如在同一省份那么用數(shù)值1代替,否那么用數(shù)值0代替。那么上述就業(yè)數(shù)據(jù)例子變成2.2實(shí)驗(yàn)結(jié)果和分析為了驗(yàn)證所提出方法的效果,我們使用eka工具對(duì)預(yù)處理數(shù)據(jù)進(jìn)展分析。對(duì)320個(gè)數(shù)據(jù)進(jìn)展聚類,得到第一步聚類結(jié)果如下:keans=Nuberfiteratins:2ithinlustersufsquarederrrs:259.0277777777773lusterentrids:luster0ean/de:3.9501.50.510StdDevs:0.1505
8、N/A0.50160.50160N/Aluster1ean/de:4.3142.510StdDevs:0.3009N/A1.00310.50160N/AlusteredInstanes0160(50%)1160(50%)即結(jié)果聚成了兩大類,如比照表1中數(shù)據(jù),我們發(fā)現(xiàn)樣例1(讀研)和樣例4(公務(wù)員)被聚在一類中,而樣例2(物流公司)和樣例3(信息公司)的被聚在另一類,這一結(jié)果說(shuō)明去公司的同學(xué)有相似地方,而讀研和考公務(wù)員的同學(xué)有相近的成績(jī)和愛(ài)好。進(jìn)一步還可以對(duì)這兩類結(jié)果進(jìn)展細(xì)分分析。假設(shè)把320個(gè)樣例劃分成訓(xùn)練集和測(cè)試集來(lái)驗(yàn)證我們算法的預(yù)測(cè)準(zhǔn)確度,如預(yù)測(cè)工作省份與生源地是否一樣省份,可得如下結(jié)果:
9、IB1lassifierrretlylassifiedInstanes109100%InrretlylassifiedInstanes00%Kappastatisti1eanabsluteerrr0Rteansquarederrr0Relativeabsluteerrr0%Rtrelativesquarederrr0%TtalNuberfInstanes109=DetailedAurayBylass=TPRateFPRatePreisinReallF-easurelass101110101111=nfusinatrix=ab-lassifiedas820|a=0027|b=1這個(gè)結(jié)果說(shuō)明可以完
10、全正確的預(yù)測(cè)出工作地點(diǎn),從而可以給就業(yè)工作提供一些指導(dǎo)和幫助。3結(jié)論與展望該文建立了基于Keans聚類算法和BR推理的高校就業(yè)預(yù)測(cè)模型,闡述了使用數(shù)據(jù)挖掘?qū)W(xué)生管理和就業(yè)數(shù)據(jù)進(jìn)展管理的概念流程、基于Keans和BR的就業(yè)預(yù)測(cè)模型過(guò)程、就業(yè)數(shù)據(jù)的搜集以及數(shù)據(jù)數(shù)值化預(yù)處理等過(guò)程,最后將Keans方法和BR方法應(yīng)用到高校就業(yè)預(yù)測(cè)中。經(jīng)實(shí)驗(yàn)檢驗(yàn),證明了基于Keans和BR方法的有效性和可靠性,同時(shí)將該方法應(yīng)用在高校就業(yè)預(yù)測(cè)中,為高校就業(yè)指導(dǎo)提供一個(gè)定量的根據(jù),為從事就業(yè)指導(dǎo)工作的教師提供重要參考。本文分析了高校學(xué)生的就業(yè)情況,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于就業(yè)數(shù)據(jù),實(shí)現(xiàn)Keans和BR算法并得到聚類知識(shí)。通過(guò)對(duì)
11、學(xué)生就業(yè)數(shù)據(jù)進(jìn)展挖掘分析,找到學(xué)生就業(yè)信息與學(xué)生學(xué)習(xí)成績(jī)、社會(huì)活動(dòng)才能等屬性之間的關(guān)聯(lián),有助于學(xué)校教育目的、教育方向、教育手段的定位與改進(jìn),有助于在校生明確加強(qiáng)學(xué)習(xí)與理論的方向,為學(xué)生培養(yǎng)與就業(yè)指導(dǎo)提供決策根據(jù),進(jìn)步對(duì)畢業(yè)生就業(yè)指導(dǎo)的實(shí)效性,實(shí)現(xiàn)畢業(yè)生更快、更好地就業(yè)。參考文獻(xiàn)1袁貴仁.2022年全國(guó)普通高校畢業(yè)生就業(yè)工作視頻會(huì)議.2KaufanLandRusseeuPJ.Findinggrupsindata:anintrdutintlusteranalysis.NeYrk:JhnSns,1990.3Aadt,A.andPlaza,E.ase-BasedReasning:FundatinalIssues,ethdlgialVariatins,andSysteApprahes.AIuniatins,7(i):pp39-59,1994.4J.R.Quinlan.IndutinfDeisinTrees,ahineLearning,1(1):
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年五年級(jí)英語(yǔ)上冊(cè) Unit 5 What does he do第四課時(shí)教學(xué)實(shí)錄 人教PEP
- 2024年五年級(jí)數(shù)學(xué)上冊(cè) 3 小數(shù)除法3課時(shí) 練習(xí)課配套教學(xué)實(shí)錄 新人教版
- 17 彩虹的形成 教學(xué)設(shè)計(jì)-2024-2025學(xué)年科學(xué)五年級(jí)上冊(cè)冀人版
- 三農(nóng)信息管理手冊(cè)
- 季度工作進(jìn)度計(jì)劃及實(shí)施方案
- 2023三年級(jí)英語(yǔ)上冊(cè) Module 6 Unit 2 How old are you教學(xué)實(shí)錄 外研版(三起)
- 2023一年級(jí)語(yǔ)文上冊(cè) 第四單元 口語(yǔ)交際:我們做朋友教學(xué)實(shí)錄 新人教版
- 2024-2025學(xué)年高中歷史 第三單元 第二次世界大戰(zhàn) 探究活動(dòng)課一 世界大戰(zhàn)的啟示-戰(zhàn)爭(zhēng)給人類帶來(lái)了什么教學(xué)教學(xué)實(shí)錄1 新人教版選修3
- 6 探訪古代文明(教學(xué)設(shè)計(jì))2023-2024學(xué)年統(tǒng)編版道德與法治 六年級(jí)下冊(cè)
- 12急行跳遠(yuǎn)教學(xué)設(shè)計(jì)8-八年級(jí)體育與健康
- 電子公章申請(qǐng)請(qǐng)示范文2
- 2024-2030年中國(guó)合同能源管理(EMC)行業(yè)發(fā)展前景規(guī)劃分析報(bào)告
- 《中華人民共和國(guó)文物保護(hù)法》知識(shí)專題培訓(xùn)
- 2024年高考全國(guó)甲卷英語(yǔ)試卷(含答案)
- 四年級(jí)數(shù)學(xué)(四則混合運(yùn)算)計(jì)算題專項(xiàng)練習(xí)與答案匯編
- 8年級(jí)上冊(cè)(人教版)物理電子教材-初中8~9年級(jí)物理電子課本
- 從業(yè)人員健康檢查 衛(wèi)生知識(shí)培訓(xùn)考核及個(gè)人衛(wèi)生制度
- 人教版高中英語(yǔ)新教材必修2單詞默寫(xiě)表
- 中金公司在線測(cè)評(píng)真題
- 項(xiàng)目資金管理統(tǒng)籌實(shí)施方案
- 2024年秋新滬科版物理八年級(jí)上冊(cè) 6.3來(lái)自地球的力 教學(xué)課件
評(píng)論
0/150
提交評(píng)論