智慧校園大數據分析決策應用平臺解決方案_第1頁
智慧校園大數據分析決策應用平臺解決方案_第2頁
智慧校園大數據分析決策應用平臺解決方案_第3頁
智慧校園大數據分析決策應用平臺解決方案_第4頁
智慧校園大數據分析決策應用平臺解決方案_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、智慧校園大數據分析決策應用平臺解決方案01大數據核心價值建設大數據模型與算法大數據平臺與實施落地020304研發(fā)實力與合作高校大數據建設方向與產品行 為 畫 像軌 跡 分 析綜 合 預 警管 理 大 數 據校領導駕駛艙大 數 據 報 告學 生 大 數 據教 學 大 數 據就 業(yè) 指 導人事大數據分析學生大數據分析資產大數據分析學工大數據分析信息化大數據分析財務大數據分析科 研 大 數 據消費習慣成績借閱高分課程選修課自習活動愛好科 研 大 數 據高校大數據建設內容智慧校園大數據分析決策應用平臺數 據 采 集 與 清 洗學 生 微 觀 數 據 倉 庫教 師 微 觀 數 據 倉 庫綜 合 行 為

2、畫 像智 慧 校 園 推 薦異 常 預 警心 理 健 康 預 警行 為 軌 跡 分 析學 生 個 人 大 數 據 報 告群 體 行 為 分 析互 聯 網 輿 情 分 析精 準 就 業(yè) 推 薦教 務 分 析學 工 分 析學 業(yè) 分 析人 事 分 析資 產 分 析實 驗 室 分 析學 校 信 息 化 管 理 分 析科 研 分 析科 研 分 析 與 橫 向 對 比學生個人數據中心涵蓋大學生活所有信息, 保證學生個人數據中心的 數據全面精準。包括以下5個方向: 基礎信息 學習 生活 畢業(yè) 就業(yè)學生數據來源舉例體育場館門禁信息門戶有線網管Wifilocation認證計費系統無線網管理系統SSL-vpn系

3、統學生電子郵箱教師電子郵箱校園一卡通宿舍通道機Itservice系統信息網絡呼叫中心系統DNSDhcpURL審計教務系統數據中心工作進展:數據全部抽取完成接入的系統數量18個接入的數據占用磁盤空間約700G增加數據保持定時同步功能需求確認數據建模個人行為軌 跡關聯模型個人基本信息校務管理系統位置信息用戶終端歷史WiFi終端定位信息體育場門禁宿舍通道機一卡通上網行為審計行為動作一卡通信息網絡呼叫中心系統直接讀取信息模塊:個人基本信息體育場門禁宿舍通道機信息網絡呼叫中心系統關聯分析后入庫模塊:WIFI用戶終端歷史WIFI終端定位信息上網行為審計一卡通個人數據中心內容展示與查詢個人基礎信息個人課程信

4、息圖書借閱信息網絡訪問信息校園消費信息校園軌跡信息個人成績信息在線學習信息內容豐富界面直觀支持移動化APP操作簡易通過可視化方式,可以讓學生、老師直觀的查詢與了解個人學校的所有數據內容展示特點:查看具體個人的行為軌跡可選擇某個學生,查看學生一天的行為軌跡 ,顯示軌跡序號、樓宇名稱、時間點、停留多長時間、做了些什么圖上箭頭按照學生行為軌跡動態(tài)移動可查看某個時間點學生的位置狀態(tài),便于學校定位失聯學生備注:地圖上的動態(tài)icon還需優(yōu)化學生在某個軌跡點的行為還需進一步分析軌跡行走的痕跡還需優(yōu)化數據跳變問題行為軌跡-個人行為軌跡行為軌跡-個人行為軌跡分析全校所有學生的在校軌跡,發(fā)現學生校內的熱門訪問地點

5、可按照集群過濾,包括民族、性別、培養(yǎng)層次、學生類型、生源地等可以選擇統計時間間隔,分為30min、1h、,按照時間間隔輪播學校人流變化情況可選擇熱力圖、標注圖兩種顯示方式,其中標注圖會顯示樓宇名稱、人數點擊某樓宇可查看該樓宇各層各室人員分布備注:輪播時間展示效果還未達到理想效果時間間隔數據待優(yōu)化行為軌跡-全校行為軌跡分析行為軌跡-全校行為軌跡分析-熱力圖學生沉迷預警學生失聯預警貧困生預警上網預警一卡通消費預警學位異常預警各類預警詳細報告報告分析總結預警信息配制基于微觀大數據分析的綜合預警校 領 導教 師學 生家 長輔 輔 員學 工 處預警用戶APP電腦短信微信郵件校園大數據管理計算平臺數 據

6、預 處 理/ 去 重校 園 安 全 算 法 計 算 匹 配校 園 安 全 數 據 結 論 標 簽校 園 安 全 預 警 算 法 區(qū) 配校 園 安 全 預 警 處 理 中 心預 警 內 容 權 限 分 配原 始 數 據采集庫個人基礎數據庫預警方式數據源計算處理邏輯架構大數據安全設計整體架構一卡通 視頻監(jiān)控 通道機門禁WiFi指紋識別考勤 互聯網數據電子信息學院 信息安全12級張某某電子信息學院04級學生 個人標簽:學霸、上網達人、理科高手 個人行為畫像個人綜合分析綜合成績水平80%綜合消費水平60%綜合評估畫像70%自律性分析90%通過大數據微觀分析學生的個人特點,進行學生個人畫像 和數據分析,

7、用于學生管理和綜合評價、就業(yè)等的輔助?!皩W生行為畫像” 詳細介紹14分析全校學生訪問該樓宇的情況,包括訪問人員畫像、訪問的高峰時間月數據總結:總訪問次數、訪問人數、 人均訪問次數、全校排名日數據總結:訪問人數、人員標簽、日 高峰時間段粘度高用戶畫像:顯示經常訪問該樓宇 的人員標簽使用人員趨勢:顯示該樓宇的訪問趨勢訪問熱度:顯示該樓宇的樓層訪問熱度群體樓宇人流畫像分析學生大數據分析報告業(yè)內數據最豐富的學生大數據報告,涉及生活、教學、圖書、網絡、消費、習慣等超過10類指標。支持用戶、班級、學院、學校等,可以按時間段,成長周、月、年導出 按照A4風格進行設計與排版,美觀簡潔,支持導出成PDF、圖片用

8、于打印或者朋友圈分享。學生大數據分析報告?zhèn)€人數據中心大數據報告課堂計劃活動進度 簽到 學習進度情況情況 隨堂測試情況 學生答題情況 小組討論進度進入每個活動可進行詳情查詢、開展教學督促智慧管理、智慧教學分析智慧管理、智慧教學分析校領導大數據指揮艙效果示意圖核心部門核心管理大數據大數據核心KPI涉及財務、教務、科研、人事、學工、學生、資產、實驗室、圖書、信息化、綜合.等超過10個管理的核心指標分析10+類別400+指標總共涉及10+大的管理類別,400+的核心指標和分析內容人事分析人事能力分析-1崗位工作量分析分析不同崗位教學工作量、科研工作量占比 以及趨勢各單位科研績效統計分析各單位教職工的人

9、均學術作品情況教職工培訓情況統計分析學校教職工的歷年培訓次數趨勢論文發(fā)布刊物分布統計分析教職工發(fā)表論文時選擇刊物的傾向 性教職工培訓分布顯示培訓次數最多的前八類培訓類型校內薪資福利分析統計分析各崗位的薪資福利情況校內薪資福利對比通過對全校、各類崗位的薪資福利進行對比 分析,發(fā)現學校教職工的待遇發(fā)展趨勢情況學校支出工資情況將教職工拿到工資和學校支出部分進行對比分析各級領導情況分析統計分析年齡、學歷、職稱分布情況各單位人才引進的績效統計分析高層次人才的人均學術作品情況教職工科研畫像顯示每個教職工科研的核心指標,包括科研 項目數量、論著發(fā)表數量、學術影響因子學院職稱評審畫像根據某學院職稱評審情況,分

10、析人員情況和 規(guī)律,包括通過職稱人數、男女比例等教職工行為畫像根據某學院職稱評審情況,分析人員情況和 規(guī)律,包括通過職稱人數、男女比例等人事分析人事能力分析-2校內薪資福利分析統計分析各崗位的薪資福利情況各級領導情況分析統計分析年齡、學歷、職稱分布情況統計分析各單位教職工的人均學術作品情況統計分析高層次人才的人均學術作品情況崗位工作量分析教職工科研畫像論文發(fā)布刊物分布分析不同崗位教學工作量、科研工作量占比顯示每個教職工科研的核心指標,包括科研統計分析教職工發(fā)表論文時選擇刊物的傾向 以及趨勢項目數量、論著發(fā)表數量、學術影響因子性校內薪資福利對比通過對全校、各類崗位的薪資福利進行對比 分析,發(fā)現學

11、校教職工的待遇發(fā)展趨勢情況各單位科研績效教職工培訓情況統計分析學校教職工的歷年培訓次數趨勢各單位人才引進的績效分析教職工培訓分布顯示培訓次數最多的前八類培訓類型學校支出工資情況將教職工拿到工資和學校支出部分進行 對比分析學院職稱評審畫像根據某學院職稱評審情況,分析人員情況和 規(guī)律,包括通過職稱人數、男女比例等為學校人員晉升、培訓工作,以及人事需求預測提供服務。01大數據核心業(yè)務建設大數據模型與算法大數據平臺與實施落地020304研發(fā)實力與合作學生成績(僅本科生的成績分析)專業(yè)、年級、科目的不同會使得成績不具可比性,因此將學生各科成績進行學時加權標準分換算,每個學生某科目成績的換算公式如下: =

12、 500 + 100 (其中為該生某科成績, 為該科成績在專業(yè)中的均值, 為該科成績在專業(yè)中的標準差)因此,每個學生的全部科目加權公式: Z = (其中為每科換算后成績, 為學科的學時)通過觀察,成績服從偏態(tài)分布,故進行boxcox變換轉換為正態(tài)分布后,按標準差劃分區(qū)間,分為學霸(Z成績573.355224分以上),學優(yōu)(544.503381分Z成績573.355224分),學良(471.681551分Z成績544.503381分),學中(422.806076分Z成績471.681551分),學差(Z成績422.806076分以下)5個等級。學生成績(性別)60%50%40%30%20%10%

13、0%學差學中學良學優(yōu)學霸男女生學習成績占比分布男女男女生成績差異大,女生優(yōu)于男生檢驗男女生成績差異度:男生成績均值:477.21女生成績均值:507.46通過等均值非參數檢驗差異度,算得P(Z=z) 雙尾=0.000.05檢驗結果:男女成績差異顯著學生成績分布(經濟消費)50%45%40%35%30%25%20%15%10%5%0%學差學中學良學優(yōu)學霸不同經濟差異的成績占比分布一般普困生特困生一般生成績均值:501.31 普困生成績均值:497.12 特困生成績均值:491.22通過等均值非參數檢驗差異顯著度:一般生與普困生差異小可忽略 特困生與其他學生差異顯著一般生和普困生的成績差異較小。特

14、困生成績較為顯著,學差多、學優(yōu)學霸少。學生成績分布(地域)教育資源豐富度與學生成績呈現正相關各區(qū)域學生成績分布基本呈正態(tài),分布大致相同。顯著 性檢驗結果如下:西北學生成績較差,學差多,學霸少; 華東學生成績較高,學差少,學霸多。原因分析:教育資源豐富度與學生成績呈現正相關60%50%40%30%20%10%0%學差學中學良學優(yōu)學霸各區(qū)域學生成績占比分布東北西南華東華南華北華中西北學生群體聚類分析常用的聚類技術主要有:基于分區(qū)的方法。其基本思路是,首先列舉出不同的分區(qū),然后根據某種標準對不同的分區(qū)進行評價。常用的方法有 K-Means方法、 K-Prototypes方法、K-Medoids方法、

15、PAM 方法、CLARA方法、基于密度的方法等?;趯哟蔚姆椒?。其基本思路是,通過某種標準創(chuàng)建數據(對象)集合的層次分解結構。常用的方法有BIRCH方法等?;谀P偷姆椒āF浠舅悸肥?,對每個類簇假設一個模型,并尋求相互之間模型的最佳合適程度。常用的方法有神經元網絡方法(如SOM)方法、統計方法(高斯混合模型方法、自動歸類方法),蟻群聚類。這些方法當中,k-means最為常用,快捷,但有三個缺點:K需要預先給定,通過實驗,本次分析數據運用k-means,在不同的k的聚類平均誤差拐點不明顯,難以確定適合的k值。在復雜環(huán)境下,模型聚類中心容易受隨機情況影響,尤其特征多,k偏少的情況。同一個k的結果

16、也不穩(wěn)定聚類結果往往難以解釋。 自適應聚類算法,屬于深度學習領域,通過競爭進化,讓樣本自動聚集,常用有蟻群算法,神經網絡。利用神經元網絡的聚類方法在管理 領域得到廣泛的重視和大量的應用。本分析采用神經元網絡(SOM)方法對學生屬性進行聚類。學生群體聚類步驟1.數據轉換:補全缺失值,消除異常值,boxcox轉換,1-2標準化。-通過轉換后選取分類數據(如男女,貧困程度),選取符合分布條件的特征。2.主基底變量篩選,剔除多重相關性數據,現有的數據中,保留了性別,生活日均消費,周末出行,貧困程度,Z成績等14個特征。3.SOM神經網絡聚類。4.模型解釋,結果呈現。學生群體SOM聚類1.模型訓練,隨機

17、選取90%數據進行訓練,聚類結果如右上圖,每個顏色代表一個特征響應,相同顏色代表一個類別,圖中顏色度大概7個, 故劃分7類。2.各個特征分類圖譜如右下圖:從左到右分別為: 性別,生活日消費強度,周末出行,宵夜日消費強度,購物日消費強度,上網時長,生活消費日占比,早餐消費日占比,學習消費日占比, 購物消費日占比,Z成績,貧困程度。SOM總體結果SOM歸類結果SOM各特征圖譜學生群體聚類結果聚類群體中心與平均值差異如下圖:其中,性別,周末出行,貧困程度, Z成績,早餐消費日占 比,學習消費日占比六個類型差異較大故單獨抽出這些特征進行群體劃分。SOM聚類中心與平均值差異100%50%0%-50%系列

18、1系列2系列3系列4系列5系列6系列7學生群體聚類結果學生群體聚類結果學生群體聚類結果學生群體聚類結果1.按性別,出行,貧困程度,成績,吃早餐日占比,學習消費日占 比,六個維度最能區(qū)分群體2.群體3,4,7人數較多,其余較少3.對于不同群體的學生,在管理指導上應有不同的側重,例如: 類別1要提供相應的補助措施,并鼓勵他們走出去。類別2要多鼓勵參加校園活動類別5,類別3,要警惕學習成績,以及提倡均衡飲食,養(yǎng)成良好的學習習慣。類別4,類別6成績優(yōu)異,多安排其余類別學生與此類學生交 流,分享經驗等。不同群體的人數占比群體1群體2群體3群體4群體5群體6群體7成績預測模型為增加教學環(huán)節(jié)考試成績評價與預

19、測的科學性,根據多元線性統計分析中的多元線性回歸分析方法,對考試成績指標進行量化,建立了考試成績評價與預測的回歸模型。通過高校大數據系統獲取學生的消費、基本信息、歷史成績 等數據,然后整理數據獲得學生的各種屬性,并建立學生屬性與學生成績單多元線性回歸模型。通過該模型能較有 效地對學生的成績進行預測,從而使教師和學生能及時掌握成績的走向,及早干預,提供管理和學習的效率。模型訓練過程01大數據核心業(yè)務建設大數據模型與算法大數據平臺與實施落地020304研發(fā)實力與合作大數據平臺總體邏輯圖結構化非結構實時數非實時學校業(yè)互聯網存量和增量 結構化采集工具文本/接口/FTP數據解析工具實時數據流式實時處理工

20、具機器學習基礎算法基礎模型應用模型實時流計算分布式結構化存儲集群支持通用數據庫軟件搜索引擎緩存智慧課室云平臺智慧教學大數據應用學校管理學校安全學校教學學校服務API接口學??蒲械谌紹I工具學生大數據競賽數據統一管理平臺DataHouse數據安全管理庫表權限分配應用服務存儲管理DBManager服務節(jié)點監(jiān)控管理Hadoop集群管理自動化安裝部署采集工作流管理數據源數據采集層存儲層計算層結果層數據管理平臺應用層架構 | 前后分離,可高效率并行開發(fā)前端| 基于FaceBook開源框架React安全 | 支持IP白名單,SQL黑名單,SQL注入攻擊攔截管理 | 強大的集群管理,監(jiān)控后端 | 基于Sp

21、ringMVC+Mybatis擴展 | 支持水平擴展,縱向分庫分表數據化數據據數據務系統數據交互式接口數據計算接口開發(fā)語言支持全面原始數據保全備份標準化數據聚合建模數據Hadoop數據倉庫大數據平臺:平臺優(yōu)勢性能出眾開發(fā)簡單接口功能HDFS直接使用java方式讀寫;Hbase通過專有api訪問,適配轉換成通用sql;Redis通過專有api訪問,適配 轉換成sql;Hive、sparkSql通過sql轉發(fā)mysql集群做數據切片,適配成通用sql;提供Load方式提供數據加載BS表設計工具,簡化業(yè)務開發(fā), 可以開發(fā)復雜的業(yè)務??梢暬瘮祿#档痛髷祿?用門檻。基于dbbox的SQL語言,能降低處理業(yè)務的開發(fā)門檻自定義數據分片規(guī)則,提高命中率降低查詢IO,百億條信息查詢秒級響應。列式存儲,高壓縮比,是傳統方式 的740倍;支持brighthourse引擎,查詢性能翻倍橫向擴展,性能隨資源提升平臺安全分布式節(jié)點數據備份與恢復數據權限可控數據脫敏應用隔離數據隔離傳輸加密大數據平臺:算法庫平困生資助效益文本分類行為分析推薦系統Java 語言接口scala語言接口Sequential Analysis 時序分析Dimension Reduction 主成分分析Association

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論