數(shù)據(jù)科學(xué)技術(shù)群工作匯報(bào)_第1頁(yè)
數(shù)據(jù)科學(xué)技術(shù)群工作匯報(bào)_第2頁(yè)
數(shù)據(jù)科學(xué)技術(shù)群工作匯報(bào)_第3頁(yè)
數(shù)據(jù)科學(xué)技術(shù)群工作匯報(bào)_第4頁(yè)
數(shù)據(jù)科學(xué)技術(shù)群工作匯報(bào)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)科學(xué)技術(shù)群工作匯報(bào)數(shù)據(jù)科學(xué)知識(shí)點(diǎn)分類知識(shí)點(diǎn)描述專業(yè)課程基礎(chǔ)課程計(jì)算機(jī)專業(yè)基礎(chǔ)課程,包括程序設(shè)計(jì)、數(shù)據(jù)結(jié)構(gòu)、體系結(jié)構(gòu)、操作系統(tǒng)、數(shù)據(jù)庫(kù)原理等;進(jìn)階課程計(jì)算機(jī)專業(yè)研究生課程,包括算法、統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、信息檢索、數(shù)據(jù)挖掘等;職業(yè)技能通用技能大數(shù)據(jù)從業(yè)者應(yīng)當(dāng)掌握的基本技能,是學(xué)習(xí)和工作的基礎(chǔ),涉及Linux系統(tǒng),版本控制軟件、集成開發(fā)環(huán)境、容器化技術(shù)和云計(jì)算平臺(tái)等;開發(fā)語(yǔ)言主流的程序開發(fā)語(yǔ)言、腳本語(yǔ)言、統(tǒng)計(jì)分析語(yǔ)言和數(shù)據(jù)庫(kù)語(yǔ)言,包括Java、Python、R、SQL等,每一個(gè)大數(shù)據(jù)從業(yè)者都應(yīng)當(dāng)熟練掌握1種以上開發(fā)語(yǔ)言;算法專題介紹大數(shù)據(jù)分析和處理相關(guān)的算法原理,包括深度學(xué)習(xí)、協(xié)同過(guò)濾、聚類分析和回

2、歸分析等分析類算法,也包括分布式事務(wù)、分布式一致性、Map/Reduce等分布式算法;系統(tǒng)平臺(tái)SQL數(shù)據(jù)庫(kù)主要介紹傳統(tǒng)基于關(guān)系模型并且采用SQL語(yǔ)言作為訪問(wèn)接口的數(shù)據(jù)庫(kù)管理系統(tǒng),也包括Hive等架構(gòu)在分布式系統(tǒng)上的類SQL系統(tǒng)和基于中間件技術(shù)的分布式數(shù)據(jù)庫(kù)服務(wù);NoSQL數(shù)據(jù)庫(kù)介紹新型的非關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng),這些系統(tǒng)所采用的數(shù)據(jù)模型包括鍵值對(duì)、圖模型、文檔模型和寬表模型等,主要通過(guò)API接口進(jìn)行訪問(wèn);數(shù)據(jù)處理平臺(tái)介紹用于大規(guī)模數(shù)據(jù)處理的分布式基礎(chǔ)架構(gòu)平臺(tái),包括Apache基金會(huì)所開發(fā)的Hadoop和加州大學(xué)伯克利分校開源的Spark系統(tǒng);數(shù)據(jù)科學(xué)知識(shí)點(diǎn)分類知識(shí)點(diǎn)描述系統(tǒng)平臺(tái)數(shù)據(jù)流處理介紹基于數(shù)

3、據(jù)流模型進(jìn)行在線數(shù)據(jù)實(shí)時(shí)處理的系統(tǒng),主要包括Storm和Spark Streaming;緩存系統(tǒng)在對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行分析和處理過(guò)程,采用緩存系統(tǒng)能夠有效提高處理性能,目前主流的緩存系統(tǒng)有GemFire、Redis和Cache;消息處理基于分布式隊(duì)列的消息發(fā)布和訂閱系統(tǒng)已經(jīng)被廣泛用于處理不斷產(chǎn)生的海量日志信息及交易信息,主流的開源消息處理系統(tǒng)有Kafka和RabitMQ;數(shù)據(jù)分析用于數(shù)據(jù)分析和挖掘的軟件和工具包,主要有Mahout、TensorFlow、MATLAB和Weka等;數(shù)據(jù)可視化采用圖表等方式對(duì)數(shù)據(jù)進(jìn)行展示在大數(shù)據(jù)應(yīng)用中占有重要地位,相關(guān)的軟件工具和庫(kù)包括Tableau、Google

4、Charts、Gephi和plotly等;數(shù)據(jù)集成規(guī)劃和研發(fā)大數(shù)據(jù)系統(tǒng)時(shí)通常需要對(duì)不同來(lái)源、不同格式和質(zhì)量的數(shù)據(jù)進(jìn)行集成,目前已經(jīng)有很多用于數(shù)據(jù)采集、轉(zhuǎn)換和集成的軟件平臺(tái),F(xiàn)lume和OpenRefine是其中具有代表性的;資源調(diào)度介紹用于集群資源(CPU、內(nèi)存、存儲(chǔ)和網(wǎng)絡(luò)等)管理和分配的系統(tǒng)工具,包括YARN和Mesos;案例分析領(lǐng)域應(yīng)用通過(guò)案例分析可以讓學(xué)習(xí)者獲取大數(shù)據(jù)技術(shù)應(yīng)用的直觀感受,有助于對(duì)相關(guān)技術(shù)的的理解和進(jìn)一步學(xué)習(xí)。目前大數(shù)據(jù)技術(shù)已經(jīng)被應(yīng)用于眾多領(lǐng)域,具有代表性的有知識(shí)圖譜、用戶畫像、推薦系統(tǒng)、異常檢測(cè)、社交網(wǎng)絡(luò)、零售分析、計(jì)算廣告和人工智能;人才培養(yǎng)角色描述大數(shù)據(jù)科學(xué)家(Big

5、 Data Scientist)專注于大數(shù)據(jù)領(lǐng)域特定科學(xué)問(wèn)題的深入研究,具有整合不同來(lái)源、不同格式、不同質(zhì)量數(shù)據(jù)集的能力,通過(guò)對(duì)數(shù)據(jù)集的融合和分析,提出具有創(chuàng)新性的解決方案。從業(yè)者可以擁有不同的知識(shí)背景,如經(jīng)濟(jì)、物理、統(tǒng)計(jì)、計(jì)算機(jī)和應(yīng)用數(shù)學(xué)等,通常擁有碩士或博士學(xué)位。大數(shù)據(jù)分析師(Big Data Analyst)針對(duì)給定應(yīng)用場(chǎng)景和系統(tǒng)中的數(shù)據(jù)進(jìn)行分析,對(duì)具體問(wèn)題提出可行的解決方案,并能夠指導(dǎo)工程師進(jìn)行開發(fā)和測(cè)試。從業(yè)者通常擁有數(shù)學(xué)、統(tǒng)計(jì)、計(jì)算機(jī)、經(jīng)濟(jì)或金融的學(xué)士學(xué)位,并且熟悉主流的編程語(yǔ)言、開源系統(tǒng)和統(tǒng)計(jì)分析工具。大數(shù)據(jù)架構(gòu)師(Big Data Architect)針對(duì)特定的大數(shù)據(jù)問(wèn)題和需求

6、,設(shè)計(jì)相應(yīng)的系統(tǒng)架構(gòu),是連接大數(shù)據(jù)科學(xué)家、大數(shù)據(jù)分析師和大數(shù)據(jù)工程師的橋梁,負(fù)責(zé)大數(shù)據(jù)解決方案的全生命周期管理,包括需求分析、技術(shù)選型、架構(gòu)設(shè)計(jì)、應(yīng)用設(shè)計(jì)、開發(fā)和測(cè)試、部署和運(yùn)維。從業(yè)者需要有豐富的應(yīng)用架構(gòu)經(jīng)驗(yàn),熟悉主流大數(shù)據(jù)處理平臺(tái)的優(yōu)缺點(diǎn)和適用場(chǎng)景。大數(shù)據(jù)工程師(Big Data Engineer)根據(jù)大數(shù)據(jù)架構(gòu)師的設(shè)計(jì),在具體項(xiàng)目中負(fù)責(zé)數(shù)據(jù)的收集、預(yù)處理、算法實(shí)現(xiàn)、可視化及部署和運(yùn)維。從業(yè)者應(yīng)當(dāng)熟練使用主流的軟硬件平臺(tái)、開發(fā)語(yǔ)言和測(cè)試工具,具有學(xué)習(xí)使用大數(shù)據(jù)相關(guān)開源系統(tǒng)的能力,通常擁有計(jì)算機(jī)相關(guān)專業(yè)的學(xué)士學(xué)位??茖W(xué)家與分析師架構(gòu)師與工程師2018年本科師資培訓(xùn)項(xiàng)目評(píng)審(已完成)要求與流程

7、為期三天,容量不少于40人項(xiàng)目經(jīng)費(fèi)不超過(guò)人民幣80000元(含稅費(fèi)和管理費(fèi))2018年1月19日前提交2018年1月31日前推薦至Google教育合作部門推薦標(biāo)準(zhǔn)課程內(nèi)容與主講教師(有助于學(xué)員開拓視野,加深對(duì)數(shù)據(jù)科學(xué)的理解)項(xiàng)目負(fù)責(zé)人背景和依托單位的保障能力申報(bào)情況共收到4份申請(qǐng)書第一推薦:貴州財(cái)經(jīng)大學(xué)2018年第一批產(chǎn)學(xué)合作協(xié)同育人課程項(xiàng)目推薦要求與流程適用于本科課堂教學(xué)和在線教育的課程資源申報(bào)截止日期是2018年4月30日截止日期前發(fā)送到wanzc項(xiàng)目建設(shè)經(jīng)費(fèi)人民幣5萬(wàn)元(1年)與項(xiàng)目掛鉤的真實(shí)課程情況推薦標(biāo)準(zhǔn)與依托單位所開設(shè)正式課程的關(guān)系(2/3相符)與數(shù)據(jù)科學(xué)技術(shù)知識(shí)點(diǎn)相符(優(yōu)先支持系

8、統(tǒng)平臺(tái)和案例分析相關(guān)課程)課程基礎(chǔ)(課程資源、主講人背景等)課程規(guī)模(學(xué)時(shí)、選課人數(shù)等)歡迎咨詢和交流!推薦谷歌中國(guó)教育合作項(xiàng)目專家組成員參見谷歌中國(guó)教育合作項(xiàng)目專家組施行辦法任期2年參加年度專家組會(huì)議,討論和擬定合作項(xiàng)目下一步方向和工作重點(diǎn);審議谷歌教育合作項(xiàng)目重大項(xiàng)目發(fā)布或活動(dòng)方案草案,提供專家咨詢建議;受邀參加谷歌教育合作項(xiàng)目申報(bào)書評(píng)審,給出評(píng)審結(jié)果和意見;可選參加谷歌中國(guó)教育合作部所組織的會(huì)議或活動(dòng),參與研討、分享和交流。推薦標(biāo)準(zhǔn)從事數(shù)據(jù)科學(xué)相關(guān)的科研與教學(xué)工作;積極參與數(shù)據(jù)科學(xué)技術(shù)群的活動(dòng)與交流;:3000數(shù)據(jù)科學(xué)技術(shù)課程資源建設(shè)內(nèi)容教學(xué)大綱(目標(biāo)、教材、教學(xué)內(nèi)容、課時(shí)安排、考評(píng)標(biāo)準(zhǔn))教學(xué)課件(PP

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論