泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽-張穎峰_第1頁
泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽-張穎峰_第2頁
泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽-張穎峰_第3頁
泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽-張穎峰_第4頁
泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽-張穎峰_第5頁
已閱讀5頁,還剩101頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽

“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽組委會

“泰迪杯”組委會秘書長張穎峰

主要內(nèi)容

泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽歷史、賽制、發(fā)展、資源、合作

數(shù)據(jù)挖掘與數(shù)學(xué)建模關(guān)系、示例從一道競賽題目的解答情況看當(dāng)前數(shù)據(jù)挖掘教學(xué)的問題2017年競賽題目及背景解讀2泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽的歷史華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院2010年在本科生中開設(shè)數(shù)據(jù)挖掘課程,舉辦競賽的初衷是我們的課堂距離這個信息時代的熱點太遙遠(yuǎn)了上了多年的數(shù)據(jù)挖掘課,老師和學(xué)生都沒見過企業(yè)中的實際需求和數(shù)據(jù)是什么樣子數(shù)據(jù)挖教材中要么沒有數(shù)據(jù),要么“太干凈”了課堂講授的主要是各種機器學(xué)習(xí)算法,這只是數(shù)據(jù)挖掘完整鏈條上的一小部分,缺乏對問題定義和理解的訓(xùn)練有沒有一個機會讓學(xué)生體驗真實的數(shù)據(jù)挖掘工作是如何開展的呢?讓我們舉辦一個競賽吧!3泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽的歷史挑戰(zhàn)賽性質(zhì)面向全國在校研究生和大學(xué)生的群眾性科技活動挑戰(zhàn)賽目的激勵學(xué)生學(xué)習(xí)數(shù)據(jù)挖掘的積極性以問題為導(dǎo)向提高學(xué)生利用數(shù)據(jù)挖掘方法分析和解決實際問題的綜合能力提高學(xué)生的自我學(xué)習(xí)能力推動數(shù)據(jù)挖掘技術(shù)在高校的推廣和應(yīng)用連接高校的智力資源和社會、企業(yè)實際需求4泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽的歷史第一屆“泰迪華南杯”大學(xué)生數(shù)據(jù)挖掘競賽(2013)第二屆“泰迪華南杯”大學(xué)生數(shù)據(jù)挖掘競賽(2014)

-主辦單位:廣州泰迪智能科技有限公司華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院第三屆“泰迪杯”全國大學(xué)生數(shù)據(jù)挖掘競賽(2015)

-主辦單位:廣東省工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會

-承辦單位:廣州泰迪智能科技有限公司

-協(xié)辦單位:華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院5泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽的歷史第四屆“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽(2016)

-主辦單位:全國大學(xué)生數(shù)學(xué)建模競賽組織委員會

-承辦單位:廣州泰迪智能科技有限公司

-協(xié)辦單位:廣東省工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會

華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院第五屆“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽(2017)

-主辦單位:全國大學(xué)生數(shù)學(xué)建模競賽組織委員會

-承辦單位:廣州泰迪智能科技有限公司

-協(xié)辦單位:廣東省工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會

華南師范大學(xué)6“泰迪杯”成為全國數(shù)模組委會三大品牌之一數(shù)學(xué)建模競賽的四種形式"泰迪杯"數(shù)據(jù)挖掘桃戰(zhàn)賽致力于解決企業(yè)、社會實際問題,打造大數(shù)據(jù)領(lǐng)域高校、企業(yè)共贏的交流合作平臺7全國賽1992美國賽1985深圳杯2011泰迪杯2016“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽組織委員會成立全國大學(xué)生數(shù)學(xué)建模競賽組織委員會的下級組織:“泰迪杯”數(shù)據(jù)挖掘競賽組織委員會,全權(quán)處理競賽活動的具體事務(wù)。“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽組織委員會(第五屆)主任:陳叔平副主任:郝志峰張良均組委會成員:謝金星蔡志杰白峰杉楊虎張穎峰馮國燦馮偉貞秘書長:張穎峰“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽賽制挑戰(zhàn)賽內(nèi)容源于企業(yè)、管理機構(gòu)和科研院所等的經(jīng)過適當(dāng)簡化加工的實際問題貼近現(xiàn)實熱點需求:解題知識可轉(zhuǎn)化為就業(yè)技能,優(yōu)秀方案可轉(zhuǎn)化為科技成果(專利、產(chǎn)品、項目)數(shù)據(jù)只做必要的脫敏處理,保持原始狀態(tài)(其中可能存在錯誤),數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析工作量較大多樣的數(shù)據(jù)類型:圖片、視頻、文本、非結(jié)構(gòu)化表格論文形式包括問題分析、數(shù)據(jù)預(yù)處理、模型構(gòu)建、模型評價與模型應(yīng)用等方面的研究報告。

9“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽賽制挑戰(zhàn)賽采用通訊賽的方式,在官方網(wǎng)站上完成注冊報名、題目和數(shù)據(jù)下載、論文上傳等工作。全國統(tǒng)一競賽題目,以小組為單位參賽。競賽不設(shè)組別,使用相同的題目,在校的??啤⒈究?、研究生都可組隊,每隊不超過3人,須屬于同一所學(xué)校每隊可設(shè)一名指導(dǎo)教師,從事賽前輔導(dǎo)和參賽的組織工作,并且在競賽期間可以全程指導(dǎo)隊員。出題企業(yè)和組委會期待高水平的解決方案!“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽賽制由組委會聘請專家組成評閱委員會進行論文的評閱,采用匿名、地區(qū)回避和隨機的評閱原則評獎原則數(shù)據(jù)預(yù)處理的完整性、對問題背景理解的深刻性挖掘模型構(gòu)建的創(chuàng)造性、模型結(jié)果的正確性模型評價的客觀性、模型應(yīng)用的可靠性文字表述的清晰性主要評判依據(jù)滿足出題企業(yè)實際應(yīng)用需求的程度,特設(shè)企業(yè)冠名獎

11“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽賽制評閱過程第一輪網(wǎng)上評閱,初步選出一、二和三等獎第二輪抽取各題的前20名,由高校和企業(yè)專家通過網(wǎng)絡(luò)進行視頻答辯,評選出特等獎獎項設(shè)置:獲獎總比例不超過25%特等獎共6名(每題2名)特等獎并獲得出題企業(yè)冠名3名,獎金2萬元非冠名特等獎3名,獎金1萬元一等獎54名,二等獎約5%,三等獎約10%其余成功提交完整的論文者可獲得成功參賽證書12“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽賽制自2017年第五屆“泰迪杯”起增設(shè)省級獎項評獎方法:將成績從“泰迪杯”全國評閱系統(tǒng)中導(dǎo)出,由省按專科、本科分組后,按比例產(chǎn)生各獎項。目前已在部分省份試點“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽賽制競賽分為兩階段第一階段1個月:公布題目和樣例數(shù)據(jù),組委會以網(wǎng)絡(luò)公開課形式安排多次賽前指導(dǎo)第二階段15天:正式競賽,公布完整數(shù)據(jù)競賽時間較長,可以深入研究問題、建立完善流程

賽后研究給學(xué)生提供更多深入接觸企業(yè)的機會總額10萬元的創(chuàng)新基金,為獲得特等獎、一等獎及二等獎的隊伍提供后續(xù)研究的資助。特等、一、二、三等獎獲得者可優(yōu)先得到實習(xí)及推薦工作機會。14泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽的發(fā)展15第五屆報名參賽隊伍達到2541支泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽的發(fā)展(2017年數(shù)據(jù))分布范圍廣-地域16

參賽學(xué)生所在的院校

不再僅僅集中于省內(nèi)參賽隊伍地域分布圖

眾多來自北京、上海、

山東、湖北等全國25

個省、自治區(qū)、直轄

市的學(xué)生參加參賽學(xué)生遍及全國各地區(qū)

泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽的發(fā)展(2017年數(shù)據(jù))本??频年犖閿?shù)量最多,其中又以大三這一年級最為突出正就讀碩士及其以上學(xué)歷的參賽學(xué)生的總比例約為12.3%囊括專、本、碩、博

的不同年級

參賽隊伍年級分布圖參賽專業(yè)分布(2017年數(shù)據(jù))對口專業(yè):

數(shù)學(xué)與應(yīng)用數(shù)學(xué)、應(yīng)用統(tǒng)計學(xué)、統(tǒng)計學(xué)等數(shù)學(xué)相關(guān)專業(yè)信息與計算科學(xué)、軟件工程、計算機科學(xué)與技術(shù)、等計算機專業(yè)參賽比例較高

相關(guān)專業(yè):金融(如金融學(xué)、金融數(shù)學(xué)等)管理(財務(wù)管理、市場營銷等)醫(yī)療(藥物制劑、臨床醫(yī)學(xué)等)通信(物聯(lián)網(wǎng)、通信工程等)物理(電氣工程及其自動化、光學(xué)工程等)化學(xué)(化學(xué)工程與工藝、環(huán)境工程等)…………泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽的發(fā)展數(shù)據(jù)時代的有力召喚:各級各類數(shù)據(jù)競賽的爆發(fā)說明了社會對數(shù)據(jù)挖掘技術(shù)和人才的巨大需求

全國大學(xué)生數(shù)據(jù)挖掘邀請賽中國互聯(lián)網(wǎng)數(shù)據(jù)平臺數(shù)據(jù)挖掘競賽全國大學(xué)生統(tǒng)計建模大賽阿里天池大數(shù)據(jù)競賽CDA杯大數(shù)據(jù)全生態(tài)全國高校創(chuàng)新創(chuàng)業(yè)競賽中國互聯(lián)網(wǎng)絡(luò)信息中心舉辦(僅2013)阿里巴巴集團舉辦(2014-)經(jīng)管之家聯(lián)合CDAInstitute共同舉辦(2016-)中國計算機學(xué)會泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽競賽資源泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽網(wǎng)站:競賽論壇競賽QQ群賽前輔導(dǎo)視頻資源賽題解讀數(shù)據(jù)挖掘工具使用泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽競賽資源

面向教練和學(xué)生的網(wǎng)絡(luò)在線培訓(xùn)MATLAB培訓(xùn)課程R語言培訓(xùn)題目解讀專題講解向教練員免費提供大數(shù)據(jù)系列叢書教材泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽競賽資源2017年MathWorks中國成為泰迪杯合作伙伴設(shè)置立MATLAB特別獎,獎金2萬元為參賽學(xué)生提供競賽期間的MATLAB軟件使用授權(quán)提供MATLAB培訓(xùn)課程MATLAB培訓(xùn)課程第1講:MATLAB快速入門

第2講:MATLAB數(shù)據(jù)挖掘基礎(chǔ)

MATLAB數(shù)據(jù)挖掘的過程數(shù)據(jù)的可視化、數(shù)據(jù)的預(yù)處理、數(shù)據(jù)的探索假設(shè)檢驗、數(shù)據(jù)回歸第3講:MATLAB數(shù)據(jù)挖掘算法(上)回歸算法、關(guān)聯(lián)算法、聚類算法第4講:MATLAB數(shù)據(jù)挖掘算法(下)

分類算法、預(yù)測算法、異常診斷算法23MATLAB培訓(xùn)課程第5講:MATLAB高級數(shù)據(jù)挖掘技術(shù)

MATLAB分類學(xué)習(xí)機、算法的高級使用方法綜合使用實例第6講:MATLAB數(shù)據(jù)挖掘項目實例故障診斷生物信息學(xué)研究量化投資24R語言培訓(xùn)課程利用R語言對數(shù)據(jù)進行高效處理對數(shù)據(jù)進行隨機抽樣、對數(shù)據(jù)進行等比例抽樣對類失衡數(shù)據(jù)進行處理如何對因子變量進行虛擬化處理如何對缺失值進行插補、如何識別異常值R語言進行數(shù)據(jù)可視化R語言繪圖基礎(chǔ)、常見繪圖圖表lattice包、ggplot2包介紹R語言進行數(shù)據(jù)交互25泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽競賽資源泰迪云課堂誠邀挑戰(zhàn)賽合作伙伴廠商、企業(yè)、機構(gòu)合作伙伴提供有價值的實際問題作為賽題為競賽的開展提供物質(zhì)、資金或人力贊助為參賽者提供大數(shù)據(jù)計算平臺為參賽者提供挖掘工具的使用或教育支持為參賽學(xué)生提供實習(xí)、項目研究的機會高等院校合作伙伴提供候選賽題或通過自身渠道協(xié)助聯(lián)系出題單位承辦挑戰(zhàn)賽頒獎典禮暨數(shù)據(jù)挖掘?qū)W術(shù)/教學(xué)會議/教練培訓(xùn)征集挑戰(zhàn)賽題目侯選賽題的要求反映行業(yè)、社會熱點需求問題的背景易理解,貼近日常生活體驗,淡化過于專業(yè)的背景知識提供的數(shù)據(jù)具有適當(dāng)?shù)囊?guī)模和復(fù)雜度;數(shù)據(jù)可公開,經(jīng)過必要的脫敏處理,無版權(quán)或隱私等法律問題侯選賽題的形式問題的背景、意義,當(dāng)前的處理方法與困難數(shù)據(jù)的格式、說明和示例數(shù)據(jù)分析、數(shù)據(jù)挖掘的目標(biāo)/主題評價指標(biāo)和評價方案28主要內(nèi)容

泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽歷史、賽制、發(fā)展、資源、合作

數(shù)據(jù)挖掘與數(shù)學(xué)建模關(guān)系、示例從一道競賽題目的解答情況看當(dāng)前數(shù)據(jù)挖掘教學(xué)的問題2017年競賽題目及背景解讀29數(shù)據(jù)挖掘與數(shù)學(xué)建模數(shù)學(xué)建模就是建立數(shù)學(xué)模型解決實際問題的過程,其方法大體分為機理分析和測試分析兩種。機理分析:根據(jù)對客觀事物特性的認(rèn)識,找出反映內(nèi)部機理的數(shù)量規(guī)律,建立的模型常有明確的物理或現(xiàn)實意義測試分析:在不清楚事物內(nèi)在的機理時,通過對系統(tǒng)輸入、輸出數(shù)據(jù)的測量和統(tǒng)計分析,按照一定的準(zhǔn)則找出與數(shù)據(jù)擬合最好的模型(經(jīng)驗?zāi)P?。數(shù)據(jù)挖掘與數(shù)學(xué)建模數(shù)據(jù)挖掘從大量的、不完全的、有噪聲的、隨機的實際應(yīng)用數(shù)據(jù)中,自動或半自動化地提取隱含在其中的潛在有用的信息和知識的過程。數(shù)據(jù)挖掘的本質(zhì)就是數(shù)學(xué)建模,其含義與測試分析接近舉例:牛頓第二定律的發(fā)現(xiàn)測試分析:從斜面實驗數(shù)據(jù)中尋求受力(傾角)與位移、時間、加速度之間的關(guān)系機理分析:根據(jù)牛頓第二定律建立動力學(xué)方程很多領(lǐng)域的研究仍處在測試分析階段數(shù)據(jù)挖掘與數(shù)學(xué)建模泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽與數(shù)學(xué)建模競賽泰迪杯是數(shù)學(xué)建模競賽在數(shù)據(jù)挖掘方向的延伸依托于數(shù)學(xué)建模的競賽組織和教練隊伍數(shù)據(jù)挖掘?qū)?yīng)于大數(shù)據(jù)產(chǎn)業(yè)為學(xué)生指明了明確的發(fā)展方向和就業(yè)出口應(yīng)用廣泛,為高校的智力資源轉(zhuǎn)化為生產(chǎn)力提供途徑泰迪杯的競賽題目大都對應(yīng)于典型的行業(yè)問題數(shù)據(jù)挖掘與數(shù)學(xué)建模數(shù)據(jù)挖掘的興起是數(shù)學(xué)類、信息類專業(yè)發(fā)展的春天數(shù)據(jù)挖掘的學(xué)科構(gòu)成統(tǒng)計學(xué)、時間序列、最優(yōu)化、矩陣分析機器學(xué)習(xí)、人工智能、模式識別圖論(離散數(shù)學(xué))、算法設(shè)計、數(shù)據(jù)庫與數(shù)學(xué)類、信息類專業(yè)高度契合!信息與計算科學(xué)專業(yè)的生存危機數(shù)值計算or計算機應(yīng)用?數(shù)學(xué)和計算機如何有機結(jié)合?背景:網(wǎng)絡(luò)招聘信息平臺現(xiàn)已成為招聘者發(fā)布和應(yīng)聘者獲取信息的主要渠道。網(wǎng)絡(luò)招聘信息反映用人單位對人才基本條件、能力和素質(zhì)的要求反映各行業(yè)對人才的需求現(xiàn)狀及未來一段時間的人才需求趨向是高等院校調(diào)整人才培養(yǎng)方案和設(shè)置安排相關(guān)課程的重要參考為求職者提就業(yè)指導(dǎo)2016年C題:網(wǎng)絡(luò)招聘信息的分析與挖掘網(wǎng)絡(luò)招聘信息通常包含結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩部分附件1:以表格形式給出招聘職位的常規(guī)信息,如公司的基本情況、職位名稱、行業(yè)領(lǐng)域、供職地點、發(fā)布時間、薪酬待遇、學(xué)歷要求、工作性質(zhì)等。附件2:以文本的形式給出招聘單位的基本情況附件3:以文本的形式給出崗位職責(zé)與任職要求2016年C題:網(wǎng)絡(luò)招聘信息的分析與挖掘2016年C題:網(wǎng)絡(luò)招聘信息的分析與挖掘

問題1

根據(jù)招聘職位的工作性質(zhì)和內(nèi)涵,試分析目前所需要的人才中可以分為哪些職業(yè)類型和專業(yè)領(lǐng)域?每個招聘網(wǎng)站都有自己的行業(yè)/職位體系根據(jù)工作性質(zhì)和內(nèi)涵進行細(xì)分是關(guān)鍵文本聚類深度學(xué)習(xí):詞向量——語義學(xué)習(xí)問題2

根據(jù)招聘單位的行業(yè)、職位、地域等特點,分析目前的人才需求情況,哪些是熱門行業(yè)、職位、地域等?并展望其未來的人才需求走向。

2016年C題:網(wǎng)絡(luò)招聘信息的分析與挖掘

問題3

隨著數(shù)據(jù)分析/數(shù)據(jù)挖掘行業(yè)的興起,涌現(xiàn)出了一些新的職位,如數(shù)據(jù)分析師、大數(shù)據(jù)分析師、數(shù)據(jù)產(chǎn)品經(jīng)理、數(shù)據(jù)挖掘算法工程師等,分析與預(yù)測相關(guān)職位的需求情況問題4

深入分析IT人才市場的供求現(xiàn)狀及未來的發(fā)展趨勢,包括地域和職位、人才的專業(yè)和學(xué)歷層次等方面的情況。問題5

根據(jù)你們的研究結(jié)果,結(jié)合你們所學(xué)的專業(yè)給所在學(xué)校人才培養(yǎng)方案的修訂寫一份建議書,或給在校大學(xué)生的就業(yè)規(guī)劃提出你們的建議(不超過兩頁)。職業(yè)技能要求---大數(shù)據(jù)方向職業(yè)細(xì)分?jǐn)?shù)據(jù)分析軟件開發(fā)大數(shù)據(jù)開發(fā)數(shù)據(jù)倉庫java/sql/R/Clementinekettle/spss/excel/eviews統(tǒng)計學(xué)/機器學(xué)習(xí)/數(shù)據(jù)分析決策樹/聚類/關(guān)聯(lián)規(guī)則/推薦

hadoop/java/python/mysqlspark/NoSQL/etl/c++/hive大數(shù)據(jù)/數(shù)據(jù)挖掘/決策樹數(shù)據(jù)庫/機器學(xué)習(xí)

mysql/java/spring/etl/c++j2ee/.Net/Hibernate/JavaEE

計算機/數(shù)據(jù)庫/項目管理面向?qū)ο?開發(fā)能力

mysql/kettle/hbase/hiveolap/python/map/shell/spring數(shù)據(jù)倉庫/數(shù)據(jù)遷移/大數(shù)據(jù)組織協(xié)調(diào)/跟蹤/策劃/監(jiān)督

崗位與技能RHadoop

一些技能雖然不是該職業(yè)的熱門技能,卻在每個職業(yè)中均占據(jù)不小的頻數(shù),如sql;作為開源的數(shù)學(xué)建模和挖掘工具,R、Python越來越受到中、小企業(yè)的青睞!也成為了求職者的重要技能。掌握Hadoop技能在提高就業(yè)能力和層次上顯示越來越重要。數(shù)據(jù)分析/挖掘職位薪酬情況熱門行業(yè)(基于牛頓冷卻定律的熱詞排名)行業(yè)詞頻負(fù)冷卻系數(shù)熱詞評價值熱詞排序移動互聯(lián)網(wǎng)2959310.0061775.591O2O185230.048889.102金融449790.015674.693電子商務(wù)644560.005322.284企業(yè)服務(wù)224370.011246.815數(shù)據(jù)服務(wù)137060.017233.006游戲113320.018203.987醫(yī)療健康47460.03142.388生活服務(wù)56420.01267.709硬件65610.00745.9310信息安全35180.00621.1111招聘11140.01516.7112教育128240.000911.5413社交36660.0027.3314廣告營銷45470.00083.6415分類信息415-0.012-4.9816文化娛樂6713-0.004-26.8517旅游2651-0.016-42.4218熱度上升快的前五個行業(yè):O2O醫(yī)療健康游戲數(shù)據(jù)服務(wù)金融熱門行業(yè)Vs熱度上升趨勢2015年第三屆競賽題目基于電商平臺家電設(shè)備的消費者需求及產(chǎn)品數(shù)據(jù)挖掘分析(美的熱水器)對于用戶在電商平臺上留下的評論數(shù)據(jù),進行如下分析

分析用戶對于熱水器/凈水器產(chǎn)品的個性化需求;

分析現(xiàn)有電商熱水器/凈水器的產(chǎn)品劣勢(用戶抱怨點)及產(chǎn)品優(yōu)勢(用戶贊點);

分析各品牌的產(chǎn)品間的差異,進行差異化賣點提煉

對用戶的購買行為進行分析挖掘(搜索關(guān)鍵字、購買時關(guān)注點、購買步驟、使用、評價)爬蟲、中文分詞、詞頻統(tǒng)計、情感分析、語義網(wǎng)絡(luò)這些問題解決地好可以開發(fā)成產(chǎn)品,有巨大的市場需求。主要內(nèi)容

泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽歷史、賽制、發(fā)展、資源、合作

數(shù)據(jù)挖掘與數(shù)學(xué)建模關(guān)系、示例從一道競賽題目的解答情況看當(dāng)前數(shù)據(jù)挖掘教學(xué)的問題2017年競賽題目及背景解讀432016年B題:鐵路旅客流量預(yù)測給出某鐵路公司15個月的旅客列車梯形密度表,針對ZD190(站)至ZD111(站)區(qū)段的客運專線完成以下任務(wù)問題1:根據(jù)附件1,按車次、時段(小時)、車站、區(qū)間(兩個車站之間)等條件分析客流規(guī)律。問題2:考慮相關(guān)因素的影響,構(gòu)建客流量預(yù)測模型,并預(yù)測未來兩周的客流量。問題3針對D02~D19,優(yōu)化設(shè)計車輛配置及車站??糠桨?。2016年B題:鐵路旅客流量預(yù)測問題背景2016年初發(fā)改委發(fā)布了《關(guān)于改革完善高鐵動車組旅客票價政策的通知》,高鐵動車票價將由鐵路總公司根據(jù)市場情況自行定價的政策出臺。市場化定價的依據(jù)需要了解日常鐵路客運流量、淡旺季變動指數(shù)、冷熱門線路的具體情況。452016年B題:鐵路旅客流量預(yù)測

鐵路客運部門關(guān)注的問題

產(chǎn)品運營如何設(shè)計產(chǎn)品:線路、時間如何銷售產(chǎn)品:車票的分配,考慮站點和放票時間產(chǎn)品設(shè)計和銷售的目標(biāo):獲得最大的收益(客座率)

安全和突發(fā)事件線路:增開臨客保障出行車站:增加安保力量維持秩序需要對旅客出行規(guī)律(時間、起止地點分布)進行深入分析和掌握462016年B題:鐵路旅客流量預(yù)測

問題1根據(jù)附件1,按車次、時段(小時)、車站、區(qū)間(兩個車站之間)等條件分析客流規(guī)律。多維度的數(shù)據(jù)分析單趟車的規(guī)律:時間、日期、站點站點分析:時段、日期區(qū)間:客座率在時段、日期上的分布車輛類型:K、G、D、T、Z管內(nèi)、管外客流分析,長途、短途客流分析從梯形密度表中抽取所需數(shù)據(jù),保存在結(jié)構(gòu)化文檔中472016年B題:鐵路旅客流量預(yù)測旅客列車梯形密度表由購票數(shù)據(jù)匯總得到,反應(yīng)了旅客上車及到站的分布情況困難:非結(jié)構(gòu)化數(shù)據(jù)的處理48數(shù)據(jù)處理的問題鐵路旅客流量預(yù)測:非結(jié)構(gòu)化數(shù)據(jù)的處理題目的難點:如何讀取數(shù)據(jù)?微。風(fēng)打擾一下,請問大家b題excel表中的數(shù)據(jù)是怎么整理的?或者是用什么軟件整理的。感覺好難整理微。風(fēng)導(dǎo)入matlab中就不能分清哪個站到哪個站下了楊征B題就是要求把不規(guī)則的數(shù)據(jù),導(dǎo)入到數(shù)據(jù)庫中,變成規(guī)則的數(shù)據(jù)。企業(yè)中這樣的情況很常見的。內(nèi)事不決問百度:從網(wǎng)絡(luò)上找答案在百度中搜索“matlabexcel數(shù)據(jù)讀取”數(shù)據(jù)處理的問題百度知道N=xlsread('filename.xls')[N,T]=xlsread('filename.xls')

用這個,把excel文件放入工作目錄下,默認(rèn)工作目錄是‘work’文件夾。filename就是excel的名字。

用這個函數(shù)加載后,N里面就是數(shù)字,T里面就是字符。你試一下就明白了,很簡單。然后你就可以進行相應(yīng)處理了。數(shù)據(jù)已經(jīng)進來了,你用for或其他的處理都行。

至于這個函數(shù)的更多用法,去看matlab幫助文檔。微。風(fēng)我用matlab讀入后形成兩個矩陣,然后我就亂了,感覺好多對不上。問題:[N,T]=xlsread('filename.xls')適用于組織地比較“整齊”的數(shù)據(jù),如矩陣形式存儲的數(shù)據(jù),B題數(shù)據(jù)無法直接使用數(shù)據(jù)處理的問題微。風(fēng)

可以說清楚一點嗎?我是學(xué)數(shù)學(xué)的,對于數(shù)據(jù)處理這一塊不是很清楚,一切摸索中楊征

excel就是個大網(wǎng)格矩陣,從(1,1)一直讀到(MaxC,MaxR),想要的數(shù)據(jù)都可以獲取到,在通過循環(huán)和判斷進行處理。楊老師

不要急,這兩天組委會會安排做一個如何讀數(shù)據(jù)的視頻教程楊征使用delphi做了一個小軟件來演示數(shù)據(jù)讀取的過程學(xué)生問楊老師用的那個軟件在哪里有下載?急同問......2016年B題:鐵路旅客流量預(yù)測旅客列車密度表的結(jié)構(gòu)一張表保存一天內(nèi)發(fā)車的多個車次的售票數(shù)據(jù)每個車次給出從給定上車站(列)到給定下車站(行)的下三角形式的OD(ORIGIN,DESTINATION)矩陣不同車次所經(jīng)過的站點是不同的,下三角矩陣的行、列數(shù)也可能不同在MATLAB中help一下xlsread[NUMERIC,TXT,RAW]=XLSREAD(FILE,SHEET,RANGE)單元格內(nèi)容以元胞數(shù)組的方式保存在RAW中2016年B題:鐵路旅客流量預(yù)測使用循環(huán)結(jié)構(gòu)掃描表定位每個車次數(shù)據(jù)在表內(nèi)的行、列范圍例如:車次數(shù)據(jù)都以“上車人數(shù)合計”為最后一行的首列定位終止行:字符串匹配獲取車次:字符串的拆分獲取指定行、列的數(shù)據(jù)B題數(shù)據(jù)處理的問題解決以上問題的“技術(shù)性”要素MATLAB讀入EXCEL文件的函數(shù)xlsread分析表格的結(jié)構(gòu)特點、如何進行邏輯判斷使用循環(huán)結(jié)構(gòu)掃描表字符串匹配、拆分矩陣數(shù)據(jù)的讀取非“技術(shù)性”問題:要讀哪些數(shù)據(jù)?明細(xì)數(shù)據(jù):兩兩站點之間的上下旅客人數(shù)匯總數(shù)據(jù):每個站點的上車人數(shù)和下車人數(shù)不同的數(shù)據(jù)能夠支持的分析主題是不同的B題數(shù)據(jù)處理的問題數(shù)據(jù)處理的思路考慮清楚我們要做哪些分析目標(biāo)和路線,哪些能做、哪些做不了為了實現(xiàn)這些分析需要哪些數(shù)據(jù)哪些有、哪些沒有,沒有的數(shù)據(jù)要如何計算應(yīng)該如何組織數(shù)據(jù)才能更有效進行分析(設(shè)計數(shù)據(jù)庫表)各種問題數(shù)據(jù)缺失:缺少某些站點的上車人數(shù)(缺少列,今天的數(shù)據(jù)有10列,明天變成9列)……缺少一天的數(shù)據(jù)該如何處理?定員是什么(生活常識)?為什么不同時間的定員不同?客座率的計算:每個區(qū)段的車內(nèi)人數(shù)計算B題數(shù)據(jù)處理的問題泰迪杯競賽的參賽者主要以大二、大三學(xué)生為主假設(shè)他們都已經(jīng)學(xué)習(xí)過Office、程序設(shè)計、MATLAB、數(shù)據(jù)庫每個“技術(shù)性”要素學(xué)生理論上都應(yīng)該學(xué)習(xí)過,但組合在一起解決這個問題,老師沒教過,學(xué)生也沒有做過!學(xué)生比較被動一部分學(xué)生太過依賴于老師(課程),缺乏學(xué)習(xí)的主動性優(yōu)秀的學(xué)生大都會主動地進行探索和學(xué)習(xí)如果沒有在相關(guān)課程中學(xué)過,在明確要解決的問題的前提下,也很容易從網(wǎng)絡(luò)中學(xué)習(xí)到!學(xué)生缺乏從最原始形式出發(fā)求解實際問題的訓(xùn)練和信心!數(shù)據(jù)挖掘教學(xué)的現(xiàn)狀教學(xué)偏重算法、原理的學(xué)習(xí)教師缺乏解決實際問題的經(jīng)歷和經(jīng)驗缺少合適的案例教學(xué)資源教學(xué)案例大都是為講解某個具體算法而設(shè)計的缺少實際的應(yīng)用背景問題往往不完整,缺少從問題識別/定義、數(shù)據(jù)采集/實驗設(shè)計、數(shù)據(jù)分析、建模、評估、應(yīng)用的全過程較為理想和干凈的數(shù)據(jù)源,簡化了現(xiàn)實中數(shù)據(jù)的復(fù)雜性改進的思路:在鞏固理論教學(xué)的同時,加強實踐教學(xué)環(huán)節(jié)教育部《教育部等部門關(guān)于進一步加強高校實踐育人工作的若干意見》(教思政[2012]1號)強化實踐教學(xué)環(huán)節(jié):增加實踐教學(xué)比重,確保人文社會科學(xué)類本科專業(yè)不少于總學(xué)分(學(xué)時)的15%、理工農(nóng)醫(yī)類本科專業(yè)不少于25%深化實踐教學(xué)方法改革:重點推行基于問題、基于項目、基于案例的教學(xué)方法和學(xué)習(xí)方法;支持學(xué)生開展研究性學(xué)習(xí)、創(chuàng)新性實驗、創(chuàng)業(yè)計劃和創(chuàng)業(yè)模擬活動。積極發(fā)揮學(xué)生主動性:支持和引導(dǎo)班級、社團等學(xué)生組織自主開展社會實踐活動,發(fā)揮學(xué)生在實踐育人中的自我教育、自我管理、自我服務(wù)作用。實踐教學(xué)的探索華南師范大學(xué)的探索課程考核學(xué)生必須參加與數(shù)據(jù)挖掘相關(guān)的學(xué)科競賽并成功提交論文才能獲得成績實踐課程(必修)數(shù)據(jù)挖掘?qū)嵺`(1學(xué)分):學(xué)科競賽/大學(xué)生課外科技活動/論文或?qū)@诙n堂:引入企業(yè)資源少學(xué)時(周二或集中兩周)、低年級、混合教學(xué)基于問題的學(xué)習(xí)、探究式學(xué)習(xí)企業(yè)負(fù)責(zé)學(xué)習(xí)評價實踐教學(xué)的探索數(shù)據(jù)挖掘方向?qū)I(yè)實習(xí)的困難相對軟件開發(fā),數(shù)據(jù)挖掘?qū)θ藛T的要求更高任務(wù)不是標(biāo)準(zhǔn)化的,非流水線型需要分析人員有業(yè)務(wù)經(jīng)驗數(shù)據(jù)敏感,保密要求高很多業(yè)務(wù)要去客戶現(xiàn)場數(shù)據(jù)挖掘企業(yè)是智力密集型企業(yè),辦公場地小無法大規(guī)模接納實習(xí)生實習(xí)的新形式:非現(xiàn)場實習(xí)(校內(nèi)實習(xí))把企業(yè)一線工程師/講師請進學(xué)校,降低實習(xí)成本真實案例下的情景教學(xué)實踐教學(xué)的探索調(diào)動學(xué)生的主動性:在學(xué)生中建立數(shù)據(jù)挖掘俱樂部學(xué)生自發(fā)組織,開展數(shù)據(jù)挖掘?qū)W習(xí)學(xué)生教學(xué)組每周定期為俱樂部成員講授R語言、Python及數(shù)據(jù)挖掘算法核心成員參加企業(yè)項目(2016年——)基于華為大數(shù)據(jù)平臺的零售行業(yè)渠道管理解決方案的開發(fā)項目基于微信端的商業(yè)智能服務(wù)解決方案的開發(fā)項目課程助教實踐教學(xué)的探索主要內(nèi)容

泰迪杯數(shù)據(jù)挖掘挑戰(zhàn)賽歷史、賽制、發(fā)展、資源、合作

數(shù)據(jù)挖掘與數(shù)學(xué)建模關(guān)系、示例從一道競賽題目的解答情況看當(dāng)前數(shù)據(jù)挖掘教學(xué)的問題

2017年競賽題目及背景解讀62A題基于市場資金流向分析的商品期貨量化交易策略出題單位——深圳數(shù)字動能信息技術(shù)有限公司量化投資借助現(xiàn)代統(tǒng)計學(xué)、數(shù)學(xué)的方法,從海量歷史數(shù)據(jù)中尋找能夠帶來超額收益的多種“大概率”策略,并紀(jì)律嚴(yán)明地按照這些交易策略所構(gòu)建的數(shù)量化模型來指導(dǎo)投資(減少投資者情緒波動的影響),力求取得穩(wěn)定的、可持續(xù)的、高于平均的超額回報。一個優(yōu)秀的策略可以維持一個可觀且穩(wěn)定的收益,且承受相對較小的風(fēng)險,收益曲線平滑向上A題背景基于市場資金流向分析的商品期貨量化交易策略量化投資在海外已有30多年的歷史,投資業(yè)績穩(wěn)定,市場規(guī)模和份額不斷擴大,得到了越來越多投資者的認(rèn)可被譽為“最賺錢的基金經(jīng)理”的西蒙斯,從1989年到2006年間,其量化投資年化收益率高達38.5%。他依靠的是用數(shù)學(xué)模型和計算機管理旗下基金,通過模型和策略來捕捉市場機會,由策略來做出投資決策。A題背景基于市場資金流向分析的商品期貨量化交易策略2016年的國內(nèi)資本市場,使用量化投資方式進行管理的基金創(chuàng)造了驚人的業(yè)績。截至2017年1月12日,在上證綜指和創(chuàng)業(yè)板指近1年漲幅只有3.40%和-8.37%的情況下,公募主動量化基金獲得了16.05%的平均收益,遠(yuǎn)超同期股票基金和混合基金5.49%和3.58%的收益。截至2017年1月12日,公募主動量化基金近3年的平均回報率為105.07%,收益率接近同期權(quán)益類基金的兩倍A題背景量化交易策略包含一系列交易條件的設(shè)置和交易信號的產(chǎn)生。比如對某只股票或者期貨,以前5根K線的收盤價(一般記作close)的平均值作為一個指標(biāo),當(dāng)價格超過這個指標(biāo)值的時候買入,而當(dāng)價格低于這個指標(biāo)值的時候賣出平倉,就是一個簡單的均線突破策略。在程序設(shè)計中可以使用if-then結(jié)構(gòu)來實現(xiàn)。可以設(shè)制非常復(fù)雜的組合策略A題背景策略回測回測是指用歷史行情數(shù)據(jù)測試交易策略的過程。通過策略回測,我們可以知道給定的交易策略在遇到各種市場情況下的不同表現(xiàn),以此來判斷該策略是否符合我們的設(shè)計預(yù)期,是否能獲得穩(wěn)定的投資收益。數(shù)字動能為本次比賽提供策略研究軟件Auto-Trader,以供參賽者進行策略回測。Auto-Trader平臺使用MATLAB語言進行編程量化方法的流派選股單因子(改良技術(shù)指標(biāo)、通過數(shù)學(xué)方法構(gòu)造因子)、多因子、事件驅(qū)動、輿情分析都是比較熱門的。擇時(不同尺度,不同品種)個股擇時指數(shù)擇時(大盤指數(shù),行業(yè)指數(shù)等)商品期貨、股指期貨擇時(擇機策略)國債指貨行業(yè)配置套利(ETF,配對交易……)A題背景題目的出發(fā)點:基于資金流向的價格預(yù)測“水漲船高”大量資金不斷流入的股票其價格會上漲資金大量流出的股票其股價可能下跌股票市場中常說“量于價先行”,這個“量”包括資金的流向和資金的流量,統(tǒng)稱為資金流向(moneyflow)。價格上漲,流動性低(交易量很?。〢題背景資金流向反映市場當(dāng)前對某只股票超額的需求或者供給,能夠幫助投資者透過指數(shù)(價格)漲跌的迷霧看到其他投資者的投資行為。股市資金流向計算:可以根據(jù)成交價格的漲跌來界定是資金流入還是流出A題問題問題使用2011年1月1日至2013年12月31日的商品期貨歷史數(shù)據(jù),分析資金流向的規(guī)律,設(shè)計一個商品期貨量化交易策略。使用策略研究系統(tǒng)Auto-Trader回測引擎對2014年1月1日至2015年12月31日的數(shù)據(jù)進行策略回測。分析有監(jiān)督的策略學(xué)習(xí),從回測結(jié)果來改進量化交易策略題目數(shù)據(jù)的時間區(qū)間選擇:總量相對平穩(wěn)A題問題樣本數(shù)據(jù)說明提供商品期貨歷史分鐘K線的樣本數(shù)據(jù)2011年1月1日至2013年12月31日的數(shù)據(jù):訓(xùn)練集2014年1月1日至2015年12年31日的數(shù)據(jù):測試集包括開盤價、最高價、最低價、收盤價等信息。close:收盤價high:最高價low:最低價open:開盤價openinterest:持倉量time:時間turnover:成交金額volume:成交A題解讀股票市場中,當(dāng)期資金流向與未來資金流向之間、資金流向與股票收益率之間存在著正相關(guān)關(guān)系。羊群效應(yīng)如果機構(gòu)投資者具有高度的同質(zhì)性,他們通常關(guān)注同樣的市場信息,采用相似的經(jīng)濟模型、信息處理技術(shù)、組合及對沖策略,那么容易產(chǎn)生“羊群效應(yīng)”?!把蛉盒?yīng)”下,大量的投資者會采取跟隨行動,持續(xù)的買進或者賣出市場看好或者不看好的股票,導(dǎo)致了超額需求和超額供給的存在。A題解讀股票市場中,當(dāng)期資金流向與未來資金流向之間、資金流向與股票收益率之間存在著正相關(guān)關(guān)系。資金流向不僅反映了當(dāng)期股票的超額供給與需求,也反映了未來股票的超額供給與需求。交易中沖擊成本的存在,使得機構(gòu)投資者在實行其投資目標(biāo)的時候,會采取分批建倉或者分批減倉的行為,把大量的訂單進行分拆,以便降低市場的沖擊成本。持續(xù)的建倉或者減倉,使得當(dāng)期資金流向與未來資金流向之間、資金流向與股票收益率之間存在著正相關(guān)關(guān)系A(chǔ)題技術(shù)路線(建議)從如下角度入手進行分析,并以此為基礎(chǔ)來構(gòu)建策略模型運用分鐘級K線數(shù)據(jù),構(gòu)造資金流向模型。期貨市場資金流向沒有公認(rèn)的唯一的計算方法,仍屬開放課題資金流向的構(gòu)造注重對價格的影響資金流向?qū)ξ磥砩唐菲谪浀膬r格有什么影響?資金流向與價格在時間上的相關(guān)性(時間尺度的確定)資金流向是否具有持續(xù)性?只有具備持續(xù)性(慣性),才具有可操作性(可預(yù)測性)A題技術(shù)路線(建議)從如下角度入手進行分析,并以此為基礎(chǔ)來構(gòu)建策略模型分析資金流向是否存在相似的特點,是否集中在某些行業(yè)板塊,是否有輪動效應(yīng)?輪動意思是各個板塊輪流表現(xiàn)。比如現(xiàn)在是汽車股上漲,一會兒是機械股,再來是有色金屬股。不斷地有熱錢進入股市,不斷有人接盤。今天這個板塊漲,過幾天那個板塊漲。A題技術(shù)路線(建議)板塊輪動的本質(zhì)我國的金融投資者分機構(gòu)戶和個人戶,機構(gòu)戶的資金比個人戶多得多,其中左右股價的是機構(gòu)戶中的基金公司大筆資金/股票的主動交易可以拉升或降低幾個點普通散戶追漲殺跌,再遇到某些買入的理由(重組、估值低、政策之類)很多人就跟風(fēng)買進價格上漲價格合適,機構(gòu)出貨獲得資金,散戶在高位接盤機構(gòu)離場,沒有新錢注入,版塊進入停漲,進入盤整階段:水平的波浪線(沒有趨勢)。另外一個版塊好像調(diào)整的充分了,就慢慢建倉,收購這些不漲的股票,接著炒作,股票又漲起來了。A題技術(shù)路線(建議)網(wǎng)上流傳炒股四季歌,揭秘A股市場各板塊輪動規(guī)律冬炒煤來夏炒電,五一十一旅游見逢年過節(jié)有煙酒,兩會環(huán)保新能源航空造紙人民幣,通脹保值就買地戰(zhàn)爭黃金和軍工,加息銀行最受益地震災(zāi)害炒水泥,工程機械亦可取市場商品熱追捧,上下游廠尋蹤跡年報季報細(xì)分析,其中自有顏如玉量化策略從較客觀的數(shù)據(jù)出發(fā)研究輪動的捕捉和相應(yīng)的策略A題技術(shù)路線(建議)從如下角度入手進行分析,并以此為基礎(chǔ)來構(gòu)建策略模型統(tǒng)計各個板塊的資金流向,對比整個市場的資金流向、某一板塊的資金流向與單個標(biāo)的的資金流向之間的關(guān)系。在一個相對固定的時間段內(nèi),資金的總量是相對確定的價格的傳導(dǎo):房地產(chǎn)金融水泥鋼材B題中央空調(diào)系統(tǒng)的數(shù)據(jù)分析與控制策略出題單位——廣州泰迪智能科技有限公司

——美國伊利諾伊大學(xué)新加坡高等數(shù)字科學(xué)中心問題背景隨著氣候變暖,人們對空調(diào)的依賴越來越大中央空調(diào)系統(tǒng)成為城市的用電大戶中央空調(diào)常規(guī)的控制方法是采用恒定或人工修改設(shè)定參數(shù)的方式,系統(tǒng)的能耗和效率依賴于操作人員的經(jīng)驗題目目標(biāo)以實測數(shù)據(jù)為基礎(chǔ)開展中央空調(diào)系統(tǒng)的智能控制研究,實現(xiàn)系統(tǒng)控制的優(yōu)化與節(jié)能。80我們看到的中央空調(diào)系統(tǒng)81冷卻塔管道出風(fēng)口機組中央空調(diào)系統(tǒng)的工作原理圖82外循環(huán)內(nèi)循環(huán)家用空調(diào)的制冷原理冷凝器將由壓縮機輸送過來的高壓高溫的冷媒汽體冷卻成高壓高溫的液體(大氣溫度低于冷媒蒸汽溫度)。蒸汽冷凝成液體會釋放熱量,其表面是熱(燙)的。蒸發(fā)器則將經(jīng)節(jié)流器節(jié)流減壓后的冷媒液體蒸發(fā)成汽體冷媒液體汽化(蒸發(fā))的過程是一個吸熱的過程,所以蒸發(fā)器表面是涼的(吸熱)。冷媒在室內(nèi)機蒸發(fā)成汽態(tài)(吸熱)后循環(huán)至室外機經(jīng)壓縮機壓縮冷凝成液態(tài)(放熱)。運轉(zhuǎn)的壓縮機像水泵一樣不斷地從蒸發(fā)器(位于室內(nèi))吸熱,然后再通過冷凝器(位于室外)散熱。本題研究的中央空調(diào)系統(tǒng)的結(jié)構(gòu)示意圖84制冷裝置CHILLER冷卻塔CT冷凝水泵CWP冷水泵CHWP數(shù)據(jù)內(nèi)容說明提供熱帶地區(qū)某城市的一套中央空調(diào)系統(tǒng)的實測數(shù)據(jù)年平均溫度為25至32攝氏度之間,平均濕度為85%左右系統(tǒng)采用根據(jù)外部環(huán)境條件和經(jīng)驗由人工設(shè)定的策略控制數(shù)據(jù)共51個字段(見附件2數(shù)據(jù)說明):采集時間:年月日時分環(huán)境信息:室外相對濕度和溫度系統(tǒng)可控變量:設(shè)備的開關(guān)和運行參數(shù)系統(tǒng)采集信息:設(shè)備的耗電量、相關(guān)傳感器讀數(shù)(如冷凝水進/出冷卻裝置的水溫和流速等);系統(tǒng)運行相關(guān)信息:耗電量、冷卻負(fù)載、系統(tǒng)效率等。85數(shù)據(jù)內(nèi)容說明附件2給出了數(shù)據(jù)的字段名、含義、單位等內(nèi)容說明86數(shù)據(jù)內(nèi)容說明系統(tǒng)的可控變量――設(shè)備狀態(tài)參數(shù)(開/關(guān))(12個):冷水泵1~4的狀態(tài)參數(shù):chwp1stat~chwp4stat冷凝水泵1~3的狀態(tài)參數(shù):cwp1stat~cwp3stat冷卻裝置1~3的狀態(tài)參數(shù):ch1stat~ch3stat冷卻塔1,2的狀態(tài)參數(shù):ct1stat,ct2stat系統(tǒng)的可控變量――設(shè)備控制參數(shù)(3個):冷水泵轉(zhuǎn)速(設(shè)定值):chwp_pc冷凝水泵轉(zhuǎn)速(設(shè)定值):cwp_pc冷卻塔風(fēng)扇轉(zhuǎn)速(設(shè)定值):ct_pc87數(shù)據(jù)內(nèi)容說明其他由傳感器采集數(shù)據(jù)均為不可控參數(shù),受可控參數(shù)、室外溫度和濕度等因素影響,決定系統(tǒng)耗電量和系統(tǒng)效率。例:設(shè)備功率受可控制參數(shù)和環(huán)境因素影響,不是可控變量競賽將提供來自同一個中央空調(diào)系統(tǒng)的三份數(shù)據(jù)樣例數(shù)據(jù):2017年3月10日公布樣本數(shù)據(jù)建模數(shù)據(jù):2017年4月7日公布建模使用的全部數(shù)據(jù)驗證數(shù)據(jù):2017年4月23日上午8:00公布驗證數(shù)據(jù),并于2017年4月23日上午11:59:59前提交驗證結(jié)果。88問題及解讀請利用題目所給數(shù)據(jù),結(jié)合實際解決下列問題:問題一:從所給數(shù)據(jù)中挖掘出系統(tǒng)變化的特征和規(guī)律,研究冷卻負(fù)載、系統(tǒng)效率、耗電量與可控變量和不可控變量之間的關(guān)系模型,并檢驗?zāi)P偷目煽啃???照{(diào)系統(tǒng)建模輸入:冷卻負(fù)載、外部溫度濕度、可控變量...輸出:系統(tǒng)效率、耗電量89問題及解讀請利用題目所給數(shù)據(jù),結(jié)合實際解決下列問題:問題一:從所給數(shù)據(jù)中挖掘出系統(tǒng)變化的特征和規(guī)律,研究冷卻負(fù)載、系統(tǒng)效率、耗電量與可控變量和不可控變量之間的關(guān)系模型,并檢驗?zāi)P偷目煽啃?。冷卻裝置:冷卻負(fù)載-冷卻器出水溫度-冷凝器出水溫度-功率

單臺運行,多臺運行冷水泵:轉(zhuǎn)速-功率單臺運行,多臺運行

90問題及解讀問題二:按照數(shù)據(jù)中給出的時間、室外溫度和濕度、冷卻負(fù)載和設(shè)備狀態(tài)信息,給出通過調(diào)節(jié)設(shè)備運行參數(shù)(冷水泵轉(zhuǎn)速、冷凝水泵轉(zhuǎn)速和冷卻塔風(fēng)扇轉(zhuǎn)速)的最優(yōu)控制策略,并給出相應(yīng)的系統(tǒng)總耗電量和系統(tǒng)效率。約束條件:時間、室外溫度和濕度、冷卻負(fù)載和設(shè)備狀態(tài)優(yōu)化變量:冷水泵轉(zhuǎn)速、冷凝水泵轉(zhuǎn)速和冷卻塔風(fēng)扇轉(zhuǎn)速建議:冷卻負(fù)載通常隨日期、時間變化,所以制定策略的第一步是進行冷卻負(fù)載預(yù)測91問題及解讀問題三:根據(jù)數(shù)據(jù)中給出的時間、室外溫度和濕度、冷卻負(fù)載和可控變量(冷水泵轉(zhuǎn)速、冷凝水泵轉(zhuǎn)速和冷卻塔風(fēng)扇轉(zhuǎn)速)取值,給出所有設(shè)備狀態(tài)變量的最優(yōu)控制策略,以及相應(yīng)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論