版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第 32卷 第 16期2010年 8月 武 漢 理 工 大 學(xué) 學(xué) 報 JOURNA L OF WUHAN UNIVERSIT Y OF TECHN OLOG Y Vol. 32 No. 16 Aug. 2010DOI :10.3963/j. issn. 167124431. 2010. 16. 027氣象數(shù)據(jù)挖掘研究馬廷淮 1, 穆 強(qiáng) 1, 田 偉 1, 李德泉 2(1. 南京信息工程大學(xué)計算機(jī)與軟件學(xué)院 , 南京 210044;2. 國家氣象信息中心 , 北京 100081摘 要 : 分析了數(shù)據(jù)挖掘在氣象業(yè)務(wù)中的必要性 , 總結(jié)了數(shù)據(jù)挖掘在氣象預(yù)報 、 氣候預(yù)測和氣象災(zāi)害預(yù)報中的應(yīng)用情
2、況 , 闡述了數(shù)據(jù)挖掘可以在時空分析 、 關(guān)聯(lián)分析 、 降維分析 、 分類預(yù)測 4個方面在氣象業(yè)務(wù)中應(yīng)用 , 并結(jié)合氣象應(yīng)用提出 了氣象數(shù)據(jù)挖掘研究的重點(diǎn) 。關(guān)鍵詞 : 數(shù)據(jù)挖掘 ; 氣象數(shù)據(jù) ; 氣象應(yīng)用中圖分類號 : TP 311文獻(xiàn)標(biāo)識碼 : A 文章編號 ( 1620110205MiningM A Ti ng 2huai 1, M U Qiang 1, TIA N Wei 1, L I De 2quan 2(1. School of Computer and S oftware , Nanjing University of Information Science &Techn
3、ology ,Nanjing 210044, China ;2. National Meteorological Information Center , Beijing 100081, China Abstract : The necessity of meteorological data mining has been emphasized. Data mining in weather forecast , climate pre 2diction and meteorological disaster predictions applications are summarized.
4、At last , spatial 2temporal analysis , association rule analysis , dimensions 2decreasing analysis , classify and prediction are discussed in meteorological data mining. The emphasis of meteorological data mining is presented.K ey w ords : data mining ; meteorology data ; meteorological application收
5、稿日期 :2010204223.基金項(xiàng)目 :中國氣象局軟科學(xué)項(xiàng)目 (GQR2009036 和江蘇省高校自然科學(xué)基金 (08K JD520018 .作者簡介 :馬廷淮 (19742 , 男 , 博士 , 教授 . E 2mail :. cn隨著氣象信息化程度的日益提高 , 氣象部門積累了大量的氣象數(shù)據(jù) , 如何管理好和使用好這些海量數(shù) 據(jù) , 是提高預(yù)報預(yù)測準(zhǔn)確率和災(zāi)害天氣預(yù)警能力的關(guān)鍵 。這些海量氣象數(shù)據(jù)主要包括 1:1 以地面 、 高空 、 太陽輻射 、 農(nóng)業(yè)氣象等臺站的觀測資料及其統(tǒng)計加工產(chǎn)品為主的臺站資料 ;2 以各種數(shù)值模式的同化分析資 料和各種遙感探測的數(shù)值
6、反演產(chǎn)品為主的格點(diǎn)資料 ;3 以各類衛(wèi)星云圖和各種雷達(dá)圖像為主的圖形圖像資 料 ;4 以面向主題的 、 有多種資料構(gòu)成的某一區(qū)域或領(lǐng)域范圍的綜合資料構(gòu)成綜合氣象數(shù)據(jù) 。據(jù)統(tǒng)計 , 每天 通過氣象信息中心廣播下發(fā)到各臺站的氣象數(shù)據(jù)高達(dá) 300500M 2; 新一代天氣雷達(dá)信息共享平臺建成 后 , 臺站收到的氣象雷達(dá)資料每天高達(dá) 100G; 而中央臺站每天收到的資料更是高達(dá) TB 數(shù)量級 , 業(yè)務(wù)應(yīng)用的 數(shù)據(jù)高達(dá) PB 數(shù)量級 。 現(xiàn)階段氣象預(yù)測預(yù)報并沒有充分利用如此龐大而又珍貴的氣象資料 。目前 , 數(shù)值天氣預(yù)報通常采用一套極其復(fù)雜的數(shù)學(xué)方程來描述大氣的運(yùn)動規(guī)律 。 科研人員將氣象衛(wèi)星 、 雷達(dá)
7、等觀測的大量數(shù)據(jù)代入這個方程求解 , 預(yù)測出未來的天氣變化情況 3。正是由于預(yù)報模式的復(fù)雜性 , 在一般臺站的預(yù)報中 , 預(yù)報員根據(jù)經(jīng)驗(yàn) , 利用當(dāng)天或者前幾天的少數(shù)站點(diǎn)的實(shí)況資料以及小范圍區(qū)域內(nèi)極少 數(shù)的幾個物理量 , 提取認(rèn)為與某一天氣現(xiàn)象相關(guān)性較高的天氣要素作為因子 , 進(jìn)行回歸 、 判別分析 , 即得出預(yù) 報結(jié)論 2。現(xiàn)階段的預(yù)報業(yè)務(wù) , 難以考慮眾多氣象因素 , 更難以分析數(shù)據(jù)屬性間隱含的信息 。因此 , 建立氣象綜合 數(shù)據(jù)倉庫 , 實(shí)現(xiàn)對數(shù)據(jù)預(yù)報過程 、 信息服務(wù)最強(qiáng)大的數(shù)據(jù)支持 ; 對各種資料進(jìn)行聚類分析 、 關(guān)聯(lián)分析 、 時間序 列分析 , 以求發(fā)現(xiàn)各種物理量和氣象要素與未來天
8、氣之間的關(guān)系 ; 根據(jù)氣象資料做出氣象的預(yù)測 , 減少預(yù)報 中的主觀因素 , 有利于預(yù)報技術(shù)的持續(xù)改進(jìn) , 提高預(yù)測的準(zhǔn)確度 。1 氣象數(shù)據(jù)挖掘的應(yīng)用1. 1 氣象預(yù)報氣象預(yù)報一般指短時、 短期和中期的天氣預(yù)報 。根據(jù)預(yù)報的內(nèi)容和時限不同 , 有不同的預(yù)報技術(shù)和手 段 。 短時 (3h 內(nèi) 天氣預(yù)報主要采用現(xiàn)代化的探測手段 , 并用外推法作出預(yù)報 ; 短期 (72h 內(nèi) 天氣預(yù)報使用 傳統(tǒng)的天氣學(xué) 、 統(tǒng)計學(xué) 、 動力統(tǒng)計學(xué) 、 數(shù)值預(yù)報 、 診斷分析等方法制作 ; 中期 (10d 內(nèi) 天氣預(yù)報應(yīng)用天氣學(xué) 、 統(tǒng)計學(xué) 、 動力學(xué) 、 數(shù)值預(yù)報等方法 , 綜合分析制作出來 。 所以在氣象預(yù)報中
9、, 主要還是利用天氣學(xué)基本原理分 析及時得到的探測數(shù)據(jù) ; 而基于數(shù)據(jù)挖掘和統(tǒng)計的氣象預(yù)報方法未得到充分的應(yīng)用 , 具有較大的研究空間 。 國內(nèi)外不少學(xué)者在這方面進(jìn)行過有益探討 。從現(xiàn)有研究情況來看 , 采用 SVM SVM (Support Vector Machine 9月降水資 料 , 建立四川盆地降雨量有無大于 15mm 的 SVM SVM 回歸推理模 型 , 對每天的降水量進(jìn)行預(yù)報試驗(yàn) , 4。 Theodore B 等通過對比使用 ANNS , (, L S 2SVR (Least 2Squares Support Vector Regres 2sion , L R ( RR 來預(yù)
10、測降雨量 。通過對俄克拉何馬州的實(shí)際降雨數(shù) 5min 內(nèi)降雨量估計方面占優(yōu) ; 而對是否降雨的預(yù)測 ,SVR 方法明顯準(zhǔn) 確度較高 5氣象數(shù)據(jù)往往具有很強(qiáng)的時空關(guān)聯(lián)特性 , 采用時空關(guān)聯(lián)分析進(jìn)行氣象預(yù)報是一個較好的途徑 。 Ling Feng 等對常規(guī)的關(guān)聯(lián)規(guī)則進(jìn)行了擴(kuò)展 6。 傳統(tǒng)的關(guān)聯(lián)規(guī)則的各個事項(xiàng)一般是從同一個交易項(xiàng)項(xiàng)目中來的 , 比如關(guān)聯(lián)規(guī)則事項(xiàng)都是來自同一個顧客購買的商品項(xiàng) 。 而氣象的關(guān)聯(lián)規(guī)則可能來自不同的案例的同一個事 項(xiàng) , 如事項(xiàng)是溫度 ,6h 后的溫度 ,18h 后的溫度或者 24h 后的溫度之間的關(guān)聯(lián)關(guān)系 。 Thomas H Hinke 等考 慮不同地點(diǎn)的數(shù)據(jù)之間的關(guān)聯(lián)
11、關(guān)系 , 并提出了將空間數(shù)據(jù)組成向量 , 通過向量數(shù)據(jù)間的關(guān)聯(lián)關(guān)系來表達(dá)不同 地域氣象數(shù)據(jù)之間的關(guān)系 7。Estevam R 等利用 bayes 網(wǎng)絡(luò)方法 , 在缺失數(shù)據(jù)情況下預(yù)測機(jī)場的濕霧天氣情況 。實(shí)驗(yàn)證明 , 該方法無 論在數(shù)據(jù)缺失與否的情況下 , 都取得較好的預(yù)測效果 8。黃海洪等根據(jù)氣象和水文資料 , 采用人工神經(jīng)網(wǎng) 絡(luò)與主分量分析相結(jié)合的方法 , 以上游面雨量 、 水位值為預(yù)報因子 , 以西江流域的梧州水位為預(yù)報量 , 建立 了梧州水位的預(yù)報模型 , 發(fā)現(xiàn)預(yù)報因子與預(yù)報量有較強(qiáng)的相關(guān)性 , 且預(yù)報效果及預(yù)報穩(wěn)定性明顯好于傳統(tǒng)的 神經(jīng)網(wǎng)絡(luò)預(yù)報模型 , 可在預(yù)報業(yè)務(wù)中使用 9。1. 2
12、 氣候預(yù)測氣候預(yù)測是指長期天氣預(yù)報 , 其主要內(nèi)容是對預(yù)報時效內(nèi)的旱澇 、 冷暖 、 雨量 、 氣溫等作趨勢性預(yù)測 。 氣 候預(yù)測應(yīng)用了大量的歷史資料數(shù)據(jù) , 采用統(tǒng)計預(yù)報等方法綜合判斷分析制作出來的 , 這恰是符合數(shù)據(jù)挖掘從 海量數(shù)據(jù)中進(jìn)行知識挖掘的特征 , 由于時效性的相對要求不高 , 適合進(jìn)行大規(guī)模的數(shù)據(jù)分析處理 。 氣候預(yù)測 是數(shù)據(jù)挖掘的應(yīng)用重點(diǎn) 。Tugay Bilgin T 等對土耳其全國的氣象站每天的氣溫數(shù)據(jù)進(jìn)行聚類分析 , 得出具有相同趨勢的氣溫區(qū) 域 , 從而根據(jù)氣溫特性對土耳其進(jìn)行氣象區(qū)域劃分 10。 李永華等采用奇異譜分析 (Singular Spectrum Anal
13、2ysis , SSA 方法對標(biāo)準(zhǔn)化樣本序列進(jìn)行準(zhǔn)周期信號分量重建 , 將重建序列構(gòu)造均值生成函數(shù)延拓矩陣作為 輸入因子 , 原樣本序列作為輸出因子 , 構(gòu)建 BP 神經(jīng)網(wǎng)絡(luò)多步預(yù)測模型 , 對重慶市沙坪壩站的夏季總降水量111第 32卷 第 16期 馬廷淮 , 穆 強(qiáng) , 田 偉 , 等 :氣象數(shù)據(jù)挖掘研究 進(jìn)行建模預(yù)測 , 取得較好的效果 11。 萬謙等擴(kuò)展了正態(tài)云理論 , 應(yīng)用競爭聚集算法確定正態(tài)云的 2個參數(shù) , 應(yīng)用雙參數(shù)閾值挖掘正態(tài)云關(guān)聯(lián)規(guī)則 , 并利用求正態(tài)云關(guān)聯(lián)規(guī)則的支持率和信任度來進(jìn)行預(yù)測 。分析出日 照時數(shù)和降水量在取某些值時每月平均氣溫的 4個語言值出現(xiàn)的可能性 12。焦
14、飛等利用數(shù)據(jù)挖掘技術(shù)中 的一些方法 , 并開發(fā)相關(guān)的軟件來輔助分析 , 選取廣州 、 香港 、 澳門 、 湛江和汕頭 5個站點(diǎn)的 100多年來年平 均地面氣溫資料 , 建立回歸分析模型 , 研究分析廣東及港澳氣溫的長期變化趨勢 13。 向俊蓮等基于 1961 1997年云南氣象有關(guān)海溫距平值 、 雨量 、 氣溫場等大量數(shù)據(jù) , 利用決策樹方法 , 對云南 80個雨量站每個月降 雨量預(yù)報進(jìn)行了深入研究和改進(jìn) , 經(jīng)過實(shí)驗(yàn)驗(yàn)證 , 預(yù)報準(zhǔn)確率達(dá)到 59%, 滿足預(yù)報要求 , 且提高了預(yù)報效 率 14。1. 3 氣象災(zāi)害預(yù)測我國是自然災(zāi)害多發(fā)、 頻發(fā)的國家 , 幾乎每年都發(fā)生洪水 、 臺風(fēng)等自然災(zāi)害
15、 , 造成巨額的經(jīng)濟(jì)損失 , 對人 民生活的安定和社會的穩(wěn)定造成了威脅 。 防災(zāi)減災(zāi)在構(gòu)建和諧社會中有著至關(guān)重要的作用 。 防災(zāi)減災(zāi)是基 于對氣象災(zāi)害的準(zhǔn)確預(yù)報的 。 氣象災(zāi)害的預(yù)報主要是根據(jù)災(zāi)害天氣動力學(xué)理論 , 借助定量遙感技術(shù)進(jìn)行短 時臨近預(yù)報 。 由于氣象災(zāi)害事件一般以個案形態(tài)呈現(xiàn) , 難于有大量的相似案例進(jìn)行數(shù)據(jù)挖掘 。但是災(zāi)害氣 象的重要性吸引了眾多的研究者嘗試采用數(shù)據(jù)挖掘手段試圖提高災(zāi)害天氣預(yù)報能力 。Peters J F 等基于氣象雷達(dá)體掃數(shù)據(jù) , 采用粗糙集方法對夏季惡劣天氣下的風(fēng)暴類型識別判斷進(jìn)行了研 究 。 利用粗糙集方法 , 使得氣象雷達(dá)數(shù)據(jù)的高維度性 、 數(shù)據(jù)的不精確
16、性 、 數(shù)據(jù)的不完整性得到克服 。并利用 加拿大環(huán)境署的雷達(dá)決策支持?jǐn)?shù)據(jù)庫 , 基于分類準(zhǔn)確率作為標(biāo)準(zhǔn) ,暴預(yù)測的 15。 Tsegaye Tadesse , 從眾多大 氣和海洋因子中得出對干旱影響相對較強(qiáng)的因子 ,段 16。 Asanobu K itamoto 基于從南北半球收集到的究 。 主要利用時空數(shù)據(jù)挖掘 , , , , 最后考慮時 , kernel PCA , 挖掘臺風(fēng)云圖模 式 。 Cheng , 利用時間序列分析發(fā)現(xiàn)隱 , 通過時空分析來預(yù)測森林火災(zāi)面積 , 實(shí)驗(yàn)表明這樣的時空處理手段對森林火 18。2 氣象數(shù)據(jù)挖掘技術(shù)2. 1 時空分析氣象數(shù)據(jù)具有很強(qiáng)的時序和空間特性 , 采用
17、時間分析 、 空間分析以及時空聯(lián)合分析氣象數(shù)據(jù) , 避開分析 氣象數(shù)據(jù)內(nèi)部隱藏復(fù)雜非線性動力學(xué)機(jī)制 。對任何一個天氣特征 , 一般是通過空間分析得出該特征的現(xiàn)象描述和特征分析 , 而進(jìn)行時間分析 , 一般 是對該天氣特征作出預(yù)報預(yù)測 。 空間分析對基于空間多站點(diǎn)數(shù)據(jù)的聚類分析 , 形成地理區(qū)域劃分 ; 對基于空 間站點(diǎn)的數(shù)據(jù)進(jìn)行主成份分析 , 得出影響天氣現(xiàn)象較為突出的區(qū)域 ; 同時聚類分析中 , 發(fā)現(xiàn)奇異點(diǎn) , 指出反常 現(xiàn)象 。 時間分析指對組成的長時間序列數(shù)據(jù)進(jìn)行回歸分析 、 趨勢預(yù)測與奇異值分析 ; 對時序數(shù)據(jù)的分布演變 進(jìn)行跟蹤分析 , 得出比如臺風(fēng)路徑等 。文獻(xiàn) 13,19,20采
18、用時間分析方法 , 建立時序數(shù)據(jù)對相關(guān)的氣象因素進(jìn)行了預(yù)測 。文獻(xiàn) 10采用對氣 溫進(jìn)行聚類的空間分析方法 , 得出土耳其的氣溫區(qū)域劃分 。 文獻(xiàn) 17采用時空聯(lián)合分析方法 , 分析出臺風(fēng)出 現(xiàn)的區(qū)域以及演進(jìn)路徑 。2. 2 降維分析影響天氣的因素眾多 , 且各個因素間的關(guān)系十分復(fù)雜 。 現(xiàn)有的氣象預(yù)報模式將大量的衛(wèi)星 、 雷達(dá)和臺站 觀察資料帶入復(fù)雜的方程計算求解 , 對計算能力要求極高 。 在預(yù)報精度不損失的情況下 , 降低氣象預(yù)報所需 的數(shù)據(jù)維度 , 減少對計算機(jī)資源的依賴 , 實(shí)現(xiàn) PC 機(jī)氣象預(yù)報 。降維分析方法主要有 2種 :一種是精確降維 , 主要是以粗糙集分析方法為為代表 ;
19、其次是近似降維 , 以主 成分分析為代表 。粗糙理論的基本思想是將數(shù)據(jù)庫中的屬性分為條件屬性和結(jié)論屬性 , 對數(shù)據(jù)庫中的實(shí)例根據(jù)各個屬性 211 武 漢 理 工 大 學(xué) 學(xué) 報 2010年 8月 不同的屬性值分成相應(yīng)的子集 , 然后對條件屬性劃分的子集與結(jié)論屬性劃分的子集之間形成的近似空間進(jìn) 行分析 , 如果條件屬性集中去掉某一個屬性 a 而不影響結(jié)論屬性的知識表達(dá)的精度 , 那么 a 就是可約簡的 , 從而實(shí)現(xiàn)整個數(shù)據(jù)庫表的屬性維數(shù)減少 。 Peters J F 等在風(fēng)暴預(yù)報中 , 采用粗糙集對氣象雷達(dá)體數(shù)據(jù)進(jìn)行分 類 , 彌補(bǔ)了氣象雷達(dá)數(shù)據(jù)的不精確和不完整性帶來常規(guī)模式預(yù)測效果差的缺點(diǎn) ,
20、 取得了較好效果 15。主成份分析的基本思想是 , 設(shè)法將原來眾多具有一定相關(guān)性的指標(biāo)重新組合成一組新的相互無關(guān)的綜 合指標(biāo)來代替原來指標(biāo) 。 在選取綜合指標(biāo)時 , 其個數(shù)少于原有指標(biāo)個數(shù) 。但是 , 一般地 , 選取綜合指標(biāo)并不 能完全代替原有指標(biāo) , 僅僅是根據(jù)累計貢獻(xiàn)率的大小取前 k 個綜合指標(biāo) 。所以 , 主成分分析是不精確的降 維方法 。 黃海洪等先進(jìn)行主成分分析 , 然后利用神經(jīng)網(wǎng)絡(luò)建模預(yù)報水位 , 簡化了神經(jīng)網(wǎng)絡(luò)輸入?yún)?shù) , 在稍許 精度損失下提高了預(yù)報效率 9。 Tsegaye Tadesse 利用雙時間序列分析方法在眾多的大氣因子和海洋因子 中找出影響干旱相對較強(qiáng)的因子 16
21、。2. 3 分類預(yù)測數(shù)據(jù)挖掘就是要在大量氣象資料和數(shù)據(jù)中 , 建立描述復(fù)雜非線性天氣系統(tǒng)的模型 , 分析隱藏在數(shù)據(jù)背后 的氣象知識和規(guī)律 , 對未來氣象因素進(jìn)行預(yù)測 , 為氣象預(yù)報員提供決策支持 。分類預(yù)測有 2大類 :1 對離散值的預(yù)測 , 如是否降雨 、 是否降霜 、 臺風(fēng)等級 、 暴雨等級 。常用的方法有決 策樹 、 分類統(tǒng)計 、 神經(jīng)網(wǎng)絡(luò) 、 粗糙集 、 SVM 分類算法 。 2 對連續(xù)值的預(yù)測 , 如降雨量預(yù)測 、 溫度預(yù)測等 。常用 的實(shí)現(xiàn)手段是回歸分析 、 神經(jīng)網(wǎng)絡(luò)等 。向俊蓮等利用決策樹方法 , 分別對氣溫距平值 、 雨量距平值及海溫距平值進(jìn)行預(yù)報 , 59%14。 Theod
22、ore B Trafalis 等通過對比使用 ANNS , SVR ,L S 2,L R RR 來預(yù)測 降雨量 5。 Cheng Tao 利用動態(tài)復(fù)神經(jīng)網(wǎng)絡(luò) RNN 2. 4 關(guān)聯(lián)分析, 2個方面進(jìn)行處理 。 , 關(guān)聯(lián)關(guān)系 。數(shù)目 n 較大 , 考慮所有字段的關(guān)聯(lián) , 需要測試的頻繁集理論上有 2n 個 , 且 。 指定一個關(guān)鍵屬性 , 考慮其他屬性與該屬性同時發(fā)生的概率 , 更具有實(shí)際意 義 。 馬廷淮采用了指定結(jié)論域進(jìn)行關(guān)聯(lián)規(guī)則分析 21。特定時刻和地點(diǎn)的氣象因素受相鄰地域氣象因素影響 , 且具有時間連續(xù)性 。頻繁候選集的選取要具有 跨地域和跨時間性 , 以便更好表達(dá)此時此刻的氣象因素與以
23、往時刻和相鄰地域的關(guān)系 。 Ling Feng 等研究了 來自不同的案例的同一個屬性 , 在不同時段的關(guān)聯(lián)關(guān)系 6。 Thomas H Hinke 等考慮不同地點(diǎn)的數(shù)據(jù)之間的 關(guān)聯(lián)關(guān)系 7。3 結(jié) 語氣象數(shù)據(jù)挖掘能彌補(bǔ)氣象模式預(yù)報對計算資源依賴的不足 , 能發(fā)現(xiàn)隱藏在復(fù)雜氣象數(shù)據(jù)中的隱含知識 , 是提高預(yù)報預(yù)測準(zhǔn)確率和災(zāi)害天氣預(yù)警能力有益補(bǔ)充 , 是研究氣候變化一個較好手段 。但氣象變化受眾多 因素的影響 , 這些因素由于人類影響地球等而變化莫測 , 所以要真正的根據(jù)氣象因素的統(tǒng)計特性進(jìn)行氣象預(yù) 報還有待于進(jìn)一步探索 。 從已有氣象數(shù)據(jù)挖掘的研究工作來看 , 可以這樣認(rèn)為 :1 中短期預(yù)報主要
24、利用完 備的大氣探測工具與手段 , 基于天氣學(xué)基本原理 , 進(jìn)行氣象預(yù)報 ; 數(shù)據(jù)挖掘手段作為一個有益的補(bǔ)充 ;2 長 期氣象預(yù)報由于與歷史數(shù)據(jù)的關(guān)聯(lián)程度較高 , 可以采用數(shù)據(jù)挖掘手段進(jìn)行氣候趨勢分析 、 氣候預(yù)測 ;3 氣象 數(shù)據(jù)挖掘技術(shù)有助于減少氣象預(yù)報對計算資源的依賴 。 數(shù)據(jù)挖掘技術(shù)是基于建立模型 、 模型訓(xùn)練 、 預(yù)測這樣 一個模式 , 其中對計算資源需求較大的是模型訓(xùn)練階段 , 但往往這個階段的時效性要求不高 , 而時效性要求 高的預(yù)測階段對計算資源的需求較低 , 所以在計算機(jī)資源閑時進(jìn)行模型訓(xùn)練 , 預(yù)測時可以在較低計算資源上 (PC 機(jī) 實(shí)現(xiàn) , 且提高預(yù)報的速度 。 且模型訓(xùn)
25、練成功后 , 能在一段時間內(nèi)維持相對穩(wěn)定性 。眾多的研究者已經(jīng)對氣象數(shù)據(jù)挖掘進(jìn)行了不少研究 , 就目前研究狀況來看 , 數(shù)據(jù)挖掘的技術(shù)與方法已經(jīng) 相對成熟 , 氣象數(shù)據(jù)挖掘需要解決是 :數(shù)據(jù)挖掘技術(shù)在氣象領(lǐng)域的適用性研究 , 針對擬挖掘的知識類型和應(yīng) 用領(lǐng)域 , 選擇對應(yīng)的挖掘算法 , 并針對性的進(jìn)行裁減 , 氣象數(shù)據(jù)挖掘中前期數(shù)據(jù)處理 。氣象數(shù)據(jù)目前儲存管311第 32卷 第 16期 馬廷淮 , 穆 強(qiáng) , 田 偉 , 等 :氣象數(shù)據(jù)挖掘研究 理都還不適應(yīng)數(shù)據(jù)挖掘 , 結(jié)構(gòu)化氣象數(shù)據(jù) , 建立氣象數(shù)據(jù)倉庫 , 對數(shù)據(jù)進(jìn)行清理還有較多的工作 。氣象數(shù)據(jù) 挖掘結(jié)果的表達(dá)與評價 , 氣象數(shù)據(jù)挖掘既
26、有文本 , 也有圖象數(shù)據(jù)挖掘 , 挖掘結(jié)果的可視化表達(dá)復(fù)雜 。由于氣 象因素眾多 , 涉及到的挖掘算法眾多 , 多個算法的結(jié)果融合與評價也是一個值得研究的問題 。參考文獻(xiàn)1 李集明 . 基于 Internet 面向社會公益性共享的氣象科學(xué)數(shù)據(jù)存儲檢索策略研究 J.氣象科技 , 2007,35(4 :5892592. 2 趙海青 , 李社宗 , 周幸福 , 等 . 數(shù)據(jù)庫中的知識發(fā)現(xiàn)及其在氣象中的應(yīng)用 J.河南氣象 ,2002(2 :35236.3 邱聲春 . 數(shù)據(jù)挖掘和數(shù)據(jù)融合技術(shù)在天氣預(yù)報和氣象服務(wù)中的應(yīng)用研究 J.山西氣象 , 2007(2 :34236.4 馮漢中 , 陳永義 . 處理非
27、線性分類和回歸問題的一種新方法 ( 支持向量機(jī)方法在天氣預(yù)報中的應(yīng)用 J.應(yīng)用氣 象學(xué)報 ,2004,15(3 :3552365.5 Theodore B Trafalis , Budi Santosa , Michael B Richman. Learning Networks in Rainfall EstimationJ.Computational Man 2 agement Science ,2005(2 :2292251.6 Feng Ling ,Dillon Tharam ,Liu James. Inter 2transactional Association Rules for
28、Multi 2dimensional Contexts for Prediction and Their Application to Studying Meteorological DataJ.Data &Knowledge Engineering ,2001(37 :852115.7 Thomas H Hinke , John Rushing , Heggere Ranganath ,et al. Techniques and Experience in Mining Remotely Sensed Satellite Data ArtificialJ.Intelligence R
29、eview ,2000(14 :5032531.8 Estevam R , Hruschka J r. Applying Bayesian Networks for Meteorological Data Mining C /Proceedings of AI 22005. Cam 2 bridge :s. n. ,2005:1222133.9 黃海洪 , 孫崇智 , 金 龍 . 基于主分量的神經(jīng)網(wǎng)絡(luò)水位預(yù)報模型應(yīng)用研究 J.(1 :58263. 10 Tugay Bilgin T , Y 1lmaz Camurcu A. A Data Mining Application in Comput 2 er Science ,2005(3261 :68276.11 李永華 , 金 龍 , 繆啟龍 , 等 . 基于 SSA 2M GF 的 BP J.,2005,28(4 :5492 555.12 萬 謙 , 陸建江 , . 解放軍理工大學(xué)學(xué)報 :自然科學(xué)版 ,2002,3(4 :124. 13 焦 , J.廣東氣象 ,2006(2 :33235.14 向俊蓮 J.云南大學(xué)學(xué)報 :自然科學(xué)版 ,2001,23(1 :16219.15 Peters J Z ,Shan S ,et al. Classi Cation of
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 招投標(biāo)項(xiàng)目供應(yīng)鏈管理優(yōu)化
- 商業(yè)廣場樓面耐磨施工合同
- 籃球場水電布線施工協(xié)議
- 石油開采挖機(jī)計時租賃合同
- 商務(wù)樓宇治安管理規(guī)則
- 生物科技項(xiàng)目跟投管理
- 舞臺座位分配指南
- 藝術(shù)展覽設(shè)計審查策略
- 言語康復(fù)治療師年終總結(jié)
- 低空經(jīng)濟(jì):應(yīng)急救援的新力量
- 智慧文旅云服務(wù)平臺建設(shè)方案
- 2024年遼寧省中考一模英語試題(解析版)
- DZ/T 0462.9-2023 礦產(chǎn)資源“三率”指標(biāo)要求 第9部分:鹽湖和鹽類礦產(chǎn)(正式版)
- DZ∕T 0261-2014 滑坡崩塌泥石流災(zāi)害調(diào)查規(guī)范(1:50000)(正式版)
- 2024-2030年中國賽馬產(chǎn)業(yè)發(fā)展?fàn)顩r與前景動態(tài)預(yù)測報告
- DZ∕T 0011-2015 地球化學(xué)普查規(guī)范(1:50000)(正式版)
- 手術(shù)器械物品不全應(yīng)急預(yù)案
- 學(xué)生體育學(xué)情分析報告
- 三年級上冊語文 第五單元《交流平臺與初試身手》教學(xué)課件
- “楓橋經(jīng)驗(yàn)”課件
評論
0/150
提交評論