版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、泓域咨詢/木醋液工程項目數(shù)據(jù)采集分析與知識管理木醋液工程項目數(shù)據(jù)采集分析與知識管理一、 大數(shù)據(jù)系統(tǒng)和數(shù)據(jù)挖掘技術(shù)(一)數(shù)據(jù)挖掘概述1大數(shù)據(jù)大數(shù)據(jù)是指超過既往數(shù)據(jù)庫系統(tǒng)規(guī)模、傳輸速度和處理能力,或者既往數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)無法容納的數(shù)據(jù)。大數(shù)據(jù)常以萬億或eb衡量,且種類多、實時性強,蘊藏的商業(yè)價值大。很多現(xiàn)有的新或舊的信息基礎(chǔ)設(shè)施、工具和技術(shù)可用來開發(fā)和利用大數(shù)據(jù)中蘊藏的價值。大數(shù)據(jù)有各種各樣的來源:傳感器、氣候信息、公開的信息、如雜志、報紙、文章、買賣記錄、網(wǎng)絡(luò)日志、病歷、事監(jiān)控、視頻和圖像檔案,及大型電子商務(wù)。大數(shù)據(jù)是數(shù)據(jù)挖掘產(chǎn)生與生存發(fā)展的土壤。如今數(shù)據(jù)每五年翻一番,面對前所未有的海量數(shù)據(jù),為了
2、從中發(fā)現(xiàn)有用的信息必須進行數(shù)據(jù)挖掘。此外,計算機存儲、處理大量數(shù)據(jù),以及運算的能力大為增強,為數(shù)據(jù)挖掘創(chuàng)造了條件,使其成為一門獨特的學(xué)科和技術(shù)。2數(shù)據(jù)挖掘與數(shù)據(jù)分析的區(qū)別數(shù)據(jù)挖掘與數(shù)據(jù)分析的主要區(qū)別在于:(1)處理工作量。數(shù)據(jù)分析的數(shù)據(jù)量可能并不大,而數(shù)據(jù)挖掘的數(shù)據(jù)量極大。(2)制約條件。數(shù)據(jù)分析是從某些假設(shè)出發(fā),建立方程或模型,而數(shù)據(jù)挖掘不作假設(shè),可以自動建立方程。(3)處理對象。數(shù)據(jù)分析往往是針對數(shù)字型數(shù)據(jù),而數(shù)據(jù)挖掘?qū)ο箢愋头倍?,例如圖像、聲音、文本等。(4)處理結(jié)果。數(shù)據(jù)分析可以解釋結(jié)果的含義;數(shù)據(jù)挖掘的結(jié)果不易解釋,著眼于預(yù)測未來,并提出決策建議。想要從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律(即認(rèn)知),往往
3、需將數(shù)據(jù)分析和數(shù)據(jù)挖掘結(jié)合起來。(二)數(shù)據(jù)挖掘步驟按挖掘?qū)ο?,?shù)據(jù)挖掘分為數(shù)據(jù)庫與數(shù)據(jù)倉庫挖掘和網(wǎng)絡(luò)挖掘兩種,各自步驟分述如下。1數(shù)據(jù)庫與數(shù)據(jù)倉庫挖掘數(shù)據(jù)挖掘一般有信息收集、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)清理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估和知識表示8個步驟。(1)信息收集。從確定的挖掘?qū)ο笾刑崛√卣鳎缓筮x擇合適的收集方法,將收集到的信息存入數(shù)據(jù)庫。對于海量數(shù)據(jù),必須選擇合適的數(shù)據(jù)倉庫。(2)數(shù)據(jù)集成。把來源、格式、特點、性質(zhì)不同的數(shù)據(jù)按邏輯或物理屬性加以編排,以便以后使用。(3)數(shù)據(jù)規(guī)約。多數(shù)數(shù)據(jù)挖掘算法耗時很長,商業(yè)數(shù)據(jù)往往較多,數(shù)據(jù)挖掘更耗時間。數(shù)據(jù)規(guī)約就是簡化已有可用數(shù)據(jù)集的表示,規(guī)約后數(shù)量
4、大減,但仍能保持原數(shù)據(jù)的完整性,對規(guī)約數(shù)據(jù)的挖掘結(jié)果,與對規(guī)約前數(shù)據(jù)的挖掘結(jié)果相同或幾乎相同。(4)數(shù)據(jù)清理。有些數(shù)據(jù)不完整(屬性缺少屬性值)、含噪聲(屬性值錯誤),不一致(同一信息有多種表示),需要清理,使其完整、正確、一致后存入數(shù)據(jù)倉庫。(5)數(shù)據(jù)變換。將數(shù)據(jù)變換成適合數(shù)據(jù)挖掘的形式。實數(shù)型數(shù)據(jù),可將其分層和離散化。(6)數(shù)據(jù)挖掘。根據(jù)數(shù)據(jù)格式、屬性與特點,選擇合適的處理工具,例如統(tǒng)計方法、事例推理、決策樹、規(guī)則推理、模糊集,甚至神經(jīng)網(wǎng)絡(luò),取得有用的信息。(7)模式評估。由行業(yè)專家核實數(shù)據(jù)挖掘結(jié)果是否合理、是否可用。(8)知識表示。將數(shù)據(jù)挖掘得到的信息以可視方式交給用戶,或作為新的知識存人
5、知識庫,供其他應(yīng)用程序使用。并非所有的數(shù)據(jù)挖掘都要走上述的每一步。若只有一個數(shù)據(jù)源,則可以省略數(shù)據(jù)集成。數(shù)據(jù)規(guī)約、數(shù)據(jù)清理、數(shù)據(jù)變換合稱數(shù)據(jù)預(yù)處理。數(shù)據(jù)挖掘至少60%的費用要花在信息收集階段,而至少60%以上的精力和時間要花在數(shù)據(jù)預(yù)處理上。數(shù)據(jù)挖掘是一個反復(fù)多次的過程,若一次未滿足要求或未得到有用結(jié)果,則需回到前面,經(jīng)過調(diào)整后重新開始。2,網(wǎng)絡(luò)挖掘網(wǎng)絡(luò)挖掘可分為網(wǎng)絡(luò)用戶行為挖掘與網(wǎng)絡(luò)信息挖掘。前者基本不在工程咨詢?nèi)藛T關(guān)心之列。后者可理解為“從www中發(fā)現(xiàn)和分析有用的信息”。網(wǎng)絡(luò)信息挖掘是在已知數(shù)據(jù)樣本的基礎(chǔ)上,通過歸納學(xué)習(xí)、機器學(xué)習(xí)、統(tǒng)計分析等發(fā)現(xiàn)挖掘?qū)ο箝g的內(nèi)在關(guān)系與特性,進而在網(wǎng)絡(luò)中提取用
6、戶感興趣的信息,獲得更高層次的知識和規(guī)律。網(wǎng)絡(luò)信息挖掘沿用了robot,全文檢索、人工智能的模式識別、神經(jīng)網(wǎng)絡(luò)等技術(shù)?,F(xiàn)在的搜索引擎使用了這些技術(shù),能夠在網(wǎng)頁或網(wǎng)站數(shù)據(jù)庫中為用戶搜尋有用信息。網(wǎng)絡(luò)信息挖掘具體步驟如下:(1)確立目標(biāo)樣本。由用戶選擇目標(biāo)文本,提取特征信息。(2)提取特征信息。根據(jù)目標(biāo)樣本的詞頻分布,從統(tǒng)計詞典中提取挖掘目標(biāo)的特征向量并計算出相應(yīng)的權(quán)值。(3)網(wǎng)絡(luò)信息獲取。先利用搜索引擎站點選擇待采集站點,再利用robot程序采集靜態(tài)web頁面,最后獲取被訪問站點網(wǎng)絡(luò)數(shù)據(jù)庫中的動態(tài)信息,生成www資源索引庫。(4)信息特征匹配。提取索引庫中的源信息特征向量,并與目標(biāo)樣本的特征向量
7、對照,將符合要求的信息交給用戶。二、 時間數(shù)據(jù)分析方法(一)時間數(shù)據(jù)時間數(shù)據(jù)也稱時間序列(timeseries)或動態(tài)數(shù)據(jù),是按時序排列的一組來自同一現(xiàn)象的觀察值。時間序列可按日、月、季度、年等收集,有些呈現(xiàn)很強的季節(jié)性,建模時應(yīng)給予反映。氣象、水文、生態(tài)環(huán)境、經(jīng)濟及社會活動都能觀察到周期性時間序列。實際觀測并記錄的時間序列,實際上是隨機過程的樣本,即,在產(chǎn)生時間序列的實際過程的每一時點上,人們看到的只是該時點隨機變量的樣本,并不能觀察到母體。時間序列可分為平穩(wěn)和非平穩(wěn)序列,還可以分成線性和非線性時間序列。(二)時間序列分析1概述時間序列分析是根據(jù)隨機過程理論,研究時間序列的統(tǒng)計規(guī)律。時間序列
8、分析廣泛應(yīng)用于信息壓縮、利用衛(wèi)星照片識別地球資源、石油勘探、經(jīng)營管理、預(yù)測(氣象、水文、地震、地下水位、農(nóng)作物病蟲災(zāi)害)、控制(環(huán)境污染、生態(tài)平衡)(天文學(xué)和海洋學(xué))等方面。時間序列預(yù)測的基本依據(jù)是:(1)客觀過程是連續(xù)的,有慣性,現(xiàn)在是過去的繼續(xù),過去的信息會傳遞到現(xiàn)在與未來,利用過去的數(shù)據(jù)或信息能推測未來。(2)偶然因素會影響到客觀過程,使其行為與模式有隨機性。預(yù)測要利用時間序列各時點隨機量的相關(guān)關(guān)系。時間序列的趨勢與波動稱為“模式”,時間序列分析首要要識別其模式,然后用適當(dāng)?shù)那€擬合。擬合模式的各種參數(shù)根據(jù)按“最優(yōu)預(yù)測”原則估算出的時間序列數(shù)字特征(期望值、方差、協(xié)方差、自相關(guān)函數(shù))等確
9、定。2.時間序列成分時間序列常含有4種成分:趨勢、季節(jié)變動、規(guī)則波動和不規(guī)則波動。所謂趨勢,是長期持續(xù)向上或持續(xù)向下的傾向。季節(jié)變動,是實際過程受氣候、市場狀況、節(jié)假日或風(fēng)俗習(xí)慣等影響而呈現(xiàn)的周期性波動。規(guī)則波動,是周期不等的變動,呈漲落交替之狀。波動的周期可能很長,但與趨勢不同。不規(guī)則波動,是時間序列除去趨勢、季節(jié)變動和周期波動之后的波動。不規(guī)則波動總是夾雜在時間序列中,致使時間序列產(chǎn)生一種波浪形或震蕩式的變動。時間序列經(jīng)常是各種周期成分的疊加,例如地震或人工地震波的記錄。這樣的序列要做頻域分析。頻域分析確定時間序列各周期成分稱為“譜”或“功率譜”的能量分布形態(tài)。頻域分析又稱譜分析。譜分析的
10、重要內(nèi)容就是通過序列的周期圖()的極值點尋找各種分量的周期。3時間序列建模時間序列建模一般有如下幾個步驟(1)取得時間序列樣本。(2)將樣本點畫成圖,進行相關(guān)分析。時間序列圖形可顯示出變化趨勢和周期,并發(fā)現(xiàn)離群點和轉(zhuǎn)折點。若離群點確實為觀測值,建模時應(yīng)加以考慮,若非,應(yīng)加以調(diào)整。轉(zhuǎn)折點指時間序列趨勢突變的點。如果發(fā)現(xiàn)轉(zhuǎn)折拐點,則在建模時須分段用不同的模型擬合時間序列,例如用門限回歸模型。(3)模式識別與擬合。時間序列模式眾多。小樣本可用趨勢模型、季節(jié)模型加上隨機誤差擬合。對于樣本容量(即觀測值個數(shù))大于50的平穩(wěn)時間序列,可用arma(自回歸移動平均)模型擬合。非平穩(wěn)時間序列可經(jīng)差分化為平穩(wěn)時
11、間序列,再用arma模型擬合。(4)預(yù)測未來。利用建成的模型預(yù)測時間序列未來值。4時間序列常用模型(1)arma模型(2)回歸模型三、 現(xiàn)代工程咨詢方法框架(一)現(xiàn)代工程咨詢方法體系現(xiàn)代工程咨詢方法體系包括哲學(xué)方法、邏輯方法和學(xué)科方法。哲學(xué)方法一般是辯證地分析事物的兩面性,包括它的優(yōu)點和缺點、正面效應(yīng)和反面效應(yīng);邏輯方法是用概念、判斷、推理、假說等邏輯思維形式,對事物進行歸納、演繹、綜合;學(xué)科方法是利用各種學(xué)科中常用的研究方法,包括文獻法、觀察法、訪談法、問卷法、測量法和實驗法、價值工程方法、網(wǎng)絡(luò)控制方法、市場調(diào)查研究方法、戰(zhàn)略規(guī)劃研究方法、財務(wù)評價方法、經(jīng)濟評價方法、風(fēng)險分析方法等。(二)常
12、用現(xiàn)代工程咨詢方法基于咨詢工程師的基本能力要求,以項目周期的全過程咨詢服務(wù)為主線,重點集中于投資項目前期咨詢服務(wù)領(lǐng)域,常用的現(xiàn)代工程咨詢方法包括綜合分析、規(guī)劃咨詢、市場分析、項目評價、項目管理等五大類,每一大類中又包括若干具體方法。需要說明的是,雖然我們將某一具體方法歸于某一大類名下,但其并不是僅限應(yīng)用于此類項目咨詢領(lǐng)域,亦可應(yīng)用于其他項目咨詢中。如利益相關(guān)者分析法,經(jīng)常應(yīng)用于規(guī)劃咨詢,同時也常用于社會評價;如德爾菲法,不僅應(yīng)用于市場預(yù)測,同時也應(yīng)用于規(guī)劃咨詢、社會評價等。四、 項目背景分析早期木醋液主要是應(yīng)用于生產(chǎn)乙酸、甲醇以及丙酮等工業(yè)產(chǎn)品,但是隨著合成工業(yè)和發(fā)酵工業(yè)的興起,高成本的木材干
13、餾業(yè)逐漸退出了歷史舞臺。近些年來,木醋液的研究與應(yīng)用進入了新的發(fā)展階段,開始作為抑菌劑、殺蟲劑、抗氧化劑以及植物生長調(diào)節(jié)劑等被應(yīng)用于醫(yī)藥、食品和農(nóng)藥等領(lǐng)域。我國有豐富的生物質(zhì)原料資源,木醋液產(chǎn)量巨大。作為一種綠色材料,木醋液已經(jīng)逐漸被認(rèn)識并開始受到重視。木醋液的廣泛應(yīng)用,能夠有效地應(yīng)對我國目前在農(nóng)業(yè)和畜牧業(yè)生產(chǎn)中過量使用抗生素和農(nóng)藥的問題,有利于農(nóng)業(yè)和畜牧業(yè)的可持續(xù)發(fā)展,也為其提供了廣闊的發(fā)展空間。五、 項目概述(一)項目基本情況1、項目名稱:木醋液工程項目2、承辦單位名稱:xx集團有限公司3、項目性質(zhì):擴建4、項目建設(shè)地點:xx(以選址意見書為準(zhǔn))5、項目聯(lián)系人:顧xx(二)主辦單位基本情況
14、公司以負(fù)責(zé)任的方式為消費者提供符合法律規(guī)定與標(biāo)準(zhǔn)要求的產(chǎn)品。在提供產(chǎn)品的過程中,綜合考慮其對消費者的影響,確保產(chǎn)品安全。積極與消費者溝通,向消費者公開產(chǎn)品安全風(fēng)險評估結(jié)果,努力維護消費者合法權(quán)益。公司加大科技創(chuàng)新力度,持續(xù)推進產(chǎn)品升級,為行業(yè)提供先進適用的解決方案,為社會提供安全、可靠、優(yōu)質(zhì)的產(chǎn)品和服務(wù)。公司堅持提升企業(yè)素質(zhì),即“企業(yè)管理水平進一步提高,人力資源結(jié)構(gòu)進一步優(yōu)化,人員素質(zhì)進一步提升,安全生產(chǎn)意識和社會責(zé)任意識進一步增強,誠信經(jīng)營水平進一步提高”,培育一批具有工匠精神的高素質(zhì)企業(yè)員工,企業(yè)品牌影響力不斷提升。公司秉承“誠實、信用、謹(jǐn)慎、有效”的信托理念,將“誠信為本、合規(guī)經(jīng)營”作為
15、企業(yè)的核心理念,不斷提升公司資產(chǎn)管理能力和風(fēng)險控制能力。公司不斷建設(shè)和完善企業(yè)信息化服務(wù)平臺,實施“互聯(lián)網(wǎng)+”企業(yè)專項行動,推廣適合企業(yè)需求的信息化產(chǎn)品和服務(wù),促進互聯(lián)網(wǎng)和信息技術(shù)在企業(yè)經(jīng)營管理各個環(huán)節(jié)中的應(yīng)用,業(yè)通過信息化提高效率和效益。搭建信息化服務(wù)平臺,培育產(chǎn)業(yè)鏈,打造創(chuàng)新鏈,提升價值鏈,促進帶動產(chǎn)業(yè)鏈上下游企業(yè)協(xié)同發(fā)展。(三)項目建設(shè)選址及用地規(guī)模本期項目選址位于xx(以選址意見書為準(zhǔn)),占地面積約60.00畝。項目擬定建設(shè)區(qū)域地理位置優(yōu)越,交通便利,規(guī)劃電力、給排水、通訊等公用設(shè)施條件完備,非常適宜本期項目建設(shè)。六、 項目總投資及資金構(gòu)成本期項目總投資包括建設(shè)投資、建設(shè)期利息和流動資
16、金。根據(jù)謹(jǐn)慎財務(wù)估算,項目總投資28096.82萬元,其中:建設(shè)投資21452.19萬元,占項目總投資的76.35%;建設(shè)期利息213.09萬元,占項目總投資的0.76%;流動資金6431.54萬元,占項目總投資的22.89%。七、 資金籌措方案(一)項目資本金籌措方案項目總投資28096.82萬元,根據(jù)資金籌措方案,xx集團有限公司計劃自籌資金(資本金)19399.13萬元。(二)申請銀行借款方案根據(jù)謹(jǐn)慎財務(wù)測算,本期工程項目申請銀行借款總額8697.69萬元。八、 項目預(yù)期經(jīng)濟效益規(guī)劃目標(biāo)1、項目達(dá)產(chǎn)年預(yù)期營業(yè)收入(sp):56000.00萬元。2、年綜合總成本費用(tc):48276.9
17、1萬元。3、項目達(dá)產(chǎn)年凈利潤(np):5626.31萬元。4、財務(wù)內(nèi)部收益率(firr):12.09%。5、全部投資回收期(pt):6.92年(含建設(shè)期12個月)。6、達(dá)產(chǎn)年盈虧平衡點(bep):27385.78萬元(產(chǎn)值)。九、 項目建設(shè)進度規(guī)劃項目計劃從可行性研究報告的編制到工程竣工驗收、投產(chǎn)運營共需12個月的時間。十、 信息鑒別及必要性(一)信息鑒別數(shù)據(jù)與信息鑒別,可稱信息識別,就是將信息與具有特定屬性的“模式”進行比較,進而判斷信息的類別或?qū)傩?。具體而言,就是信息收集或使用者運用已有的知識和經(jīng)驗,在對獲取的信息進行初步分析之后,按照一定原則和目的,辨認(rèn)與甄別信息的真?zhèn)?、輕重主次、是否完
18、整、是否有用,以及用途大小等。(二)信息鑒別的必要性互聯(lián)網(wǎng)時代,信息極為豐富,大大開闊了人們的眼界。然而,蜂擁而至,難辨真假的信息摻雜在一起,常常使人們陷入另一種迷茫,甚至成了海量信息的奴隸。過量的信息若不篩選,會使決策者無所適從?,F(xiàn)在,互聯(lián)網(wǎng)上充斥著偽造、篡改缺失、無代表性、誤傳、以及過時等信息。有些信息背后隱藏著各種政治、經(jīng)濟社會的利益團體正當(dāng)或不正當(dāng)?shù)哪康暮推髨D。信息識別及時與否決定了決策是否正確而又及時,決定了企業(yè)、事業(yè)、項目和其他活動的命運。對于工程咨詢,信息識別同樣十分必要。信息識別并非簡單工作,對從事者有很高的要求。決策者固然應(yīng)高瞻遠(yuǎn)矚,但決策的基礎(chǔ)是真實、可靠的信息。決定信息識
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第一單元+任務(wù)二《詩歌朗誦》課件-2024-2025學(xué)年統(tǒng)編版語文九年級上冊
- 防三無食品安全
- 大班心理健康課件《獨自睡覺》
- 貴州省黔東南州從江縣洛香中學(xué)2024-2025學(xué)年九年級上學(xué)期期中質(zhì)量監(jiān)測化學(xué)試卷
- 社交禮儀與形象塑造培訓(xùn)
- 銀行金融產(chǎn)品銷售合規(guī)指南
- 創(chuàng)業(yè)計劃書集錦15篇
- 臨時快遞員合同模板
- 美術(shù)館防火門施工合同
- 城市森林公園道路施工合同模板
- 小議“雙減”政策及其落實措施效果研究
- 【企業(yè)杜邦分析國內(nèi)外文獻綜述6000字】
- 區(qū)域地質(zhì)調(diào)查及礦產(chǎn)普查專業(yè)畢業(yè)實習(xí)周記范文原創(chuàng)全套
- 錐坡工程量計算(支持斜交、溜坡計算)
- 自然災(zāi)害風(fēng)險管理
- 中國智庫名錄類別索引-社會智庫
- 世界七大洲及各個國家的英文名字
- 管溝回填土、砂施工方案及工藝方法
- 情緒的身體密碼-心理健康教育教案
- 2023年中考復(fù)習(xí)文言文比較訓(xùn)練-《誡子書》與“世家子弟最易犯”
- GB/T 4339-1999金屬材料熱膨脹特征參數(shù)的測定
評論
0/150
提交評論