


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、傳統(tǒng)數(shù)據(jù)倉庫分析大數(shù)據(jù)分析傳統(tǒng)分析對(duì)已知的數(shù)據(jù)范圍中好理解的數(shù)據(jù) 進(jìn)行分析。大多數(shù)數(shù)據(jù)倉庫都有一個(gè)精致的 提取、轉(zhuǎn)換和加載(ETL)的流程和數(shù)據(jù)庫限 制,這意味著加載進(jìn)數(shù)據(jù)倉庫的數(shù)據(jù)是容易 理解的,洗清過的,并符合業(yè)務(wù)的元數(shù)據(jù)。大數(shù)據(jù)最大的優(yōu)點(diǎn)是針對(duì)傳統(tǒng)手段捕捉到 的數(shù)據(jù)之外的非結(jié)構(gòu)化數(shù)據(jù)。這意味著不 能保證輸入的數(shù)據(jù)是完整的,清洗過的和 沒有任何的錯(cuò)誤。這使它更有挑戰(zhàn)性,但 同時(shí)它提供了在數(shù)據(jù)中獲得更多的洞察力 的范圍。傳統(tǒng)分析是建立在關(guān)系數(shù)據(jù)模型之上的,主 題之間的關(guān)系在系統(tǒng)內(nèi)就已經(jīng)被創(chuàng)立,而分 析也在此基礎(chǔ)上進(jìn)行。在典型的世界里,很難在所有的信息間以 一種正式的方式建立關(guān)系,因此非結(jié)構(gòu)化
2、 以圖片、視頻、移動(dòng)產(chǎn)生的信息、無線射 頻識(shí)別(RFID)等的形式存在,被考慮進(jìn) 大數(shù)據(jù)分析。絕大多數(shù)的大數(shù)據(jù)分析數(shù)據(jù) 庫基于縱列數(shù)據(jù)庫之外。傳統(tǒng)分析是定向的批處理,而且我們?cè)讷@得 所需的洞察力之前需要每晚等待提取、轉(zhuǎn)換大數(shù)據(jù)分析是利用對(duì)數(shù)據(jù)有意義的軟件的 支持針對(duì)于數(shù)據(jù)的頭時(shí)分析。和加載(ETL)以及轉(zhuǎn)換工作的完成。在一個(gè)傳統(tǒng)的分析系統(tǒng)中,平行是通過昂貴 的硬件,如大規(guī)模并行處理(MPP系統(tǒng)和/ 或?qū)ΨQ多處理(SMP系統(tǒng)來實(shí)現(xiàn)的。當(dāng)在市場上有大數(shù)據(jù)分析的應(yīng)用系統(tǒng)時(shí), 它同樣可以通過通用的硬件和新一代的分 析軟件,像Hadoop或其他分析數(shù)據(jù)庫來實(shí) 現(xiàn)。主要的IT公司對(duì)分析軟件和應(yīng)用系統(tǒng)供應(yīng)商
3、的購買已經(jīng)成為一種日?,F(xiàn)象。我 們已經(jīng)看到“大數(shù)據(jù)分析”這個(gè)詞匯被使用在許多企業(yè)的解決方案中。“大數(shù)據(jù)”是用來表示大量的沒有按照傳統(tǒng)的相關(guān)格式存儲(chǔ)在企業(yè)數(shù)據(jù)庫中的 非結(jié)構(gòu)化數(shù)據(jù)的總術(shù)語。以下是大數(shù)據(jù)的一般特點(diǎn)。數(shù)據(jù)存儲(chǔ)量相對(duì)于當(dāng)前企業(yè) TB(TERABYTES字節(jié)的存儲(chǔ)限制,定義在PB(PETA BYTES字節(jié),EXA字節(jié)以及更高的容量順序。通常它被認(rèn)為是非結(jié)構(gòu)化數(shù)據(jù),并不適合企業(yè)已經(jīng)習(xí)慣使用的關(guān)系型數(shù)據(jù)庫之下數(shù)據(jù)的生成使用的是數(shù)據(jù)輸入非傳統(tǒng)的手段,像無線射頻識(shí)別(RFID),傳感器網(wǎng)絡(luò)等。數(shù)據(jù)對(duì)時(shí)間敏感,且由數(shù)據(jù)的收集與相關(guān)的時(shí)區(qū)組成。在過去,專業(yè)術(shù)語“分析”應(yīng)用于商業(yè)智能(BI)世界來提供
4、工具和智能,通過 對(duì)各種各樣可能的信息視角的快速的、一致的、交互式訪問獲得洞察力。與分析的概念非常接近,數(shù)據(jù)挖掘已經(jīng)應(yīng)用于企業(yè)以保持關(guān)鍵監(jiān)測和海量信息的 分析。最大的挑戰(zhàn)就是如何通過大量的數(shù)據(jù)挖掘出所有的隱藏信息。傳統(tǒng)數(shù)據(jù)倉庫(DW分析相對(duì)于大數(shù)據(jù)分析企業(yè)數(shù)據(jù)的分析朝著在一段時(shí)間內(nèi)在那種內(nèi)容中的信息的有意義的洞察,是大數(shù)據(jù)分析區(qū)別于傳統(tǒng)數(shù)據(jù)倉庫分析的原因所在。下表總結(jié)了一些它們之間的差別。大數(shù)據(jù)分析用例基于用例,企業(yè)可以理解大數(shù)據(jù)分析的價(jià)值和在大數(shù)據(jù)分析的幫助下如何解決傳 統(tǒng)的問題。以下是一些用法??蛻魸M意度和保證分析:也許這是基于產(chǎn)品的企業(yè)所擔(dān)心的最大的一個(gè)領(lǐng)域。在當(dāng)今時(shí)代,沒有一個(gè)清晰的方
5、式來衡量產(chǎn)品的問題和與客戶滿意度相關(guān)的問題, 除非他們以一個(gè)正式的方式出現(xiàn)在一個(gè)電子表格中。信息質(zhì)量方面,它是通過各種外部渠道收集的,而且大多數(shù)時(shí)候的數(shù)據(jù)沒有清洗因?yàn)閿?shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),無法關(guān)聯(lián)相關(guān)的問題,所以長期的解決方案提供給客 戶分類和分組的問題陳述都缺失了,導(dǎo)致企業(yè)不能對(duì)問題進(jìn)行分組從上面的討論中,對(duì)客戶滿意度和保證分析使用大數(shù)據(jù)分析將幫助企業(yè)在急需的 客戶注意力設(shè)置中獲得洞察力,并有效地解決他們的問題以及在他們的新產(chǎn)品線 上避免這些問題。競爭對(duì)手的市場滲透率分析:在今天高度競爭的經(jīng)濟(jì)環(huán)境下,我們需要通過一種 實(shí)時(shí)分析對(duì)競爭者強(qiáng)大的區(qū)域和他們的痛點(diǎn)進(jìn)行衡量。 這種信息是可適用于各種 各
6、樣的網(wǎng)站、社交媒體網(wǎng)站和其他公共領(lǐng)域。對(duì)這種數(shù)據(jù)的大數(shù)據(jù)分析可以向企 業(yè)提供關(guān)于他們產(chǎn)品線的優(yōu)勢、劣勢、機(jī)遇、威脅等非常需要的信息。醫(yī)療保健/流行病的研究和控制:流行病和像流感這樣的季節(jié)性疾病在人群中以 一定的模式開始,如果沒有及早發(fā)現(xiàn)和控制,它們就會(huì)傳播到更大的區(qū)域。這對(duì) 發(fā)展中以及發(fā)達(dá)的國家都是一個(gè)最大的挑戰(zhàn)。 當(dāng)前絕大部分時(shí)間的問題是人們之 間的癥狀各異,而且不同的醫(yī)護(hù)人員治療他們的方法也不同。 人群中也沒有一種 常見的癥狀分類。在這種典型的非結(jié)構(gòu)化數(shù)據(jù)上采用大數(shù)據(jù)分析將有助于地方 ZF有效地應(yīng)對(duì)疫情的情況。產(chǎn)品功能和用法分析:大多數(shù)產(chǎn)品企業(yè),尤其是消費(fèi)品,不斷在他們的產(chǎn)品線上 增加許多功能,但有可能一些功能不會(huì)真正地被顧客所使用,而有些功能則更多 地被使用,對(duì)這種通過各種移動(dòng)設(shè)備和其它基于無線射頻識(shí)別 (RFID)輸入捕捉 到的數(shù)據(jù)的有效分析,可以為產(chǎn)品企業(yè)提供有價(jià)值的洞察力。未來方向的分析:研究小組分析在各種業(yè)務(wù)中的趨勢,而這種信息通過行業(yè)特定 門戶網(wǎng)站甚至常見的博客可以獲得。對(duì)這種未來數(shù)據(jù)的不斷分析將有助于企業(yè)期 待未來,并將這些期待帶入他們的生產(chǎn)線??偨Y(jié)大數(shù)據(jù)分析為企業(yè)和ZF分析非結(jié)構(gòu)化的數(shù)據(jù)提供了新的途徑,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國非標(biāo)壓力容器行業(yè)發(fā)展?fàn)顩r及營銷戰(zhàn)略研究報(bào)告
- 2025-2030年中國表演服市場創(chuàng)新前景分析及投資預(yù)測報(bào)告
- 2025-2030年中國薺藍(lán)油市場競爭格局規(guī)劃研究報(bào)告
- 2025-2030年中國自助回單打印終端市場發(fā)展?fàn)顩r及營銷戰(zhàn)略研究報(bào)告
- 2025-2030年中國羽毛(絨)加工業(yè)市場規(guī)模分析及發(fā)展建議研究報(bào)告
- 2025-2030年中國粉末冶金模產(chǎn)業(yè)運(yùn)行狀況及發(fā)展趨勢預(yù)測報(bào)告
- 2025-2030年中國空氣凈化系統(tǒng)工程行業(yè)發(fā)展規(guī)模規(guī)劃研究報(bào)告
- 2025-2030年中國電腦機(jī)箱市場現(xiàn)狀分析規(guī)劃研究報(bào)告
- 株洲師范高等??茖W(xué)?!盾囕v動(dòng)力學(xué)與強(qiáng)度》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶青年職業(yè)技術(shù)學(xué)院《電力電子技術(shù)及應(yīng)用課程設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 社團(tuán)活動(dòng)情況登記表
- 2025屆湖北武漢武昌區(qū)武漢大學(xué)附屬中學(xué)數(shù)學(xué)高三上期末達(dá)標(biāo)測試試題含解析
- 山東省濰坊市2023-2024學(xué)年高二下學(xué)期期末測試+英語試卷
- 生涯規(guī)劃與就業(yè)創(chuàng)業(yè)全套課件電子教案板
- 湘少版六年級(jí)英語下冊(cè)《全冊(cè)課件》
- 2024-2030年中國護(hù)眼臺(tái)燈行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報(bào)告
- 《土壤肥料學(xué)通論》課程教學(xué)大綱
- 第十四屆全國交通運(yùn)輸行業(yè)職業(yè)技能競賽(公路收費(fèi)及監(jiān)控員)賽項(xiàng)題庫-下(多選題-共3部分-2)
- 集合功能的測定(雙眼視檢查)
- 2024年農(nóng)村自建房裝修合同
- 2024年《高等教育心理學(xué)》考前輔導(dǎo)必背習(xí)題庫(300題)
評(píng)論
0/150
提交評(píng)論