版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
粵教版2019高中信息技術(shù)必修1第五章數(shù)據(jù)處理和可視化表達(dá)知識(shí)清單第一部分:考試內(nèi)容分析1、大數(shù)據(jù)的定義和特征。2、大數(shù)據(jù)對(duì)日常生活的影響。3、數(shù)據(jù)采集的方法。4、數(shù)據(jù)的存儲(chǔ)和保護(hù)方法。5、數(shù)據(jù)的分析和可視化表達(dá)的方法。6、數(shù)據(jù)可視化表達(dá)的工具。7、能夠利用軟件工具或平臺(tái)對(duì)數(shù)據(jù)進(jìn)行整理、組織和計(jì)算與呈現(xiàn),并能通過(guò)技術(shù)方法對(duì)數(shù)據(jù)進(jìn)行保護(hù)。第二部分:知識(shí)點(diǎn)梳理(一)認(rèn)識(shí)大數(shù)據(jù)1.大數(shù)據(jù)的概念:2.大數(shù)據(jù)的特征:(1)從互聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù)的角度來(lái)看(“4V”特征):(2)從互聯(lián)網(wǎng)思維的角度來(lái)看:(3)從大數(shù)據(jù)存儲(chǔ)與計(jì)算的角度來(lái)看:3.傳統(tǒng)數(shù)據(jù)與大數(shù)據(jù)的區(qū)別:傳統(tǒng)數(shù)據(jù)大數(shù)據(jù)數(shù)據(jù)量小數(shù)據(jù)體量巨大數(shù)據(jù)類型少數(shù)據(jù)類型繁多價(jià)值密度高價(jià)值密度低更新速度慢更新速度快追求數(shù)據(jù)精準(zhǔn)性追求數(shù)據(jù)模糊性本地存儲(chǔ)分布式存儲(chǔ)4、大數(shù)據(jù)帶來(lái)的影響:(1)積極影響:(2)負(fù)面影響:(二)數(shù)據(jù)的采集1、數(shù)據(jù)采集的三種基本方法:(1)系統(tǒng)日志采集法?監(jiān)視系統(tǒng)中發(fā)生的事件?檢查錯(cuò)誤發(fā)生的原因?尋找受到攻擊時(shí)攻擊者留下的痕跡(2)網(wǎng)絡(luò)數(shù)據(jù)采集法通過(guò)網(wǎng)絡(luò)爬蟲或者網(wǎng)站公開API等方式從網(wǎng)站上獲取數(shù)據(jù)信息。從一個(gè)或若干個(gè)初始網(wǎng)頁(yè)的URL開始,獲得初始網(wǎng)頁(yè)上的URL,在抓取網(wǎng)頁(yè)的過(guò)程中,不斷從當(dāng)前頁(yè)面上抽取新的URL放入隊(duì)列,直到滿足系統(tǒng)的一定停止條件。(3)其他數(shù)據(jù)采集法2、Python網(wǎng)絡(luò)數(shù)據(jù)采集第三方庫(kù):(1)numpy(2)scipy(3)pandas(4)matplotlib3、python導(dǎo)入第三方庫(kù)的方式:(1)importmodele關(guān)鍵字模塊名frommoduleimportname關(guān)鍵字模塊名關(guān)鍵字方法名4、數(shù)據(jù)的存儲(chǔ)方式:(1)把數(shù)據(jù)存在本地內(nèi)部(2)把數(shù)據(jù)放在第三方公共或私有的“云端”存儲(chǔ)5、數(shù)據(jù)的保護(hù):(1)數(shù)據(jù)安全保護(hù)技術(shù):①數(shù)據(jù)安全保護(hù):數(shù)據(jù)不被破壞、更改、泄露或丟失。②方式1:安裝殺毒軟件和防火墻。此種方法只能防備數(shù)據(jù)安全隱患。③方式2:拷貝、備份、復(fù)制、鏡像、持續(xù)備份等技術(shù)。此種方法更徹底更有效。數(shù)據(jù)的隱私保護(hù):隱私泄露的問(wèn)題不是大數(shù)據(jù)時(shí)代特有的,在沒(méi)有大數(shù)據(jù)的時(shí)候,我們就已經(jīng)有很多隱私泄露的問(wèn)題。?方法1:技術(shù)手段①數(shù)據(jù)收集時(shí)進(jìn)行數(shù)據(jù)精度處理②數(shù)據(jù)共享時(shí)進(jìn)行訪問(wèn)控制③數(shù)據(jù)發(fā)布時(shí)進(jìn)行人工加擾④數(shù)據(jù)分析時(shí)進(jìn)行數(shù)據(jù)匿名處理?方法2:提高自身的保護(hù)意識(shí)?方法3:對(duì)數(shù)據(jù)使用者進(jìn)行道德和法律上的約束(三)數(shù)據(jù)的分析1、數(shù)據(jù)分析的定義:是在一大批雜亂無(wú)章的數(shù)據(jù)中,運(yùn)用數(shù)字化工具和技術(shù),探索數(shù)據(jù)內(nèi)在的結(jié)構(gòu)和規(guī)律,構(gòu)建數(shù)學(xué)模型,并進(jìn)行可視化表達(dá),通過(guò)驗(yàn)證將模型轉(zhuǎn)化為知識(shí),為診斷過(guò)去、預(yù)測(cè)未來(lái)發(fā)揮作用。2、數(shù)據(jù)分析的步驟:(1)特征探索①數(shù)據(jù)特征探索的主要任務(wù):對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,發(fā)現(xiàn)和處理缺失值、異常數(shù)據(jù),繪制直方圖,觀察分析數(shù)據(jù)的分部特征,求最大值、最小值、極差等描述性統(tǒng)計(jì)量。(2)關(guān)聯(lián)分析①關(guān)聯(lián)分析的概念:分析并發(fā)現(xiàn)存在于大數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性,從而描述一個(gè)事物中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式。②常見(jiàn)案例:超市某些商品捆綁促銷,新高考選修學(xué)科的選擇。(3)聚類與分類①聚類與分類的概念:一種探索性分析,不必事先給出分類標(biāo)準(zhǔn),從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類,進(jìn)而達(dá)到“物以類聚,人以群分”的效果。②常見(jiàn)的算法:K-Means算法,自下而上的聚類分析方法。(4)建立模型(5)模型評(píng)價(jià)3、數(shù)據(jù)分類:(1)數(shù)據(jù)分類的概念:是數(shù)據(jù)分析處理中最基本的方法,基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型,該分類器具有將待分類數(shù)據(jù)項(xiàng)映射到某一特點(diǎn)類別的功能。(2)常見(jiàn)的數(shù)據(jù)分類技術(shù):貝葉斯分類技術(shù)(四)數(shù)據(jù)的可視化表達(dá)1、數(shù)據(jù)可視化的定義:以圖形、圖像、地圖、動(dòng)畫等生動(dòng)、易于理解的方式展示數(shù)據(jù)和詮釋數(shù)據(jù)之間的關(guān)系、趨勢(shì)與規(guī)律等,以便更好地理解數(shù)據(jù)。2、數(shù)據(jù)可視化的呈現(xiàn)類型:(1)探索類:幫助人們發(fā)現(xiàn)數(shù)據(jù)背后的價(jià)值(2)解釋類:簡(jiǎn)單明了地呈現(xiàn)數(shù)據(jù)3、數(shù)據(jù)分析類型及其對(duì)應(yīng)的可視化呈現(xiàn):(1)有關(guān)趨勢(shì)的分析:分組柱形圖、堆疊柱形圖、折線圖、柱線混合圖(2)有關(guān)比例的分析:百分比圓環(huán)圖、餅圖、圈圖、堆疊面積圖(3)有關(guān)邏輯關(guān)系的分析:散點(diǎn)圖、雷達(dá)圖、網(wǎng)絡(luò)關(guān)系圖、詞云(4)有關(guān)空間關(guān)系的分析:數(shù)據(jù)地圖、動(dòng)態(tài)熱力圖、3D動(dòng)態(tài)顯示圖4、數(shù)據(jù)可視化表達(dá)的工具:(1)Seaborn:主要關(guān)注統(tǒng)計(jì)模型的可視化,基于且高度依賴于Matplotib(2)Bokeh:能實(shí)現(xiàn)交互式可視化,獨(dú)立于Matplotib,能通過(guò)瀏覽器與數(shù)據(jù)驅(qū)動(dòng)文檔的風(fēng)格呈現(xiàn)。第三部分:練習(xí)題一、選擇題1.下列對(duì)于知識(shí)的描述正確的是(
)。A.知識(shí)不可繼承 B.知識(shí)是對(duì)經(jīng)驗(yàn)的總結(jié)C.知識(shí)只能從書本上獲取 D.知識(shí)就是智慧1.從互聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù)的角度來(lái)看,大數(shù)據(jù)具有的特征是()。A.“4V”特征:大量(Volume)、多樣(Variety)、低價(jià)值密度(Value)、高速(Velocity)B.樣本漸趨于總體,精確讓位于模糊,相關(guān)性重于因果C.分布式存儲(chǔ),分布式并行計(jì)算D.沒(méi)有特征2.下列可以用于分析數(shù)據(jù)趨勢(shì)的是()。A.餅圖B.折線圖C.動(dòng)態(tài)熱力圖D.詞云圖3.數(shù)據(jù)分析的方法不包括()。A.線性分析B.關(guān)聯(lián)分析C.聚類分析D.數(shù)據(jù)分類4.下列關(guān)于大數(shù)據(jù)的特征,說(shuō)法正確的是()。A.數(shù)據(jù)價(jià)值密度高B.數(shù)據(jù)類型少C.數(shù)據(jù)基本無(wú)變化D.數(shù)據(jù)體量巨大5.數(shù)據(jù)特征探索的主要任務(wù)是對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以下不屬于該過(guò)程的是()。A.數(shù)據(jù)清洗B.異常數(shù)據(jù)處理C.數(shù)據(jù)缺失處理D.數(shù)據(jù)分類處理6.海軍軍官通過(guò)對(duì)前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)和洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()。A.在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B.在分析方法上更注重相關(guān)分析而不是因果分析C.在分析效果上更追究效率而不是絕對(duì)精確D.在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)7.大數(shù)據(jù)時(shí)代已經(jīng)在悄悄地改變我們地日常生活,也使人們?nèi)粘I罡鼮楸憬?,如移?dòng)支付、網(wǎng)絡(luò)約車出行、網(wǎng)絡(luò)購(gòu)物、網(wǎng)絡(luò)預(yù)約掛號(hào)等。以下不屬于大數(shù)據(jù)分析的是()。A.特征探索B.關(guān)聯(lián)分析C.聚類與分類D.建模分析8.電子警察采用拍照的方式來(lái)約束車輛的行為,其拍照的過(guò)程屬于()。A.數(shù)據(jù)分析B.數(shù)據(jù)采集C.數(shù)據(jù)分類D.數(shù)據(jù)可視化表達(dá)9.某超市曾經(jīng)研究銷售數(shù)據(jù),發(fā)現(xiàn)買商品A的人購(gòu)買商品B的概率很大,這猴子那個(gè)屬于數(shù)據(jù)的()。A.聚類分析B.關(guān)聯(lián)分析C.分類分析D.回歸分析10.數(shù)據(jù)采集的基本方法包括()、網(wǎng)絡(luò)數(shù)據(jù)采集法和其他數(shù)據(jù)采集法。A.數(shù)據(jù)庫(kù)采集法B.訪問(wèn)記錄采集法C.數(shù)據(jù)目錄采集法D.系統(tǒng)日志采集法11.下列關(guān)于聚類分析的說(shuō)法,錯(cuò)誤的是()。A.可以從數(shù)據(jù)點(diǎn)集合中隨機(jī)選擇K個(gè)點(diǎn)作為初始的聚集中心B.對(duì)其他的每個(gè)數(shù)據(jù)點(diǎn),以此判斷其與K個(gè)中心點(diǎn)的距離,距離最近的表明它屬于這項(xiàng)聚類C.聚類分析,必須先設(shè)定分類的標(biāo)準(zhǔn),否則無(wú)法準(zhǔn)確分類D.重新計(jì)算新的聚簇集合的平均值即中心點(diǎn)12.k-平均算法屬于()分析方法。A.聚類B.關(guān)聯(lián)C.分類D.回歸13.網(wǎng)絡(luò)數(shù)據(jù)采集法,主要通過(guò)網(wǎng)絡(luò)爬蟲或網(wǎng)站公開API的方式獲取,網(wǎng)絡(luò)爬蟲從網(wǎng)頁(yè)的()開始獲取。A.HTMLB.WWWC.URLD.XML14.大數(shù)據(jù)時(shí)代,數(shù)據(jù)應(yīng)用的關(guān)鍵是()。A.數(shù)據(jù)收集B.數(shù)據(jù)存儲(chǔ)C.數(shù)據(jù)分析D.數(shù)據(jù)再利用15.為了弘揚(yáng)和傳承中華民族勤儉節(jié)約的傳統(tǒng)美德,引導(dǎo)同學(xué)們進(jìn)一步深化節(jié)約糧食的意識(shí)和行為習(xí)慣,學(xué)生會(huì)開展了“我為食堂提建議”的活動(dòng)。請(qǐng)根據(jù)學(xué)生會(huì)開展該活動(dòng)的幾個(gè)步驟,排出最合理的順序()。①根據(jù)數(shù)據(jù)分析結(jié)果,撰寫數(shù)據(jù)分析報(bào)告,對(duì)食堂提出合理化建議。②學(xué)生會(huì)成員去學(xué)校食堂收集數(shù)據(jù),并制作調(diào)查問(wèn)卷的題目。③利用圖表形式直觀展示分析數(shù)據(jù)。④對(duì)問(wèn)卷進(jìn)行回收整理,將無(wú)效的問(wèn)卷進(jìn)行剔除。⑤學(xué)生會(huì)成員對(duì)就餐學(xué)生進(jìn)行問(wèn)卷調(diào)查。⑥對(duì)調(diào)查數(shù)據(jù)和食堂數(shù)據(jù)進(jìn)行分析與處理。A.②⑤④⑥③①B.②④⑤③⑥①C.⑤②④⑥③①D.⑤④②③⑥①16.下列應(yīng)用中,最不可能用到大數(shù)據(jù)技術(shù)的是(
)A.某工廠對(duì)生產(chǎn)線上的數(shù)據(jù)監(jiān)測(cè),提前發(fā)現(xiàn)設(shè)備故障,提高產(chǎn)品質(zhì)量B.某電商平臺(tái),通過(guò)對(duì)用戶瀏覽數(shù)據(jù)的收集和分析,實(shí)現(xiàn)商品精準(zhǔn)推薦C.某學(xué)校通過(guò)對(duì)學(xué)生某一學(xué)年成績(jī)進(jìn)行分析,發(fā)現(xiàn)本校學(xué)生的優(yōu)勢(shì)學(xué)科D.某農(nóng)業(yè)大省利用土壤、氣候、作物生長(zhǎng)等數(shù)據(jù),實(shí)現(xiàn)全省精準(zhǔn)種植、灌溉和施肥17.以下關(guān)于大數(shù)據(jù)的說(shuō)法正確的是(
)A.大數(shù)據(jù)分析是抽樣數(shù)據(jù)而非全部數(shù)據(jù)B.通過(guò)搜索引擎獲取的數(shù)據(jù)就是大數(shù)據(jù)C.短視頻平臺(tái)中的所有用戶瀏覽、點(diǎn)贊、評(píng)論等行為所產(chǎn)生的海量數(shù)據(jù)是大數(shù)據(jù)的具體體現(xiàn)D.對(duì)大數(shù)據(jù)進(jìn)行分析時(shí)要求每個(gè)數(shù)據(jù)準(zhǔn)確無(wú)誤18.以下關(guān)于數(shù)據(jù)采集的說(shuō)法,正確的是(
)A.?dāng)?shù)據(jù)采集可以提升決策的科學(xué)性,無(wú)需考慮其弊端B.?dāng)?shù)據(jù)采集可能會(huì)造成信息泄露,要依法合規(guī)進(jìn)行C.?dāng)?shù)據(jù)采集主要是弊大于利,應(yīng)盡量避免D.?dāng)?shù)據(jù)采集對(duì)個(gè)人來(lái)說(shuō)影響不大,我們只要使用現(xiàn)成數(shù)據(jù)即可19.智能交通中,用于采集交通視頻、車牌圖片數(shù)據(jù)的設(shè)備是(
)A.?dāng)z像機(jī) B.地感線圈檢測(cè)器C.紅外線檢測(cè)器 D.雷達(dá)檢測(cè)器20.在數(shù)據(jù)分析中,以下哪項(xiàng)不是數(shù)據(jù)預(yù)處理的常見(jiàn)任務(wù)?(
)A.?dāng)?shù)據(jù)清洗 B.?dāng)?shù)據(jù)轉(zhuǎn)換 C.?dāng)?shù)據(jù)增強(qiáng) D.?dāng)?shù)據(jù)集成21.在數(shù)據(jù)分析中,以下哪項(xiàng)不是常用的數(shù)據(jù)分析方法?(
)A.對(duì)比分析 B.平均分析 C.回歸分析 D.?dāng)?shù)據(jù)復(fù)制22.?dāng)?shù)據(jù)可視化的主要目的是(
)A.增加數(shù)據(jù)量 B.降低數(shù)據(jù)復(fù)雜性C.增強(qiáng)數(shù)據(jù)安全性 D.提高數(shù)據(jù)可讀性23.下列可用于分析數(shù)據(jù)趨勢(shì)的是(
)A.折線圖 B.詞云圖 C.餅圖 D.動(dòng)態(tài)熱力圖24.下列關(guān)于數(shù)據(jù)可視化的描述,錯(cuò)誤的是(
)A.標(biāo)簽云是文本可視化的一種方式B.?dāng)?shù)據(jù)可視化是將數(shù)據(jù)以圖形圖像等形式表示C.?dāng)?shù)據(jù)可視化可以間接地呈現(xiàn)數(shù)據(jù)中蘊(yùn)含的信息D.?dāng)?shù)據(jù)可視化增強(qiáng)了數(shù)據(jù)的解釋力與吸引力25.以下說(shuō)法正確的是(
)A.plot()函數(shù)一次只能繪制一種風(fēng)格的圖形B.bar()函數(shù)可以繪制水平柱形圖C.為了顯示圖形,須調(diào)用plt.show()函數(shù)D.pyplot模塊的text()函數(shù)和title()函數(shù),都可以設(shè)置繪圖區(qū)的標(biāo)題二、判斷題1.?dāng)?shù)據(jù)可視化表達(dá)的工具無(wú)法處理動(dòng)態(tài)變化的數(shù)據(jù)。2.詞云圖實(shí)現(xiàn)了非結(jié)構(gòu)化的數(shù)得文本的挖據(jù)。3.大數(shù)據(jù)的特征包括數(shù)據(jù)量大、處理速度快、數(shù)據(jù)類型單一和價(jià)值密度高。4.?dāng)?shù)據(jù)分析的目的是發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)和趨勢(shì)。5.?dāng)?shù)據(jù)分析可以幫助我們了解事物的現(xiàn)狀、剖析事物的發(fā)展歷程和預(yù)測(cè)事物的未來(lái)走向。練習(xí)題參考答案:一、選擇題1.A【詳解】教材第102頁(yè),從互聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù)的角度來(lái)看,大數(shù)據(jù)具有4V特征(數(shù)據(jù)體量巨大、類型繁多、價(jià)值密度低、變化速度快)。2.B【詳解】教材第119頁(yè),有關(guān)趨勢(shì)的分析的圖包括:分組柱形圖、堆疊柱形圖、折線圖、折線圖、柱線混合圖;餅圖是有關(guān)比例分析的;動(dòng)態(tài)熱力圖和詞云圖是有關(guān)關(guān)系分析的。3.A【詳解】教材第111頁(yè),數(shù)據(jù)分析一般包括:特征探索、關(guān)聯(lián)分析、聚類于分類、建立模型和模型評(píng)價(jià)。4.D【詳解】教材第102頁(yè),從互聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù)的角度來(lái)看,大數(shù)據(jù)具有4V特征(數(shù)據(jù)體量巨大、類型繁多、價(jià)值密度低、變化速度快)。5.D【詳解】教材第112頁(yè),數(shù)據(jù)特征探索的主要任務(wù)是對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,發(fā)現(xiàn)和處理缺失值、異常數(shù)據(jù),繪制直方圖,觀察分析數(shù)據(jù)的分布特征,求描述性統(tǒng)計(jì)量。6.B【詳解】題目中的關(guān)鍵詞:海軍軍官通過(guò)分析前人的航海日志,繪制了新的航海路線圖,標(biāo)明了大風(fēng)和洋流可能發(fā)生的地點(diǎn)。A選項(xiàng)中,題目中雖然提到了“分析前人的航海日志”,但這并不直接體現(xiàn)對(duì)全體數(shù)據(jù)的偏好,因?yàn)楹胶H罩究赡苤皇遣糠謹(jǐn)?shù)據(jù),且大數(shù)據(jù)分析并不總是要求全體數(shù)據(jù),而是強(qiáng)調(diào)數(shù)據(jù)的全面性和代表性。B選項(xiàng)中,海軍軍官通過(guò)分析航海日志(即數(shù)據(jù)),繪制了新的航海路線圖,并標(biāo)明了可能的大風(fēng)和洋流地點(diǎn)。這種分析更側(cè)重于找出大風(fēng)和洋流與地理位置之間的相關(guān)性,而非深入探究其因果關(guān)系。這完全符合大數(shù)據(jù)分析中注重相關(guān)分析的理念。C選項(xiàng)中,題目中并未直接提及分析效率與精確性的權(quán)衡,且大數(shù)據(jù)分析雖然強(qiáng)調(diào)效率,但并不意味著犧牲精確性。D選項(xiàng)中,大數(shù)據(jù)分析確實(shí)強(qiáng)調(diào)數(shù)據(jù)的規(guī)模,但這里的“相對(duì)數(shù)據(jù)”與“絕對(duì)數(shù)據(jù)”的區(qū)分并非大數(shù)據(jù)分析的核心理念。大數(shù)據(jù)分析更關(guān)注的是數(shù)據(jù)的全面性和多樣性,而非數(shù)據(jù)的相對(duì)性或絕對(duì)性。7.D【詳解】教材第111頁(yè),數(shù)據(jù)分析包括:特征探索、關(guān)聯(lián)分析、聚類分析、數(shù)據(jù)分類。8.B【詳解】電子警察的主要功能是通過(guò)拍照來(lái)記錄車輛的行為,以便在需要時(shí)進(jìn)行核查或作為違規(guī)的證據(jù)。A選項(xiàng)中,電子警察的拍照過(guò)程本身并不涉及對(duì)數(shù)據(jù)的解讀或推理,它僅僅是數(shù)據(jù)的收集階段。B選項(xiàng)中,
電子警察通過(guò)拍照的方式記錄下車輛的行為,這正是數(shù)據(jù)采集的一個(gè)典型例子。拍照所得到的圖像是后續(xù)可能進(jìn)行數(shù)據(jù)分析的原始資料。C選項(xiàng)中,電子警察的拍照過(guò)程并不涉及對(duì)數(shù)據(jù)的分類,它僅僅是記錄下了車輛行為的原始圖像。D選項(xiàng)中,
電子警察的拍照過(guò)程并不是為了將數(shù)據(jù)可視化,而是為了收集數(shù)據(jù)。9.B【詳解】A選項(xiàng)中,聚類分析主要是將數(shù)據(jù)集中的樣本劃分為若干個(gè)通常不相交的子集(稱為簇),使得同一簇內(nèi)的樣本之間相似度較高,而不同簇的樣本之間相似度較低。它主要用于探索數(shù)據(jù)的自然分組或結(jié)構(gòu),并不涉及特定事件或商品之間的關(guān)聯(lián)。B選項(xiàng)中,關(guān)聯(lián)分析用于發(fā)現(xiàn)數(shù)據(jù)集中不同項(xiàng)之間的有趣關(guān)系。在這個(gè)場(chǎng)景中,超市發(fā)現(xiàn)買商品A的人購(gòu)買商品B的概率很大,這正是關(guān)聯(lián)分析的一個(gè)典型應(yīng)用。它揭示了商品A和商品B之間的購(gòu)買關(guān)聯(lián)性,對(duì)于超市的促銷和商品布局策略有重要意義。C選項(xiàng)中,
分類分析是一種有監(jiān)督的學(xué)習(xí)技術(shù),用于根據(jù)已知類別的訓(xùn)練數(shù)據(jù)來(lái)預(yù)測(cè)新數(shù)據(jù)的類別。D選項(xiàng)中,回歸分析是研究一個(gè)或多個(gè)自變量與一個(gè)因變量之間關(guān)系的統(tǒng)計(jì)方法。它主要用于預(yù)測(cè)和解釋因變量的變化,與問(wèn)題描述中的商品購(gòu)買關(guān)聯(lián)性無(wú)直接關(guān)聯(lián)。10.D【詳解】教材第104頁(yè),數(shù)據(jù)采集的基本方法包括:系統(tǒng)日志采集法、網(wǎng)絡(luò)數(shù)據(jù)采集法和其他數(shù)據(jù)采集法。11.C【詳解】教材第115頁(yè),聚類分析,不必事先給出一個(gè)分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類。12.A【詳解】教材第115頁(yè),k-平均算法是一種經(jīng)典的自下而上的聚類分析方法。13.C【詳解】教材第104頁(yè),網(wǎng)絡(luò)爬蟲是從一個(gè)或若干個(gè)初始網(wǎng)頁(yè)的URL開始。14.D【詳解】雖然數(shù)據(jù)收集、存儲(chǔ)和分析都是大數(shù)據(jù)處理流程中不可或缺的環(huán)節(jié),但數(shù)據(jù)再利用才是大數(shù)據(jù)時(shí)代數(shù)據(jù)應(yīng)用的關(guān)鍵。它使得數(shù)據(jù)不僅僅是靜止的資產(chǎn),而是成為推動(dòng)業(yè)務(wù)增長(zhǎng)和創(chuàng)新的重要?jiǎng)恿Α?5.A【詳解】16.C【詳解】大數(shù)據(jù)已經(jīng)在能源行業(yè)、旅游行業(yè)、農(nóng)業(yè)行業(yè)、制造業(yè)行業(yè)、互聯(lián)網(wǎng)行業(yè)、零售行業(yè)、物流行業(yè)、金融行業(yè)、醫(yī)療行業(yè)等,C選項(xiàng)中某校學(xué)生成績(jī)體量不夠巨大,不屬于大數(shù)據(jù)。17.C【詳解】大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)的4V特征是指:Volume(數(shù)據(jù)量大)、Velocity(處理速度快)、Variety(數(shù)據(jù)類型多樣)、Value(價(jià)值密度低)。大數(shù)據(jù)分析與以往的數(shù)據(jù)分析是不同的,它分析的是全部數(shù)據(jù)。大數(shù)據(jù)必須滿足“4V”特征,因其低密度價(jià)值的特點(diǎn),所以大數(shù)據(jù)中的每個(gè)數(shù)據(jù)不一定完全準(zhǔn)確。18.B【詳解】數(shù)據(jù)采集能為各領(lǐng)域的發(fā)展提供基礎(chǔ),能夠提升效率和優(yōu)化決策,改善服務(wù)和用戶體提升用戶滿意度,促進(jìn)資源合理配置,但是所有的數(shù)據(jù)采集都必須嚴(yán)格遵守法律法規(guī),保護(hù)個(gè)人隱私和敏感信息不被非法濫用。重視數(shù)據(jù)的安全性,防止數(shù)據(jù)泄露、被篡改或被惡意利用。19.A【詳解】攝像機(jī)能夠采集交通視頻和車牌圖片等數(shù)據(jù)。地感線圈檢測(cè)器主要用于檢測(cè)車輛通過(guò)或存在的情況。紅外線檢測(cè)器通過(guò)紅外線的反射或遮擋來(lái)檢測(cè)車輛。雷達(dá)檢測(cè)器利用雷達(dá)波來(lái)檢測(cè)車輛的速度、距離等信息。20.C【詳解】數(shù)據(jù)預(yù)處理是數(shù)據(jù)分析的重要步驟,旨在提高數(shù)據(jù)質(zhì)量和可用性。數(shù)據(jù)清洗用于處理缺失值、異常值和重復(fù)數(shù)據(jù)等,以確保數(shù)據(jù)的準(zhǔn)確性和完整性;數(shù)據(jù)轉(zhuǎn)換包括對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、歸一化、編碼等操作,以便后續(xù)分析;數(shù)據(jù)集成則是將多個(gè)數(shù)據(jù)源的數(shù)據(jù)合并在一起。而數(shù)據(jù)增強(qiáng)通常用于機(jī)器學(xué)習(xí)中的數(shù)據(jù)擴(kuò)充,以增加數(shù)據(jù)的多樣性和數(shù)量,不是數(shù)據(jù)預(yù)處理的常見(jiàn)任務(wù)。21.D【詳解】對(duì)比分析通過(guò)比較不同數(shù)據(jù)之間的差異來(lái)發(fā)現(xiàn)問(wèn)題和趨勢(shì);平均分析用于計(jì)算數(shù)據(jù)的平均值等統(tǒng)計(jì)量,以了解數(shù)據(jù)的集中趨勢(shì);回歸分析用于研究變量之間的關(guān)系,并進(jìn)行預(yù)測(cè)和建模。而數(shù)據(jù)復(fù)制并非一種數(shù)據(jù)分析方法,它只是對(duì)數(shù)據(jù)的簡(jiǎn)單重復(fù)操作,不能從數(shù)據(jù)中獲取有價(jià)值的信息和洞察。22.D【詳解】數(shù)據(jù)可視化并非是為了增加數(shù)據(jù)量,增加數(shù)據(jù)量需要通過(guò)數(shù)據(jù)收集等手段實(shí)現(xiàn)。降低數(shù)據(jù)復(fù)雜性可以通過(guò)數(shù)據(jù)處理和分析的方法,但這不是數(shù)據(jù)可視化的主要目的。增強(qiáng)數(shù)據(jù)安全性需要依靠加密、訪問(wèn)控制等技術(shù)手段。而數(shù)據(jù)可視化的主要目的是提高數(shù)據(jù)可讀性,將復(fù)雜的數(shù)據(jù)以直觀、易懂的圖形、圖表等形式展現(xiàn)出來(lái),幫助人們更快速、準(zhǔn)確地理解和分析數(shù)據(jù),從而獲取有價(jià)值的信息和洞察。23.A【詳解】折線圖:折線圖通過(guò)連接數(shù)據(jù)點(diǎn)形成線條,清晰地展示了數(shù)據(jù)隨時(shí)間或其他連續(xù)變量的變化趨勢(shì)。它非常適合用于顯示數(shù)據(jù)隨時(shí)間的變化情況,是分析數(shù)據(jù)趨勢(shì)的首選圖表類型。詞云圖:詞云圖通過(guò)文字的大小來(lái)表示詞頻的高低,主要用于文本數(shù)據(jù)的可視化,特別是用于展示文本數(shù)據(jù)中關(guān)鍵詞的出現(xiàn)頻率。它并不適合用于分析數(shù)據(jù)趨勢(shì),因?yàn)樗饕P(guān)注的是詞語(yǔ)的重要性而非趨勢(shì)。餅圖:餅圖主要用于表示各部分在總體中所占的比例,通過(guò)扇形的大小來(lái)展示各個(gè)分類的占比情況。它并不適合用于展示數(shù)據(jù)的變化趨勢(shì),因?yàn)轱瀳D缺乏時(shí)間或其他連續(xù)變量的維度。動(dòng)態(tài)熱力圖:動(dòng)態(tài)熱力圖主要用于展示數(shù)據(jù)在空間或時(shí)間上的分布和密度,通過(guò)顏色的深淺來(lái)表示數(shù)據(jù)的大小或強(qiáng)度。雖然它可以在一定程度上展
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國(guó)嬰兒紙尿褲市場(chǎng)供需渠道分析及發(fā)展競(jìng)爭(zhēng)力研究報(bào)告
- 2024-2030年中國(guó)可再分散乳膠粉行業(yè)發(fā)展?jié)摿巴顿Y戰(zhàn)略規(guī)劃研究報(bào)告
- 2024-2030年中國(guó)衛(wèi)生消毒市場(chǎng)競(jìng)爭(zhēng)格局展望及投資策略分析報(bào)告
- 2024年幼兒園管理權(quán)轉(zhuǎn)移協(xié)議3篇
- 梅河口康美職業(yè)技術(shù)學(xué)院《精細(xì)化學(xué)品化學(xué)及工藝》2023-2024學(xué)年第一學(xué)期期末試卷
- 眉山藥科職業(yè)學(xué)院《電工電子基礎(chǔ)A》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年度生產(chǎn)車間承包與綠色生產(chǎn)技術(shù)研發(fā)合同3篇
- 滿洲里俄語(yǔ)職業(yè)學(xué)院《涉老企業(yè)品牌管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 茅臺(tái)學(xué)院《品牌敘事和聲譽(yù)管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 漯河食品職業(yè)學(xué)院《設(shè)計(jì)室內(nèi)》2023-2024學(xué)年第一學(xué)期期末試卷
- 基于風(fēng)險(xiǎn)的軟件測(cè)試策略
- 大鎖孫天宇小品《時(shí)間都去哪了》臺(tái)詞劇本完整版-一年一度喜劇大賽
- 雙重血漿置換
- 2023北京海淀區(qū)高二上學(xué)期期末英語(yǔ)試題及答案
- 從分?jǐn)?shù)到分式教學(xué)設(shè)計(jì)-
- 酒店長(zhǎng)期租房合同模板(16篇)
- 場(chǎng)域與對(duì)話-公共空間里的雕塑 課件-2023-2024學(xué)年高中美術(shù)人美版(2019)美術(shù)鑒賞
- 關(guān)于違規(guī)收受禮品禮金警示教育心得體會(huì)范文
- 國(guó)家開放大學(xué)《國(guó)際商法》形考任務(wù)1-5參考答案
- 顱腦損傷課件
- 滬教版英語(yǔ)八年級(jí)上冊(cè)知識(shí)點(diǎn)歸納匯總
評(píng)論
0/150
提交評(píng)論