《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》課后答案_第1頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》課后答案_第2頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》課后答案_第3頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》課后答案_第4頁(yè)
《Python數(shù)據(jù)分析與應(yīng)用從數(shù)據(jù)獲取到可視化》課后答案_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章填空題數(shù)據(jù)分析Anaconda實(shí)時(shí)判斷題錯(cuò)對(duì)錯(cuò)選擇題BCDC簡(jiǎn)答題數(shù)據(jù)分析是指,用適當(dāng)?shù)腬t"/item/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/_blank"統(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,從中提取有用信息和形成結(jié)論,并加以詳細(xì)研究和概括總結(jié)的過(guò)程。明確目的和思路、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)。(1)語(yǔ)法簡(jiǎn)單精煉,適合初學(xué)者入門;(2)擁有一個(gè)巨大且活躍的科學(xué)計(jì)算社區(qū);(3)擁有強(qiáng)大的通用編程能力;(4)人工智能時(shí)代的通用語(yǔ)言;(5)方便對(duì)接其它語(yǔ)言。第2章填空題ndarray二維位長(zhǎng)廣播數(shù)組或列表判斷題錯(cuò)對(duì)對(duì)對(duì)錯(cuò)選擇題BDACA簡(jiǎn)答題答案:NumPy數(shù)組不需要循環(huán)遍歷,即可對(duì)每個(gè)元素執(zhí)行批量的算術(shù)運(yùn)算操作,這個(gè)過(guò)程叫做矢量化運(yùn)算。答案:兩個(gè)數(shù)組的某一維度等長(zhǎng),或其中一個(gè)數(shù)組為一維數(shù)組。程序題答案:importnumpyasnparr=np.zeros(5)print(arr)答案:importnumpyasnparr=np.zeros((8,8),dtype=int)arr[1::2,::2]=1arr[::2,1::2]=1print(arr)第3章填空題NumpySeriesDataFrame索引數(shù)據(jù)列表字典按置排序按索引排序判斷題對(duì)對(duì)錯(cuò)錯(cuò)錯(cuò)選擇題ABAAB簡(jiǎn)答題Series是一個(gè)類似于一維數(shù)組的對(duì)象,它能夠保存任何類型的數(shù)據(jù),主要由一組數(shù)據(jù)和與之相關(guān)的索引兩部分構(gòu)成。DataFrame是一個(gè)類似于二維數(shù)組的對(duì)象,它每列的數(shù)據(jù)可以是不同的數(shù)據(jù)類型。DataFrame的結(jié)構(gòu)也是由索引和數(shù)據(jù)組成的,并且DataFrame的索引有行索引和列索引。層次化索引是在單層索引的基礎(chǔ)上進(jìn)行延伸,它可以在一個(gè)軸上存在多層索引,并且能夠以低緯度形式表示高維度的數(shù)據(jù)。程序題答案: importnumpyasnp importpandasaspd df_data=np.array([[1,5,8,8],[2,2,4,9], [7,4,2,3],[3,0,5,2]])#創(chuàng)建數(shù)組 col_data=np.array(['A','B','C','D'])#創(chuàng)建數(shù)組 #基于數(shù)組創(chuàng)建DataFrame對(duì)象 df_obj=pd.DataFrame(columns=col_data,data=df_data) df_obj答案: sort_values_data=df_obj.sort_values(by=['B'],ascending=False) sort_values_data答案: sort_values_data.to_csv(r'E:\數(shù)據(jù)分析\write_data.csv') '寫入完畢'第4章填空題完整性唯一性權(quán)威性合法性一致性人為原因機(jī)械原因列索引行索引橫向堆疊縱向堆疊內(nèi)連接外連接正態(tài)分布判斷題對(duì)錯(cuò)對(duì)錯(cuò)錯(cuò)選擇題BACDA簡(jiǎn)答題在數(shù)據(jù)預(yù)處理的過(guò)程中會(huì)根據(jù)數(shù)據(jù)的實(shí)際情況選擇合適處理方法,常用的預(yù)處理操作有數(shù)據(jù)清洗、數(shù)據(jù)合并、數(shù)據(jù)重塑、數(shù)據(jù)轉(zhuǎn)換等,在這幾種操作中又分別含有不同的數(shù)據(jù)處理方法,例如在數(shù)據(jù)清洗過(guò)程中含有空值和缺失的檢測(cè)、重復(fù)值的處理、異常值的處理等。在Pandas中常用的數(shù)據(jù)合并操作有:concat()函數(shù)表示沿著一條軸將多個(gè)對(duì)象進(jìn)行堆疊、merge()函數(shù)表示根據(jù)一個(gè)或多個(gè)鍵將不同的對(duì)象進(jìn)行合并、join()方法表示根據(jù)索引或指定的列來(lái)合并數(shù)據(jù)、combine_first()方法表示填充合并數(shù)據(jù)。程序題答案: importpandasaspdimportnumpyasnpgroup_a=pd.DataFrame({'A':[2,3,5,2,3],'B':['5',np.nan,'2','3','6'],'C':[8,7,50,8,2],'key':[3,4,5,2,5]})group_b=pd.DataFrame({'A':[3,3,3],'B':[4,4,4],'C':[5,5,5]})print(group_a)print(group_b)答案: group_a=group_bine_first(group_b) group_a答案: group_a.rename(columns={'key':'D'})第5章填空題拆分應(yīng)用合并列表或數(shù)組DataFrame對(duì)象某列的名稱字典或Series對(duì)象函數(shù)廣播DataFrameGroupBy判斷題對(duì)錯(cuò)錯(cuò)對(duì)對(duì)選擇題AABCD簡(jiǎn)答題分組聚合的流程一般為拆分、應(yīng)用、合并。拆分是將數(shù)據(jù)集按照一定規(guī)則分成若干組;應(yīng)用是對(duì)這些分組的數(shù)據(jù)進(jìn)行一系列操作的過(guò)程;合并是將這些執(zhí)行操作后的結(jié)果進(jìn)行整合。常用的分組方式主要有4種,分別為:列表或數(shù)組,列表或數(shù)組的長(zhǎng)度需要與帶分組軸的長(zhǎng)度一致、DataFrame中某列的名稱、字典或Series對(duì)象、函數(shù)。程序題答案: importpandasaspdstudnets_data=pd.DataFrame({'年級(jí)':['大一','大二','大三','大四','大二','大三','大一','大三','大四'],'姓名':['李宏卓','李思真','張振海','趙鴻飛','白蓉','馬騰飛','張曉凡','金紫萱','金燁'],'年齡':[18,19,20,21,19,20,18,20,21],'身高':[175,165,178,175,160,180,167,170,185],'體重':[65,60,70,76,55,70,52,53,73]})data=studnets_data.groupby('年級(jí)')Freshman=dict([xforxindata])['大一']print(Freshman)答案:data=data.apply(max)deldata['年級(jí)']print(data)答案:Junior=dict([xforxindata])['大三']print(Freshman['體重'].apply('mean'))print(Junior['體重'].apply('mean'))第6章填空題瀏覽器直方圖餅圖折線圖pyplot數(shù)據(jù)的類型分布情況bar判斷題對(duì)對(duì)錯(cuò)錯(cuò)對(duì)選擇題ADDBD程序題答案: importpandasaspdstock_data=pd.DataFrame({'證券代碼':['000609','000993','002615','000795','002766','000971','000633','300173','300279','000831'],'證券簡(jiǎn)稱':['中迪投資','閩東電力','哈爾斯','英洛華','索菱股份','高升控股','合金投資','智慧松德','和晶科技','五礦稀土'],'最新價(jià)':[4.80,4.80,5.02,3.93,6.78,3.72,4.60,4.60,5.81,9.87],'漲幅跌%':[10.09,10.09,10.09,10.08,10.06,10.06,10.06,10.05,10.05,10.04]})print(stock_data)答案:importmatplotlib.pyplotasplt%matplotlibinlineplt.rcParams['font.sans-serif']=['SimHei']#正常顯示中文標(biāo)簽plt.rcParams['axes.unicode_minus']=False#正常顯示負(fù)號(hào)x_axis=stock_data['證券簡(jiǎn)稱']y_axis=stock_data['最新價(jià)']plt.bar(x_axis,y_axis)#先進(jìn)行保存,如果在show()函數(shù)后面使用,會(huì)出現(xiàn)保存的圖片是空白圖片plt.savefig(r"C:\Users\admin\Desktop\shares_bar.png")plt.show()第7章填空題時(shí)間序列預(yù)測(cè)基礎(chǔ)頻率重采樣Period判斷題對(duì)對(duì)錯(cuò)對(duì)錯(cuò)選擇題ADDBC簡(jiǎn)答題答案:時(shí)間戳(Timestamp),表示特定的時(shí)刻,比如現(xiàn)在。固定周期(period),比如2018年或者2018年10月。時(shí)間間隔(interval),由起始時(shí)間戳和結(jié)束時(shí)間戳表示。答案如果是將高頻率數(shù)據(jù)聚合到低頻率,則稱為降采樣;如果是將低頻率數(shù)據(jù)轉(zhuǎn)換到高頻率數(shù)據(jù),則稱為升采樣。程序分析題答案:運(yùn)行產(chǎn)生ValueError異常,主要是因?yàn)閐ate_range()函數(shù)中必須傳入start、end、periods、freq中至少三個(gè)參數(shù),而代碼中只傳入了start和freq參數(shù)。答案:運(yùn)行結(jié)果為5答案:運(yùn)行出現(xiàn)異常,因?yàn)槿掌谧址母袷讲荒軌虮徽_解析第8章填空題基于情感詞典基于機(jī)器學(xué)習(xí)余弦相似度無(wú)關(guān)相關(guān)有監(jiān)督數(shù)據(jù)集準(zhǔn)備特征抽取模型訓(xùn)練分類結(jié)果評(píng)價(jià)判斷題錯(cuò)對(duì)錯(cuò)對(duì)錯(cuò)選擇題ADDAB簡(jiǎn)答題答案:文本分析是指對(duì)文本的表示及其特征項(xiàng)的選取,通過(guò)一定的方法將文本中無(wú)用的信息刪除,留下有用的信息,通過(guò)對(duì)這些有用的信息進(jìn)行挖掘,最后根據(jù)結(jié)果分析文本得意圖和目的。答案:常用的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論