



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Python數(shù)據(jù)分析基礎(chǔ)與應(yīng)用模塊電子活頁8-4對(duì)日期和時(shí)間數(shù)據(jù)進(jìn)行靈活處理【任務(wù)8-1】對(duì)日期和時(shí)間數(shù)據(jù)進(jìn)行靈活處理【任務(wù)描述】編寫代碼實(shí)現(xiàn)以下功能。①從Excel文件orderInfo.xlsx的第一個(gè)工作表中獲取“訂單完成時(shí)間”和“商品金額”兩列數(shù)據(jù)。②查看獲取的數(shù)據(jù)的列名、數(shù)據(jù)類型、記錄數(shù)量等相關(guān)信息。③單獨(dú)提取“訂單完成時(shí)間”列數(shù)據(jù),指定格式符為“'Y-%m-%d”,將無效的數(shù)據(jù)解析為NaN。④查看數(shù)據(jù)集中各列數(shù)據(jù)的數(shù)據(jù)類型。⑤隨機(jī)獲取DataFrame中的5條銷售日期數(shù)據(jù)。⑥分別從“銷售日期”列中獲取無時(shí)/分/秒的日期、年、月、日、季度和星期。⑦輸出步驟(6)中獲取的數(shù)據(jù)及對(duì)應(yīng)數(shù)據(jù)類型。⑧將年份2021和2022、月份2和3、天數(shù)4和15、小時(shí)數(shù)2和3通過DataFrame結(jié)構(gòu)組合為日期和時(shí)間數(shù)據(jù)。⑨將前面從“銷售日期”列中提取的年、月、日數(shù)據(jù)重新組合為日期和時(shí)間數(shù)據(jù)。⑩從“銷售日期”列中提取由年、月組成的數(shù)據(jù)?!救蝿?wù)實(shí)現(xiàn)】在JupyterNotebook開發(fā)環(huán)境中創(chuàng)建t8-01.ipynb,然后在單元格中編寫代碼與輸出對(duì)應(yīng)的結(jié)果。(1)讀取Excel文件orderInfo.xlsx中的數(shù)據(jù)代碼如下:importpandasaspdpath=r'data\orderInfo.xlsx'#獲取“訂單完成時(shí)間”和“商品金額”兩列數(shù)據(jù)#默認(rèn)讀取Excel文件的第一個(gè)工作表sales_df=pd.read_excel(path,usecols=['訂單完成時(shí)間','商品金額'])(2)查看列名、數(shù)據(jù)類型、記錄數(shù)量等相關(guān)信息代碼如下:sales_()輸出結(jié)果:<class'pandas.core.frame.DataFrame'>RangeIndex:9entries,0to8Datacolumns(total2columns):#ColumnNon-NullCountDtype0訂單完成時(shí)間9non-nulldatetime64[ns]1商品金額9non-nullfloat64dtypes:datetime64[ns](1),float64(1)memoryusage:272.0bytes(3)單獨(dú)提取“訂單完成時(shí)間”列數(shù)據(jù)提取“訂單完成時(shí)間”列數(shù)據(jù)時(shí)指定格式符為“'Y-%m-%d”,將無效的數(shù)據(jù)解析為NaN。代碼如下:sales_df['銷售日期']=pd.to_datetime(sales_df['訂單完成時(shí)間'],format='%Y-%m-%d',errors='coerce')(4)查看數(shù)據(jù)集中各列數(shù)據(jù)的數(shù)據(jù)類型代碼如下:print(sales_df.dtypes)輸出結(jié)果:訂單完成時(shí)間datetime64[ns]商品金額float64銷售日期datetime64[ns]dtype:object(5)隨機(jī)獲取DataFrame中的5條銷售日期數(shù)據(jù)代碼如下:print(sales_df["銷售日期"].sample(5))輸出結(jié)果:52021-02-2518:21:0522021-02-2011:11:5762021-03-1215:12:2802021-03-0620:40:1082021-03-2210:11:26Name:銷售日期,dtype:datetime64[ns](6)從“銷售日期”列獲取日期數(shù)據(jù)分別從“銷售日期”列中獲取不包含時(shí)/分/秒的日期以及年、月、日、季度、星期數(shù)據(jù),并輸出這些數(shù)據(jù)。代碼如下:sales_df['日期']=sales_df['銷售日期'].dt.datesales_df['年']=sales_df['銷售日期'].dt.yearsales_df['月']=sales_df['銷售日期'].dt.monthsales_df['日']=sales_df['銷售日期'].dt.daysales_df['季度']=sales_df['銷售日期'].dt.quartersales_df['星期']=sales_df['銷售日期'].dt.weekdaysales_df輸出結(jié)果:(7)輸出日期和時(shí)間數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)類型代碼如下:sales_df.dtypes輸出結(jié)果:訂單完成時(shí)間atetime64[ns]商品金額float64銷售日期datetime64[ns]日期object年int64月int64日int64季度int64星期int64dtype:object(8)組合日期和時(shí)間數(shù)據(jù)將年份2021和2022、月份2和3、天數(shù)4和15、小時(shí)數(shù)2和3通過DataFrame結(jié)構(gòu)組合為日期和時(shí)間數(shù)據(jù)。代碼如下:#將多個(gè)DataFrame列組合成日期和時(shí)間數(shù)據(jù)importpandasaspddf1=pd.DataFrame({'year':[2021,2022],'month':[2,3],'day':[4,15],'hour':[2,3]})pd.to_datetime(df1)輸出結(jié)果:02021-02-0402:00:0012022-03-1503:00:00dtype:datetime64[ns]代碼如下:#只傳遞需要組合的列df1=pd.to_datetime(df1[['year','month','day']])df1輸出結(jié)果:02021-02-0412022-03-15dtype:datetime64[ns](9)將年、月、日數(shù)據(jù)組合為日期和時(shí)間數(shù)據(jù)將前面從“銷售日期”列中提取的年、月、日數(shù)據(jù)重新組合為日期和時(shí)間數(shù)據(jù)。代碼如下:df2=pd.DataFrame({'year':sales_df['年'],'month':sales_df['月'],'day':sales_df['日']})df3=pd.to_datetime(df2[['year','month','day']])df3輸出結(jié)果:02021-03-0612021-03-0522021-02-2032021-02-2042021-03-0452021-02-2562021-03-1272021-03-1282021-03-22dtype:datetime64[ns](10)從“銷售日期”列中提取由年、月組成的數(shù)據(jù)代碼如下:sales_df['year_month']=sales_df['銷售日期'].apply(lambdax:x.strftime('%Y-%m'))sales_df
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 優(yōu)翼課件函數(shù)相關(guān)視頻
- 靈活用工的勞動(dòng)合同
- 2025年智能設(shè)備采購合同
- 《2025年合同終止與解除勞動(dòng)合同公告》
- 鐵路售票員必知必會(huì)復(fù)習(xí)試題及答案
- 礦山應(yīng)急救援培訓(xùn)考試練習(xí)試題及答案
- 2025至2030中國(guó)冷鏈行業(yè)發(fā)展趨勢(shì)分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 妊娠身體護(hù)理
- 肝癌綜合治療措施
- 營(yíng)養(yǎng)學(xué)基礎(chǔ)與膳食管理培訓(xùn)課件
- 校園食品安全和膳食經(jīng)費(fèi)管理突出問題專項(xiàng)整治工作方案范文
- 2025-2030瀝青再生行業(yè)市場(chǎng)現(xiàn)狀供需分析及重點(diǎn)企業(yè)投資評(píng)估規(guī)劃分析研究報(bào)告
- 5《有話好好說》(教案)-大象版心理健康四年級(jí)
- 2025-2030中國(guó)氮?dú)鈴椈尚袠I(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 制造企業(yè)生產(chǎn)效率提升計(jì)劃
- 《老年服務(wù)禮儀與溝通》高職養(yǎng)老服務(wù)類專業(yè)全套教學(xué)課件
- 安全隱患的課件
- 2025-2030中國(guó)倒裝芯片球柵陣列行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025年湖南省初中學(xué)業(yè)水平考試模擬考試英語試卷(BEST聯(lián)考)
- 七年級(jí)道德與法治教學(xué)反思
- 解除終止勞動(dòng)合同證明書適用基層、管理同用
評(píng)論
0/150
提交評(píng)論