財務(wù)大數(shù)據(jù)-Python基礎(chǔ) 課件 3.5Pandas-數(shù)據(jù)特征分析_第1頁
財務(wù)大數(shù)據(jù)-Python基礎(chǔ) 課件 3.5Pandas-數(shù)據(jù)特征分析_第2頁
財務(wù)大數(shù)據(jù)-Python基礎(chǔ) 課件 3.5Pandas-數(shù)據(jù)特征分析_第3頁
財務(wù)大數(shù)據(jù)-Python基礎(chǔ) 課件 3.5Pandas-數(shù)據(jù)特征分析_第4頁
財務(wù)大數(shù)據(jù)-Python基礎(chǔ) 課件 3.5Pandas-數(shù)據(jù)特征分析_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

Pandas-數(shù)據(jù)特征分析課前回顧重復(fù)值處理:duplicated()、drop_duplicates()缺失值處理:isna()、dropna()、fillna()其他異常處理:刪除特殊字符replace()、更改數(shù)據(jù)類型astype()索引設(shè)置:set_index()、reset_index()科云數(shù)據(jù)清洗函數(shù):dataClean()目錄010203描述性統(tǒng)計分析累計統(tǒng)計數(shù)據(jù)排序01描述性統(tǒng)計分析描述性統(tǒng)計分析在財務(wù)工作中,我們常常需要計算各種財務(wù)指標的合計數(shù)、平均值、最大最小值、標準差等,那么我們?nèi)绾尾拍芸焖僦肋@些統(tǒng)計值呢?Pandas提供了很多描述性統(tǒng)計函數(shù),常用統(tǒng)計函數(shù)如下:函數(shù)描述函數(shù)描述函數(shù)描述count()非空值的個數(shù)median()中位數(shù)mad()平均絕對偏差sum()求和mode()眾數(shù)abs()絕對值mean()平均值prod()數(shù)組元素的乘積cov()協(xié)方差min()最小值quantile()分位數(shù)corr()相關(guān)系數(shù)max()最大值var()樣本方差pct_change()百分數(shù)變化describe()統(tǒng)計信息摘要std()樣本標準差diff()一階差分讀取數(shù)據(jù)讀取data.xlsx中利潤表項目數(shù)據(jù):代碼#引入pandasimportpandasaspd#讀取data.xlsx利潤表項目df=pd.read_excel('/webpython/course/d2633ec9ca5c4a288b73f97b4616d541/data.xlsx',sheet_name=1,converters={'年':str,'月':str})#顯示前5行show_table(df.head())描述性統(tǒng)計分析可以計算表格中各列的統(tǒng)計指標,也可以結(jié)合索引,計算單列統(tǒng)計指標。描述性統(tǒng)計分析可以計算表格中各列的統(tǒng)計指標,也可以結(jié)合索引,計算單列統(tǒng)計指標。describe()函數(shù)describe()函數(shù):生成描述性統(tǒng)計信息,將所有數(shù)值列進行統(tǒng)計,返回DataFrame中常見的統(tǒng)計指標,包括值個數(shù)、均值、標準差、最大最小值、百分數(shù)。describe()函數(shù)語法:DataFrame.describe(percentiles=None,include=None,exclude=None,datetime_is_numeric=False)常用參數(shù)說明percentiles百分位數(shù),介于0-1之間,默認[25%,50%,75%]include包含在結(jié)果中的數(shù)據(jù)類型,默認所有數(shù)值列exclude排除在結(jié)果中的數(shù)據(jù)類型,默認不排除任何內(nèi)容datetime_is_numeric是否將datetimedtypes視為數(shù)字,默認為Falsedescribe()函數(shù)describe()函數(shù)結(jié)合索引器可以單獨提取describe中想要的指標數(shù)據(jù)。示例1代碼#使用索引器獲取單項指標print(df.describe().loc['max','營業(yè)收入'])輸出結(jié)果:424000.0代碼#查看df統(tǒng)計信息show_table(df.describe())pct_change()函數(shù)pct_change()函數(shù):當(dāng)前元素與先前元素之間的百分比變化,默認計算與前一行的百分比變化,適用于財務(wù)報表的環(huán)比分析。pct_change()函數(shù)語法:DataFrame.pct_change(periods=1,fill_method='pad',limit=None,freq=None,**kwargs)常用參數(shù)說明periods計算周期,默認為1fill_method填充空值的方法,默認'pad',表示用前一個非缺失值填充,bfill用后一個非缺失值填充,None不填充limit限制填充次數(shù)axis計算方向,{0或'index',1或'columns'},默認axis=0pct_change()函數(shù)要求:計算營業(yè)收入、營業(yè)成本、凈利潤的環(huán)比增長率。示例2代碼#計算環(huán)比增長率,并使用show_table()展示結(jié)果前5行show_table(df.set_index(['年','月']).pct_change().head())例:(329800-274400)/274400=0.20189502累計統(tǒng)計累計統(tǒng)計在會計工作中,除了要計算各期發(fā)生額之外,往往還需要計算“本年累計值”。提示axis=0:默認值,沿0軸計算,即計算每列的值axis=1:沿1軸計算,即計算每行的值函數(shù)描述cumsum()累計總和cumprod()累計乘積cummax()累計最大值cummin()累計最小值累計統(tǒng)計要求:計算2021年各期”營業(yè)收入、營業(yè)成本、凈利潤”的本年累計金額。示例3代碼df1=df.loc[df['年']=='2021'].set_index(['年','月']).cumsum()show_table(df1.head())03數(shù)據(jù)排序

數(shù)據(jù)排序sort_values()函數(shù):按照某行或某列的值進行升序或降序排序。sort_values()函數(shù)語法:DataFrame.sort_values(by,axis=0,ascending=True,inplace=False,kind='quicksort',na_position='last',ignore_index=False,key=None)常用參數(shù)描述byaxis軸上的某個索引或索引列表,按什么排序axis要排序的軸,{0或'index',1或'columns'},默認0,按照指定列數(shù)據(jù)排序ascending排序方式,默認為True,代表升序排序,F(xiàn)alse代表降序排序inplace默認為False,True表示直接在原數(shù)據(jù)上排序ignore_index是否重建索引,默認為False數(shù)據(jù)排序要求:按照凈利潤降序排序,顯示前5行。示例4代碼df2=df.sort_values('凈利潤',ascending=False)show_table(df2.head())sort_index()函數(shù)sort_index()函數(shù):在指定軸上根據(jù)索引值對數(shù)據(jù)進行排序,默認使用行索引升序排序。sort_index()函數(shù)語法:DataFrame.sort_index(axis=0,level=None,ascending=True,inplace=False,kind='quicksort',na_position='last',sort_remaining=True,ignore_index=False,key=None)代碼#按照行索引降序排序df3=df.sort_index(ascending=False)show

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論