版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
6.1數(shù)據(jù)類(lèi)型變換學(xué)習(xí)內(nèi)容1.astype()方法2.
to_numeric()方法6.1數(shù)據(jù)類(lèi)型變換pandas中進(jìn)行數(shù)據(jù)類(lèi)型變換有兩種基本方法:(1)使用astype()方法進(jìn)行強(qiáng)制類(lèi)型變換。(2)使用pandas提供的to_numeric()方法變換為數(shù)字類(lèi)型。6.1.1用astype()方法進(jìn)行強(qiáng)制類(lèi)型變換astype()方法可以將pandas的DataFrame對(duì)象的一列或多列數(shù)據(jù)變換為指定的數(shù)據(jù)類(lèi)型,返回值為變換后的數(shù)據(jù),默認(rèn)更改的是原始對(duì)象的副本,語(yǔ)法格式如下:1DataFrame.astype(dtype,copy=True,errors='raise')6.1數(shù)據(jù)類(lèi)型變換6.1.1用astype()方法進(jìn)行強(qiáng)制類(lèi)型變換表6.1.1
astype()方法的參數(shù)說(shuō)明序號(hào)參數(shù)說(shuō)明1dtype數(shù)據(jù)類(lèi)型或列名稱(chēng),將整個(gè)pandas對(duì)象強(qiáng)制變換為相同的類(lèi)型?;蛘撸褂米值鋥col:dtype,...}用于將一列或多列數(shù)據(jù)變換為特定的類(lèi)型。2copy布爾值,默認(rèn)為T(mén)rue,返回更改對(duì)象的副本。設(shè)置為False表示直接修改對(duì)象。一般不要輕易設(shè)置為False。3errors默認(rèn)為raise,表示允許引發(fā)異常。還可以設(shè)置為ignore,表示忽略異常,出錯(cuò)時(shí)返回原始對(duì)象(版本0.20.0中的新功能。)01importpandasaspd02df=pd.read_csv('data/ratings.csv',sep=',')03df.dtypes04df案例:電影評(píng)分?jǐn)?shù)據(jù)集(data/ratings.csv)6.1數(shù)據(jù)類(lèi)型變換6.1.1用astype()方法進(jìn)行強(qiáng)制類(lèi)型變換05df2=df.astype('int64')06df2.dtypes07df3=df.astype({'用戶(hù)編號(hào)':'int64','項(xiàng)目編號(hào)':'int64'})08df3.dtypes案例:電影評(píng)分?jǐn)?shù)據(jù)集(data/ratings.csv)第5行代碼將df對(duì)象的所有列都變換為整數(shù),并保存到對(duì)象df2。第7行代碼通過(guò)傳遞字典的參數(shù),只改變了用戶(hù)編號(hào)和項(xiàng)目編號(hào)的類(lèi)型。6.1數(shù)據(jù)類(lèi)型變換6.1.1用astype()方法進(jìn)行強(qiáng)制類(lèi)型變換09df4=pd.read_csv('data/booksales.csv',sep=',')10df411df4.dtypes12df5=df4.astype({'價(jià)格':'float64'})案例:圖書(shū)數(shù)據(jù)集(data/booksales.csv)astype()方法的功能有限,只能進(jìn)行純數(shù)字的類(lèi)型轉(zhuǎn)化,如果數(shù)據(jù)包含其他符號(hào),例如人民幣的符號(hào)¥,則無(wú)法進(jìn)行類(lèi)型變換。所以,如果數(shù)據(jù)列不是純數(shù)字,就不能使用astype()方法進(jìn)行類(lèi)型變換6.1數(shù)據(jù)類(lèi)型變換pandas中的to_numeric()方法可以將參數(shù)變換為數(shù)字類(lèi)型,默認(rèn)返回的數(shù)據(jù)類(lèi)型為float64或int64,語(yǔ)法格式如下:1pandas.to_numerice(arg,errors='raise',downcast=None)表6.1.2
to_numeric()方法的參數(shù)說(shuō)明序號(hào)參數(shù)說(shuō)明1arglist(列表),(tuple)元組,一維數(shù)組或Series對(duì)象2errors默認(rèn)為'raise',無(wú)效的解析將引發(fā)異常。還可以是‘coerce’或’ignore’,‘coerce’表示將無(wú)效解析設(shè)置為NaN,‘ignore’表示無(wú)效的解析將忽略異常。3downcastdowncast:默認(rèn)為None,根據(jù)數(shù)據(jù)自動(dòng)變換類(lèi)型。如果不是None,則根據(jù)以下規(guī)則將結(jié)果數(shù)據(jù)變換為可能的最小數(shù)字類(lèi)型:'integer'或'signed'表示變換為最小的有符號(hào)整數(shù)(最小值:8),'unsigned'表示變換為最小的無(wú)符號(hào)整數(shù)(最小值:numpy.uint8),'float'表示變換為最小的小數(shù)(最小值:numpy.float32)6.1.2用to_numeric()方法變換為數(shù)字類(lèi)型6.1數(shù)據(jù)類(lèi)型變換to_numeric()方法進(jìn)行數(shù)據(jù)類(lèi)型變換的代碼示例:01importpandasaspd02s=pd.Series(['1.0','2',-3])03pd.to_numeric(s)04pd.to_numeric(s,downcast='float')05pd.to_numeric(s,downcast='signed')'float'表示變換為最小的小數(shù)(最小值:numpy.float32)第5行代碼設(shè)置to_numeric()方法的downcast='signed',變換為最小的有符號(hào)整數(shù)(最小值:8)6.1數(shù)據(jù)類(lèi)型變換to_numeric()方法進(jìn)行數(shù)據(jù)類(lèi)型變換的代碼示例:06s2=pd.Series(['apple','1.0','2',-3])07pd.to_numeric(s2,errors='ignore')08pd.to_numeric(s2,errors='coerce')09pd
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度物流倉(cāng)儲(chǔ)承包經(jīng)營(yíng)合同賠償與供應(yīng)鏈管理協(xié)議2篇
- 二零二五版德國(guó)高校博士教師招聘及雇傭服務(wù)合同3篇
- 二零二五年度租賃代理風(fēng)險(xiǎn)控制合同3篇
- 個(gè)人發(fā)起離婚合同書(shū)標(biāo)準(zhǔn)模板版B版
- 2024年飛躍:專(zhuān)業(yè)電競(jìng)團(tuán)隊(duì)贊助協(xié)議3篇
- 個(gè)性化汽車(chē)抵押貸款協(xié)議樣本(2024版)
- 2024年跨平臺(tái)整合傳播服務(wù)協(xié)議3篇
- 2024版體育賽事代理執(zhí)行合同樣本3篇
- 二零二五年新型環(huán)保建材生產(chǎn)與建筑廢棄物回收合同3篇
- 西南財(cái)經(jīng)大學(xué)天府學(xué)院《半導(dǎo)體芯片技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- SY-T 5333-2023 鉆井工程設(shè)計(jì)規(guī)范
- 蔣詩(shī)萌小品《誰(shuí)殺死了周日》臺(tái)詞完整版
- TB 10010-2008 鐵路給水排水設(shè)計(jì)規(guī)范
- 黑色素的合成與美白產(chǎn)品的研究進(jìn)展
- 建筑史智慧樹(shù)知到期末考試答案2024年
- 金蓉顆粒-臨床用藥解讀
- 社區(qū)健康服務(wù)與管理教案
- 2023-2024年家政服務(wù)員職業(yè)技能培訓(xùn)考試題庫(kù)(含答案)
- 2023年(中級(jí))電工職業(yè)技能鑒定考試題庫(kù)(必刷500題)
- 藏歷新年文化活動(dòng)的工作方案
- 果酒釀造完整
評(píng)論
0/150
提交評(píng)論