MOOC Python大數(shù)據(jù)分析-南京財(cái)經(jīng)大學(xué) 中國(guó)大學(xué)慕課答案_第1頁(yè)
MOOC Python大數(shù)據(jù)分析-南京財(cái)經(jīng)大學(xué) 中國(guó)大學(xué)慕課答案_第2頁(yè)
MOOC Python大數(shù)據(jù)分析-南京財(cái)經(jīng)大學(xué) 中國(guó)大學(xué)慕課答案_第3頁(yè)
MOOC Python大數(shù)據(jù)分析-南京財(cái)經(jīng)大學(xué) 中國(guó)大學(xué)慕課答案_第4頁(yè)
MOOC Python大數(shù)據(jù)分析-南京財(cái)經(jīng)大學(xué) 中國(guó)大學(xué)慕課答案_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

MOOCPython大數(shù)據(jù)分析-南京財(cái)經(jīng)大學(xué)中國(guó)大學(xué)慕課答案單元小測(cè)試11、問(wèn)題:下面關(guān)于DataFrame中行索引說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、行索引默認(rèn)是從0開(kāi)始累加的整數(shù)B、默認(rèn)的行索引主要起到唯一區(qū)分?jǐn)?shù)據(jù)行的作用C、隨著更新的進(jìn)行,索引有可能不能區(qū)分出唯一的行D、行號(hào)不同于索引,其取值是從1開(kāi)始不斷累加的序號(hào),不論如何更改,行號(hào)始終保持著這種序列關(guān)系正確答案:【行號(hào)不同于索引,其取值是從1開(kāi)始不斷累加的序號(hào),不論如何更改,行號(hào)始終保持著這種序列關(guān)系】2、問(wèn)題:有代碼:print(frame.iloc[[3,1],[0,2]])它的含義是:選項(xiàng):A、選擇第4行和第2行并且第1列和第3列的表格數(shù)值B、有錯(cuò)誤,因?yàn)?不能放在1前面倒序來(lái)取C、選擇第4行和第2行并且第1列到第3列的表格數(shù)值D、有錯(cuò)誤,因?yàn)檫x擇列要放在選擇行前面正確答案:【選擇第4行和第2行并且第1列和第3列的表格數(shù)值】3、問(wèn)題:很多DataFrame方法中的inplace參數(shù)功能是:選項(xiàng):A、用于設(shè)定記錄排序的大小方向B、用于設(shè)定是否強(qiáng)制更新原始數(shù)據(jù)C、用于設(shè)定是否設(shè)置數(shù)據(jù)為只讀模式D、用于設(shè)定數(shù)據(jù)復(fù)制是否保留副本正確答案:【用于設(shè)定是否強(qiáng)制更新原始數(shù)據(jù)】4、問(wèn)題:有代碼為:frame.loc[frame['height']1.80,'age']=frame.loc[frame['height']1.80,'age']+1該代碼的功能為:選項(xiàng):A、將所有身高大于1.80m的學(xué)生身高增加1厘米B、查詢身高大于1.80m的學(xué)生,并將不大于1.80m的學(xué)生身高增加1厘米C、將所有身高大于1.80m的學(xué)生年齡增加1歲D、代碼有錯(cuò)誤,因?yàn)閘oc選擇后的數(shù)據(jù)不能更新正確答案:【將所有身高大于1.80m的學(xué)生年齡增加1歲】5、問(wèn)題:下面關(guān)于reset_index、sort_index和sort_values方法的說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、reset_index可以將當(dāng)前索引還原復(fù)位為正常的數(shù)據(jù)列B、sort_index表示按照索引排序當(dāng)前數(shù)據(jù)C、sort_values表示按照索引復(fù)位后的列來(lái)排序數(shù)據(jù)D、sort_index無(wú)需參數(shù)而sort_values必須有參數(shù)正確答案:【sort_values表示按照索引復(fù)位后的列來(lái)排序數(shù)據(jù)】測(cè)試11、問(wèn)題:下面關(guān)于PyCharm的說(shuō)法中,正確的是哪一個(gè)?選項(xiàng):A、安裝完P(guān)ython后,必須要安裝PyCharm才能編寫(xiě)Python語(yǔ)句并運(yùn)行B、PyCharm和Python安裝不分先后C、PyCharm提供了一種更為方便的代碼編輯功能,一站式進(jìn)行編輯、運(yùn)行和糾錯(cuò)D、Pycharm有很多開(kāi)發(fā)工具,我們這里使用的是一個(gè)非常著名而且好用的,稱為Python正確答案:【PyCharm提供了一種更為方便的代碼編輯功能,一站式進(jìn)行編輯、運(yùn)行和糾錯(cuò)】2、問(wèn)題:下面關(guān)于Python進(jìn)行數(shù)據(jù)分析的特點(diǎn)中,哪一項(xiàng)錯(cuò)誤?選項(xiàng):A、Python支持大數(shù)據(jù)分析,海量數(shù)據(jù)處理更為方便和快捷B、和Excel相比,雖然Python提供了更快的數(shù)據(jù)處理能力,但是在可視化展示方面卻不如ExcelC、和Python相比,Excel雖然功能較為簡(jiǎn)單,但是在易用性方面更易于上手D、數(shù)據(jù)分析往往涉及計(jì)算機(jī)、統(tǒng)計(jì)、數(shù)學(xué)等多方面的學(xué)科知識(shí)正確答案:【和Excel相比,雖然Python提供了更快的數(shù)據(jù)處理能力,但是在可視化展示方面卻不如Excel】3、問(wèn)題:很多Python代碼第一行都有:#coding:utf-8這個(gè)含義是:選項(xiàng):A、表示要在國(guó)內(nèi)發(fā)布代碼B、運(yùn)行在中文電腦系統(tǒng)上C、需要分析中文數(shù)據(jù)信息D、代碼中有中文信息正確答案:【代碼中有中文信息】4、問(wèn)題:frompandasimportDataFrame這個(gè)語(yǔ)句的含義是:選項(xiàng):A、從DataFrame類(lèi)導(dǎo)入pandas類(lèi)B、從pandas庫(kù)導(dǎo)入DataFrame類(lèi)C、從pandas庫(kù)導(dǎo)入DataFrame庫(kù)D、從DataFrame庫(kù)導(dǎo)入pandas類(lèi)正確答案:【從pandas庫(kù)導(dǎo)入DataFrame類(lèi)】5、問(wèn)題:frame=pd.DataFrame(data,index=[6,5,4,3,2,1,0])index代碼的含義是:選項(xiàng):A、對(duì)現(xiàn)有數(shù)據(jù)按照倒序排列B、重新對(duì)現(xiàn)有每一行設(shè)置新的index數(shù)值C、設(shè)置每行的數(shù)值內(nèi)容D、對(duì)現(xiàn)有列按照index排序正確答案:【重新對(duì)現(xiàn)有每一行設(shè)置新的index數(shù)值】6、問(wèn)題:print(frame[1:2])這里的1:2是指:選項(xiàng):A、輸出索引號(hào)為1和2的行B、輸出序號(hào)為1和2的行C、輸出索引號(hào)為1的行D、輸出第二行正確答案:【輸出第二行】7、問(wèn)題:print(frame[frame['age'].isin([16,18])])含義是:選項(xiàng):A、輸出年齡為16到18的所有行B、輸出年齡為16或者18的所有行C、輸出年齡為16到17的所有行D、輸出年齡為17的所有行正確答案:【輸出年齡為16或者18的所有行】8、問(wèn)題:round函數(shù)功能是:選項(xiàng):A、最大值B、四舍五入C、大于該數(shù)值的最小整數(shù)D、絕對(duì)值正確答案:【四舍五入】9、問(wèn)題:下面關(guān)于rename的說(shuō)法中,正確的是:選項(xiàng):A、rename只能改變列的名稱B、rename只能改變行的名稱C、是pandas的方法D、rename既能改變行也能改變列的名稱正確答案:【rename既能改變行也能改變列的名稱】10、問(wèn)題:下面關(guān)于數(shù)據(jù)更新的說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、append只能在最后一行后添加新行B、insert可以在任何行前后添加新行C、drop可以刪除行,也可以刪除列D、update可以更新數(shù)據(jù)行正確答案:【update可以更新數(shù)據(jù)行】11、問(wèn)題:print(frame.sort_values(by=['age'],ascending=False))含義是:選項(xiàng):A、按照年齡降序輸出所有數(shù)據(jù)B、按照年齡升序輸出所有數(shù)據(jù)C、按照年齡降序,相同元素按照索引號(hào)排序D、按照年齡升序,相同元素按照索引號(hào)排序正確答案:【按照年齡降序輸出所有數(shù)據(jù)】12、問(wèn)題:下面關(guān)于排序和選擇的說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、排序和選擇功能各不一樣,選擇重點(diǎn)在于挑選所有滿足條件的行,而排序重點(diǎn)關(guān)注首尾行B、先排序再選擇和先選擇后排序效果并不一樣,比如先排序再選擇會(huì)導(dǎo)致排序失效C、先排序再選擇和先選擇后排序效果一樣,因?yàn)檫x擇不會(huì)改變排序的次序D、排序和選擇都可以根據(jù)索引號(hào)來(lái)進(jìn)行正確答案:【先排序再選擇和先選擇后排序效果并不一樣,比如先排序再選擇會(huì)導(dǎo)致排序失效】13、問(wèn)題:print(frame['age'].groupby(frame['age']).count().sort_index())含義是:選項(xiàng):A、對(duì)年齡分組并統(tǒng)計(jì)年齡的種類(lèi)數(shù),并按照升序來(lái)排列B、統(tǒng)計(jì)年齡的種類(lèi)數(shù),并分組和按照升序來(lái)排列C、對(duì)年齡分組并統(tǒng)計(jì)各組人數(shù),并按照升序來(lái)排列D、語(yǔ)法錯(cuò)誤正確答案:【對(duì)年齡分組并統(tǒng)計(jì)各組人數(shù),并按照升序來(lái)排列】14、問(wèn)題:下面關(guān)于分組聚合的說(shuō)法中,正確的是:選項(xiàng):A、聚合函數(shù)不能單用,只能結(jié)合分組使用B、分組后聚合和先聚合后分組效果一樣C、分組聚合的結(jié)果行數(shù)量與組的個(gè)數(shù)一樣D、為了更快的分組聚合,我們必須首先排序數(shù)據(jù)正確答案:【分組聚合的結(jié)果行數(shù)量與組的個(gè)數(shù)一樣】15、問(wèn)題:print(pd.merge(students,scores))下面關(guān)于該語(yǔ)句的說(shuō)法中,正確的是:選項(xiàng):A、自動(dòng)根據(jù)索引號(hào)建立連接B、自動(dòng)去除一個(gè)多余的同名連接列C、默認(rèn)采用左外連接D、可以按照任意兩個(gè)列進(jìn)行連接,并自動(dòng)添加_x和_y后綴正確答案:【自動(dòng)去除一個(gè)多余的同名連接列】單元小測(cè)試21、問(wèn)題:從datetime類(lèi)型的數(shù)據(jù)列birthday中獲取年份,正確的方法是:選項(xiàng):A、frame['birthday'].dt.yearB、frame['birthday'].yearC、datetime.now().yearD、pd.to_datetime(frame['birthday'])正確答案:【frame['birthday'].dt.year】2、問(wèn)題:有代碼為:frame.loc['2019-12':'2020-1']下面說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、功能是選擇2019年12月到2020年1月的全部記錄B、如果寫(xiě)成print(frame.loc['2020-1':'2019-12'])則沒(méi)有結(jié)果,但是不會(huì)報(bào)錯(cuò)C、如果支持這種寫(xiě)法,就必須設(shè)定datetime類(lèi)型的索引D、print(frame.iloc['2019-12':'2020-1'])功能一樣正確答案:【print(frame.iloc['2019-12':'2020-1'])功能一樣】3、問(wèn)題:時(shí)間序列方法中的freq參數(shù)為MS時(shí)含義是:選項(xiàng):A、表示從每月第一個(gè)星期一開(kāi)始取時(shí)間B、表示從月底開(kāi)始取時(shí)間C、表示從月初開(kāi)始取時(shí)間D、表示以整個(gè)月來(lái)取時(shí)間正確答案:【表示從月初開(kāi)始取時(shí)間】4、問(wèn)題:有代碼為:frame=frame.to_period(freq='M')print(frame.asfreq(freq='A'))下面的說(shuō)法中,正確的是:選項(xiàng):A、這表示向細(xì)粒度時(shí)間單位的轉(zhuǎn)換,即月到日B、這表示向細(xì)粒度時(shí)間單位的轉(zhuǎn)換,即雙月到月C、這表示向粗粒度時(shí)間單位的轉(zhuǎn)換,即月到季度D、這表示向粗粒度時(shí)間單位的轉(zhuǎn)換,即月到年正確答案:【這表示向粗粒度時(shí)間單位的轉(zhuǎn)換,即月到年】5、問(wèn)題:有代碼為:importpandasaspdfromdatetimeimportdatetimedata={'ID':['000001','000002','000003','000004','000005','000006','000007'],'name':['黎明','趙怡春','張富平','白麗','牛玉德','姚華','李南'],'gender':[True,False,True,False,True,False,True],'age':[16,20,18,18,17,18,16],'height':[1.88,1.78,1.81,1.86,1.74,1.75,1.76]}dates=[datetime(2019,11,29),datetime(2019,12,5),datetime(2019,12,17),datetime(2019,12,30),datetime(2020,1,1),datetime(2020,1,3),datetime(2020,1,4)]frame=pd.DataFrame(data,index=dates)print(frame['height'].resample('A',kind='period').ohlc())下面的說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、O表示開(kāi)盤(pán)價(jià),C表示收盤(pán)價(jià)B、H和L分別表示最大值和最小值C、最后輸出表示按照月份匯總,并輸出該月份中所有學(xué)生身高的OHLC四個(gè)值D、雖然身高并不是股票數(shù)據(jù),但是也可以使用該方法來(lái)取值正確答案:【最后輸出表示按照月份匯總,并輸出該月份中所有學(xué)生身高的OHLC四個(gè)值】單元小測(cè)試31、問(wèn)題:有代碼為:plt.plot(frame['收盤(pán)價(jià)'])下面的說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、plot為繪制線形圖,必須要有表示X和Y兩個(gè)軸的數(shù)據(jù),因此此時(shí)報(bào)錯(cuò)B、繪制必須后面添加plt.show()才能真正繪制并顯示出來(lái)C、由于該列數(shù)據(jù)很多,會(huì)在屏幕上生成很多點(diǎn),這些由很多很短的直線連接起來(lái)的完整線條甚至可以呈現(xiàn)出曲線的效果D、plt.plot(frame['開(kāi)盤(pán)價(jià)'],frame['收盤(pán)價(jià)'],'ro')這并不表示三維線形圖的繪制,只是改變繪制樣式正確答案:【plot為繪制線形圖,必須要有表示X和Y兩個(gè)軸的數(shù)據(jù),因此此時(shí)報(bào)錯(cuò)】2、問(wèn)題:有代碼為:plt.scatter(frame['A'],frame['B'],c='r',s=10,alpha=0.6)下面的說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、散點(diǎn)圖中的點(diǎn)為紅色B、散點(diǎn)圖中點(diǎn)的透明度為0.6C、散點(diǎn)圖中點(diǎn)之間的邊寬度為10像素D、散點(diǎn)圖中x軸為A數(shù)據(jù)列,y軸為B數(shù)據(jù)列正確答案:【散點(diǎn)圖中點(diǎn)之間的邊寬度為10像素】3、問(wèn)題:假設(shè)有2015-2020年共計(jì)六年所有的交易記錄,有代碼為:results=frame[['收盤(pán)價(jià)']].groupby(frame.index.month).mean()plt.bar(results.index,results['收盤(pán)價(jià)'])plt.show()下面的說(shuō)法中,正確的是:選項(xiàng):A、柱狀圖的x軸有6個(gè)方柱B、柱狀圖的y軸有12個(gè)不同刻度C、柱狀圖的x軸有12個(gè)方柱D、柱狀圖的y軸有6個(gè)不同刻度正確答案:【柱狀圖的x軸有12個(gè)方柱】4、問(wèn)題:下面的哪個(gè)顏色最接近淺黃色?B、FFFFFFD、FF0000F、EEEE00H、111111正確答案:【#EEEE00】5、問(wèn)題:餅狀圖中設(shè)置每個(gè)餅塊的占比數(shù)值及其格式的參數(shù)是:選項(xiàng):A、autopctB、textpropsC、explodeD、wedgeprops正確答案:【autopct】測(cè)試21、問(wèn)題:print(datetime.now())上述代碼單獨(dú)運(yùn)行結(jié)果是:選項(xiàng):A、錯(cuò)誤,不能直接輸出到屏幕B、錯(cuò)誤,沒(méi)有導(dǎo)入正確的類(lèi)型C、正確,但是沒(méi)有顯示內(nèi)容D、正確,顯示今天的日期正確答案:【錯(cuò)誤,沒(méi)有導(dǎo)入正確的類(lèi)型】2、問(wèn)題:利用pd.to_datetime轉(zhuǎn)換日期,下面哪種格式的日期不能正常轉(zhuǎn)換?選項(xiàng):A、2020/10/01B、10/01/2020C、Oct,1,2004D、2020年10月1日正確答案:【2020年10月1日】3、問(wèn)題:下面關(guān)于strptime和strftime方法的說(shuō)明中,錯(cuò)誤的是哪一項(xiàng)?選項(xiàng):A、strptime可以將日期字符串轉(zhuǎn)換為日期類(lèi)型B、strptime可以處理帶有中文格式的日期C、strftime可以將日期類(lèi)型轉(zhuǎn)換為特定格式的字符串D、兩個(gè)函數(shù)都使用m、d、Y等符號(hào)表示月份、日期和年份正確答案:【兩個(gè)函數(shù)都使用m、d、Y等符號(hào)表示月份、日期和年份】4、問(wèn)題:print(frame.truncate(before='2019-12-1'))代碼含義是:選項(xiàng):A、輸出2019年12月1日前的所有記錄B、輸出2019年12月1日后的所有記錄C、輸出2019年11月30日后的所有記錄D、輸出2019年11月30日前的所有記錄正確答案:【輸出2019年11月30日后的所有記錄】5、問(wèn)題:values=['2019Q4']frame=pd.DataFrame(data,pd.PeriodIndex(values,freq='M'))print(frame)輸出的時(shí)間索引值是:選項(xiàng):A、2019-10B、2019-12-31C、2019-12D、2019-10-1正確答案:【2019-10】6、問(wèn)題:對(duì)于freq屬性,它為'A-AUG'時(shí)含義為:選項(xiàng):A、以每年八月一日作為一年開(kāi)始B、以每年九月一日作為一年開(kāi)始C、以每年八月一日作為一年結(jié)束D、以每年九月一日作為一年結(jié)束正確答案:【以每年九月一日作為一年開(kāi)始】7、問(wèn)題:print(frame['height'].resample('M',kind='period').mean())寫(xiě)成分組的方法中,錯(cuò)誤的是:選項(xiàng):A、print(frame['height'].groupby(frame.index.dt.month).mean())B、print(frame['height'].groupby(frame.index.month).mean())C、print(frame['height'].groupby(frame.index.to_period(freq='M')).mean())D、print(frame.groupby(frame.index.to_period(freq='M'))['height'].mean())正確答案:【print(frame['height'].groupby(frame.index.dt.month).mean())】8、問(wèn)題:下面關(guān)于線性圖的說(shuō)法中,正確的說(shuō)法是:選項(xiàng):A、它只能繪制折線,不能繪制散點(diǎn)和方柱B、既可以接收有一個(gè)數(shù)據(jù)列,也可以接收兩個(gè)數(shù)據(jù)列C、當(dāng)一張圖繪制不同的線性圖時(shí),彼此的顏色自動(dòng)設(shè)置為一樣D、繪制的點(diǎn)可以改變形狀,如加號(hào),但是不能修改大小正確答案:【既可以接收有一個(gè)數(shù)據(jù)列,也可以接收兩個(gè)數(shù)據(jù)列】9、問(wèn)題:當(dāng)設(shè)置為完全不透明時(shí),alpha屬性值是:選項(xiàng):A、1B、0.5C、0D、-1正確答案:【1】10、問(wèn)題:下面的那個(gè)顏色最偏向淺紅色:B、9999FFD、009999F、999900H、FF9999正確答案:【#FF9999】11、問(wèn)題:colorbar方法的作用是:選項(xiàng):A、繪制彩色柱狀圖B、給橫軸和縱軸添加顏色上下限C、設(shè)置圖像的背景色D、添加顏色的數(shù)值指示條正確答案:【添加顏色的數(shù)值指示條】12、問(wèn)題:下面關(guān)于餅狀圖的說(shuō)法中,正確的是:選項(xiàng):A、font設(shè)置標(biāo)簽文字大小和顏色B、distance設(shè)置餅塊與中心的分離距離C、autopct設(shè)置數(shù)值標(biāo)簽的位置D、wedgeprops設(shè)置餅圖收縮正確答案:【wedgeprops設(shè)置餅圖收縮】13、問(wèn)題:下面關(guān)于seaborn的說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、它是可視化工具包,提供了更為方便的科學(xué)計(jì)算可視化功能B、它比matplotlib功能更多,可以獨(dú)立于matplotlib使用C、clustermap功能可以提供分類(lèi)的熱力圖D、countplot功能可以顯示屬性特征各個(gè)數(shù)值及其個(gè)數(shù)統(tǒng)計(jì)正確答案:【它比matplotlib功能更多,可以獨(dú)立于matplotlib使用】14、問(wèn)題:pyecharts是如何繪制地圖內(nèi)容的?選項(xiàng):A、繪制在matplotlib圖形界面上B、繪制在seaborn圖形界面上C、繪制在網(wǎng)頁(yè)文件中D、繪制在控制臺(tái)輸出中正確答案:【繪制在網(wǎng)頁(yè)文件中】15、問(wèn)題:networkx中可以直接將DataFrame轉(zhuǎn)換為網(wǎng)絡(luò)圖的方法是:選項(xiàng):A、drawB、from_pandas_edgelistC、add_nodes_fromD、add正確答案:【from_pandas_edgelist】單元小測(cè)試41、問(wèn)題:下面的說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、特征列是指用于預(yù)測(cè)目標(biāo)數(shù)據(jù)的數(shù)據(jù)列B、測(cè)試集是用來(lái)評(píng)估模型效果的數(shù)據(jù)行C、訓(xùn)練集數(shù)量一般要大于測(cè)試集D、即使測(cè)試集數(shù)量大于訓(xùn)練集,測(cè)試集也不能當(dāng)成訓(xùn)練集正確答案:【即使測(cè)試集數(shù)量大于訓(xùn)練集,測(cè)試集也不能當(dāng)成訓(xùn)練集】2、問(wèn)題:有代碼為:train_test_split(X,y,test_size=0.1)此時(shí)的test_size及其數(shù)值的含義是:選項(xiàng):A、將訓(xùn)練集和測(cè)試集分別設(shè)為全部數(shù)據(jù)行的10%和90%B、將訓(xùn)練集設(shè)為全部數(shù)據(jù)行的90%C、將測(cè)試集設(shè)為全部數(shù)據(jù)列的10%D、將訓(xùn)練集和測(cè)試集分別設(shè)為全部數(shù)據(jù)列的99.9%和0.1%正確答案:【將訓(xùn)練集設(shè)為全部數(shù)據(jù)行的90%】3、問(wèn)題:下面關(guān)于分類(lèi)和回歸的說(shuō)法中,正確的是:選項(xiàng):A、回歸通常用于連續(xù)變量預(yù)測(cè),分類(lèi)一般用于離散變量預(yù)測(cè)。B、分類(lèi)和回歸的區(qū)別在于輸出變量的類(lèi)型,因此分類(lèi)和回歸問(wèn)題不能相互轉(zhuǎn)換,并且同時(shí)構(gòu)成了兩大類(lèi)常見(jiàn)機(jī)器學(xué)習(xí)任務(wù)C、評(píng)價(jià)分類(lèi)和回歸方法可以使用同樣的命中準(zhǔn)確度指標(biāo)D、決策樹(shù)算法是分類(lèi)算法而不是回歸算法正確答案:【回歸通常用于連續(xù)變量預(yù)測(cè),分類(lèi)一般用于離散變量預(yù)測(cè)?!?、問(wèn)題:下面關(guān)于交叉驗(yàn)證的說(shuō)法中,正確的是:選項(xiàng):A、由于是交叉選擇,因此在一次驗(yàn)證計(jì)算時(shí),同一數(shù)據(jù)行可以被同時(shí)多次作為訓(xùn)練集和測(cè)試集B、交叉驗(yàn)證意味著在利用訓(xùn)練集評(píng)估測(cè)試集后,再使用測(cè)試集評(píng)估訓(xùn)練集C、交叉驗(yàn)證最終結(jié)果高,并不意味著其中每一次驗(yàn)證結(jié)果都很高D、不同于一次單一驗(yàn)證,交叉驗(yàn)證因?yàn)檫M(jìn)行多次平均,因此驗(yàn)證結(jié)果的指標(biāo)值通常相同正確答案:【交叉驗(yàn)證最終結(jié)果高,并不意味著其中每一次驗(yàn)證結(jié)果都很高】5、問(wèn)題:下面關(guān)于文本類(lèi)型數(shù)據(jù)的說(shuō)法中,錯(cuò)誤的是:選項(xiàng):A、通常文本類(lèi)型數(shù)據(jù)需要轉(zhuǎn)換為數(shù)值型數(shù)據(jù)后,再參與分類(lèi)和回歸計(jì)算B、獨(dú)熱編碼的取值要根據(jù)文本類(lèi)型數(shù)據(jù)的數(shù)據(jù)種類(lèi),如果有三種,則獨(dú)熱編碼取值分別為0、1、2C、可以利用DataFrame的astype將文本類(lèi)型數(shù)據(jù)轉(zhuǎn)換為數(shù)值型D、LabelEncoder可以將文本類(lèi)型數(shù)據(jù)轉(zhuǎn)換為整數(shù)類(lèi)型正確答案:【獨(dú)熱編碼的取值要根據(jù)文本類(lèi)型數(shù)據(jù)的數(shù)據(jù)種類(lèi),如果有三種,則獨(dú)熱編碼取值分別為0、1、2】客觀考查1、問(wèn)題:有代碼:#coding:utf-8importpandasaspddata={'ID':['000001','000002','000003','000004','000005','000006','000007'],'name':['黎明','趙怡春','張富平','白麗','牛玉德','姚華','李南'],'gender':[True,False,True,False,True,False,True],'age':[16,20,18,18,17,18,16],'height':[1.88,1.78,1.81,1.86,1.74,1.75,1.76]}frame=pd.DataFrame(data,index=[1,2,1,2,1,2,1])print(frame.loc[1])請(qǐng)問(wèn)下面的說(shuō)法正確的有:選項(xiàng):A、輸出為第一條記錄,loc函數(shù)表示按照行號(hào)選擇記錄,1表示第一條,因此為第一條B、輸出為所有記錄的第一列,loc默認(rèn)一個(gè)參數(shù)表示列的選擇C、輸出為第二條記錄,loc函數(shù)表示按照行號(hào)選擇記錄,0表示第一條,因此1為第二條D、輸出為四條記錄,即索引值為1的四條行記錄E、代碼不會(huì)報(bào)錯(cuò),但是如果輸出語(yǔ)句改為:print(frame[1])就會(huì)報(bào)錯(cuò),因?yàn)槟J(rèn)為行的選擇,此時(shí)索引為1的有多個(gè),會(huì)導(dǎo)致系統(tǒng)出現(xiàn)選擇判斷不清而出錯(cuò)F、代碼不會(huì)報(bào)錯(cuò),但是如果輸出語(yǔ)句改為:print(frame[1])就會(huì)報(bào)錯(cuò),因?yàn)檫x擇行不允許使用單一的序號(hào),正確的寫(xiě)法是:print(frame[1:2])正確答案:【輸出為四條記錄,即索引值為1的四條行記錄#代碼不會(huì)報(bào)錯(cuò),但是如果輸出語(yǔ)句改為:print(frame[1])就會(huì)報(bào)錯(cuò),因?yàn)檫x擇行不允許使用單一的序號(hào),正確的寫(xiě)法是:print(frame[1:2])】2、問(wèn)題:有代碼:#coding:utf-8importpandasaspddata={'ID':['000001','000002','000003','000004','000005','000006','000007'],'name':['黎明','趙怡春','張富平','白麗','牛玉德','姚華','李南'],'gender':[True,False,True,False,True,False,True],'age':[16,20,18,18,17,18,16],'height':[1.88,1.78,1.81,1.86,1.74,1.75,1.76]}frame=pd.DataFrame(data)print(frame['age'17](frame['height'1.80]))請(qǐng)問(wèn)下面的說(shuō)法正確的有:選項(xiàng):A、語(yǔ)句有錯(cuò)誤,可以使用條件范圍限定:print(frame[frame[(frame['age']17)].isin(frame[(frame['height']1.80)])])B、語(yǔ)句有錯(cuò)誤,選擇條件使用并且應(yīng)該寫(xiě)為:print(frame['age'17'height'1.80])C、語(yǔ)句有錯(cuò)誤,列名稱需要使用方括號(hào)標(biāo)識(shí),應(yīng)該寫(xiě)為:print(frame[(['age']17)(['height']1.80)])D、語(yǔ)句有錯(cuò)誤,選擇條件使用并且應(yīng)該寫(xiě)為:print(frame[frame['age']17frame['height']1.80])E、語(yǔ)句有錯(cuò)誤,列名稱需要使用明確所在DataFrame,應(yīng)該寫(xiě)為:print(frame[(frame['age']17)(frame['height']1.80)])F、語(yǔ)句有錯(cuò)誤,可以使用條件范圍限定:print(frame[(frame['age']17)].isin(frame[(frame['height']1.80)]))正確答案:【語(yǔ)句有錯(cuò)誤,可以使用條件范圍限定:print(frame[frame[(frame['age']17)].isin(frame[(frame['height']1.80)])])#語(yǔ)句有錯(cuò)誤,列名稱需要使用明確所在DataFrame,應(yīng)該寫(xiě)為:print(frame[(frame['age']17)(frame['height']1.80)])】3、問(wèn)題:有代碼:#coding:utf-8importpandasaspddata={'ID':['000001','000002','000003','000004','000005','000006','000007'],'name':['黎明','趙怡春','張富平','白麗','牛玉德','姚華','李南'],'gender':[True,False,True,False,True,False,True],'age':[16,20,18,18,17,18,16],'height':[1.88,1.78,1.81,1.86,1.74,1.75,1.76]}frame=pd.DataFrame(data)frame=frame.drop(index=(frame.loc[(frame['age']=19)].index))print(frame)請(qǐng)問(wèn)下面的說(shuō)法正確的有:選項(xiàng):A、該功能為刪除所有年齡大于等于19歲的行記錄B、也可以更改為:frame=frame.drop(frame[frame['age']=19].index)效果一樣C、也可以更改為:frame.drop(index=(frame.loc[(frame['age']=19)].index),inplace=True)效果一樣D、也可以更改為:frame=frame.drop(frame['age']=19)效果一樣E、也可以更改為:frame=frame.drop(frame['age']=19)效果一樣F、也可以更改為:frame=frame.drop(frame.loc[(frame['age']=19)])效果一樣正確答案:【該功能為刪除所有年齡大于等于19歲的行記錄#也可以更改為:frame=frame.drop(frame[frame['age']=19].index)效果一樣#也可以更改為:frame.drop(index=(frame.loc[(frame['age']=19)].index),inplace=True)效果一樣】4、問(wèn)題:有代碼:#coding:utf-8importpandasaspddata={'ID':['000001','000002','000003','000004','000005','000006','000007'],'name':['黎明','趙怡春','張富平','白麗','牛玉德','姚華','李南'],'gender':[True,False,True,False,True,False,True],'age':[16,20,18,18,17,18,16],'height':[1.88,1.78,1.81,1.86,1.74,1.75,1.76]}frame=pd.DataFrame(data)frame.loc[frame['gender']==False,'age']=frame.loc[frame['gender']==False,'age']+1print(frame)請(qǐng)問(wèn)下面的說(shuō)法正確的有:選項(xiàng):A、該功能為將現(xiàn)有性別為False的學(xué)生年齡增加1歲B、代碼出錯(cuò),應(yīng)該改為:frame.loc[~frame['gender'],'age']=frame.loc[~frame['gender'],'age']+1C、代碼沒(méi)有錯(cuò)誤,也可以改為:frame.loc[frame['gender']=False,'age']=frame.loc[frame['gender']=False,'age']+1D、代碼沒(méi)有錯(cuò)誤,也可以改為:frame.loc[frame['gender']==False,'age']+=1E、代碼沒(méi)有錯(cuò)誤,也可以改為:importnumpyasnpframe['age']=np.where(frame['gender']==False,frame['age']+1,frame['age'])正確答案:【該功能為將現(xiàn)有性別為False的學(xué)生年齡增加1歲#代碼沒(méi)有錯(cuò)誤,也可以改為:frame.loc[frame['gender']==False,'age']+=1#代碼沒(méi)有錯(cuò)誤,也可以改為:importnumpyasnpframe['age']=np.where(frame['gender']==False,frame['age']+1,frame['age'])】5、問(wèn)題:查詢哪些學(xué)生身高一樣,給出代碼如下:#coding:utf-8importpandasaspddata={'ID':['000001','000002','000003','000004','000005','000006','000007'],'name':['黎明','趙怡春','張富平','白麗','牛玉德','姚華','李南'],'gender':[True,False,True,False,True,False,True],'age':[16,20,18,18,17,18,16],'height':[1.88,1.78,1.81,1.86,1.74,1.75,1.76]}frame=pd.DataFrame(data)results=pd.merge(frame,frame,left_on='age_x',right_on='age_y')results=results[results['name_x']results['name_y']]print(results[['name_x','name_y']])運(yùn)行出錯(cuò),請(qǐng)問(wèn)下面的說(shuō)法正確的有:選項(xiàng):A、兩個(gè)DataFrame建立連接的條件錯(cuò)了B、對(duì)于學(xué)生姓名列的獲取方式錯(cuò)了,應(yīng)該使用:results=results[results['name']results['name']]C、可以將:results=results[results['name_x']results['name_y']]寫(xiě)成:results=results[results['name_x']results['name_y']]D、對(duì)于學(xué)生姓名列的獲取方式錯(cuò)了,應(yīng)該使用:print(results[['name','name']])E、對(duì)于學(xué)生姓名列的獲取方式錯(cuò)了,應(yīng)該使用:print(results['name_x','name_y'])F、merge應(yīng)該寫(xiě)成join正確答案:【兩個(gè)DataFrame建立連接的條件錯(cuò)了#可以將:results=results[results['name_x']results['name_y']]寫(xiě)成:results=results[results['name_x']results['name_y']]】6、問(wèn)題:統(tǒng)計(jì)男女各有多少種不同的身高,給出代碼如下:#coding:utf-8importpandasaspddata={'ID':['000001','000002','000003','000004','000005','000006','000007'],'name':['黎明','趙怡春','張富平','白麗','牛玉德','姚華','李南'],'gender':[True,False,True,False,True,False,True],'age':[16,20,18,18,17,18,16],'height':[1.88,1.78,1.81,1.86,1.74,1.75,1.76]}frame=pd.DataFrame(data)records1=frame.groupby(['gender','age']).count()print(records1.groupby(['gender'])[['age']].count().sort_values(by=['age'],ascending=False))請(qǐng)問(wèn)下面的說(shuō)法正確的有:選項(xiàng):A、代碼正確,輸出為:agegenderTrue3False2B、代碼不正確,需要在最后輸出結(jié)果前增加:records1.reset_index(inplace=True)C、代碼不正確,需要在最后輸出結(jié)果前增加:records1=records1.reset_index()D、代碼不正確,最后輸出可以改為:print(records1.groupby([records1.index.levels[0]])[[records1.index.levels[1]]].count().sort_values(by=[records1.index.levels[1]],ascending=False))E、代碼不正確,最后輸出可以改為:print(records1.groupby(['gender','age']).count().sort_values(by=['age'],ascending=False))正確答案:【代碼不正確,需要在最后輸出結(jié)果前增加:records1.reset_index(inplace=True)#代碼不正確,需要在最后輸出結(jié)果前增加:records1=records1.reset_index()】7、問(wèn)題:繪制不同身高的分布餅圖,身高以小數(shù)點(diǎn)后一位來(lái)統(tǒng)計(jì),給出代碼如下:#coding:utf-8importpandasaspdimportmatplotlib.pyplotaspltdata={'ID':['000001','000002','000003','000004','000005','000006','000007'],'name':['黎明','趙怡春','張富平','白麗','牛玉德','姚華','李南'],'gender':[True,False,True,False,True,False,True],'age':[16,20,18,18,17,18,16],'height':[1.88,1.78,1.81,1.86,1.74,1.75,1.76]}frame=pd.DataFrame(data)records1=frame.groupby('height').count()plt.pie(records1['ID'])plt.show()請(qǐng)問(wèn)下面的說(shuō)法正確的有:選項(xiàng):A、無(wú)法顯示任何圖形B、顯示的餅圖為7等分C、為了正確顯示身高分組,需要增加修改:frame['heightRange']=round(frame['height'],1)records1=frame.groupby('heightRange').count()D、為了正確顯示身高分組,需要增加修改:frame['heightRange']=round(frame['height'],-1)records1=frame.groupby('heightRange').count()E、為了正確顯示身高字符提示,需要增加修改:plt.pie(records1['ID'],labels=records1.index)F、為了正確顯示身高比例,需要增加修改:plt.pie(frame.groupby('height').count())正確答案:【顯示的餅圖為7等分#為了正確顯示身高分組,需要增加修改:frame['heightRange']=round(frame['height'],1)records1=frame.groupby('heightRange').count()#為了正確顯示身高字符提示,需要增加修改:plt.pie(records1['ID'],labels=records1.index)】8、問(wèn)題:繪制不同出生年學(xué)生人數(shù)的柱狀圖,給出代碼如下:#coding:utf-8importpandasaspdimportmatplotlib.pyplotaspltfromdatetimeimportdatetimedata={'ID':['000001','000002','000003','000004','000005','000006','000007'],'name':['黎明','趙怡春','張富平','白麗','牛玉德','姚華','李南'],'gender':[True,False,True,False,True,False,True],'birthday':[datetime(2004,10,1),datetime(2000,11,27),datetime(2002,1,29),datetime(2002,8,27),datetime(2003,3,14),datetime(2002,12,17),datetime(2004,4,12)],'height':[1.88,1.78,1.81,1.86,1.74,1.75,1.76]}frame=pd.DataFrame(data)frame.set_index('birthday',inplace=True)results1=frame.groupby(frame.index.year).count()plt.bar(results1.index,results1['ID'])plt.show()請(qǐng)問(wèn)下面的說(shuō)法正確的有:選項(xiàng):A、修改創(chuàng)建results1的語(yǔ)句為:frame=pd.DataFrame(data)results1=frame.groupby(frame['birthday'].dt.year).count()plt.bar(results1.index,results1['ID'])plt.show()功能不變B、修改創(chuàng)建results1的語(yǔ)句為:frame=pd.DataFrame(data)results1=frame.groupby(frame['birthday'].dt.year).count()results1.reset_index(inplace=True)plt.bar(results1['birthday'].dt.year,results1['ID'])plt.show()運(yùn)行有問(wèn)題,原因在于繪制柱狀圖獲取生日列時(shí)無(wú)法區(qū)分是索引生日還是列生日C、修改創(chuàng)建results1的語(yǔ)句為:frame=pd.DataFrame(data)results1=frame.groupby(frame['birthday'].dt.year).count()results1.reset_index(inplace=True)plt.bar(results1['birthday'].dt.year,results1['ID'])plt.show()運(yùn)行有問(wèn)題,原因在于還原results1索引時(shí)產(chǎn)生了兩個(gè)生日列(重名)D、修改創(chuàng)建results1的語(yǔ)句為:frame=pd.DataFrame(data)frame=frame.set_index('birthday')results1=frame.groupby(frame['birthday'].dt.year).count()results1.reset_index(inplace=True)plt.bar(results1['birthday'].dt.year,results1['ID'])plt.show()運(yùn)行有問(wèn)題,原因在于獲取frame生日列時(shí)無(wú)法訪問(wèn)生日列E、修改創(chuàng)建results1的語(yǔ)句為:frame=pd.DataFrame(data)frame=frame.set_index('birthday')results1=frame.groupby(frame.index.year).count()results1.reset_index(inplace=True)plt.bar(results1['birthday'].year,results1['ID'])plt.show()運(yùn)行有問(wèn)題,原因在于繪制柱狀圖時(shí)無(wú)法獲取生日列的年份正確答案:【修改創(chuàng)建results1的語(yǔ)句為:frame=pd.DataFrame(data)results1=frame.groupby(frame['birthday'].dt.year).count()plt.bar(results1.index,results1['ID'])plt.show()功能不變#修改創(chuàng)建results1的語(yǔ)句為:frame=pd.DataFrame(data)results1=frame.groupby(frame['birthday'].dt.year).count()results1.reset_index(inplace=True)plt.bar(results1['birthday'].dt.year,results1['ID'])plt.show()運(yùn)行有問(wèn)題,原因在于還原results1索引時(shí)產(chǎn)生了兩個(gè)生日列(重名)#修改創(chuàng)建results1的語(yǔ)句為:frame=pd.DataFrame(data)frame=frame.set_index('birthday')results1=frame.groupby(frame['birthday'].dt.year).count()results1.reset_ind

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論