Python數(shù)據(jù)科學方法與實踐(山東聯(lián)盟)智慧樹知到課后章節(jié)答案2023年下山東師范大學_第1頁
Python數(shù)據(jù)科學方法與實踐(山東聯(lián)盟)智慧樹知到課后章節(jié)答案2023年下山東師范大學_第2頁
Python數(shù)據(jù)科學方法與實踐(山東聯(lián)盟)智慧樹知到課后章節(jié)答案2023年下山東師范大學_第3頁
Python數(shù)據(jù)科學方法與實踐(山東聯(lián)盟)智慧樹知到課后章節(jié)答案2023年下山東師范大學_第4頁
Python數(shù)據(jù)科學方法與實踐(山東聯(lián)盟)智慧樹知到課后章節(jié)答案2023年下山東師范大學_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

Python數(shù)據(jù)科學方法與實踐(山東聯(lián)盟)智慧樹知到課后章節(jié)答案2023年下山東師范大學山東師范大學

第一章測試

目前,數(shù)據(jù)密集型科學研究的范式也稱為科學研究的()。

A:第三范式B:第四范式C:第二范式D:第一范式

答案:第四范式

在DrewConway提出的數(shù)據(jù)科學韋恩圖中,危險區(qū)是指()。

A:忽視計算機編程的能力B:重視機器學習算法的掌握C:忽視專業(yè)領域知識的掌握D:缺乏數(shù)學解釋的能力

答案:缺乏數(shù)學解釋的能力

以下不屬于數(shù)據(jù)離散程度統(tǒng)計指標的是()。

A:方差B:標準差C:極差D:數(shù)學期望

答案:數(shù)學期望

隨著大數(shù)據(jù)、人工智能的發(fā)展,數(shù)據(jù)科學與()建立了本質(zhì)性的聯(lián)系。

A:深度學習B:機器學習C:數(shù)據(jù)挖掘D:統(tǒng)計學

答案:數(shù)據(jù)挖掘

IBM提出的大數(shù)據(jù)“5V”理論,增加了()特征。

A:Veracity(真實性)B:Value(價值密度低)C:Velocity(速度快)D:Variety(多樣性)

答案:Veracity(真實性)

隨著大數(shù)據(jù)的廣泛應用和技術的不斷創(chuàng)新,人們的思維模式也發(fā)生了很大的變化,以下不屬于大數(shù)據(jù)思維的是()。

A:總體性思維B:相關性思維C:容錯性思維D:因果性思維

答案:因果性思維

當今大數(shù)據(jù)區(qū)別于傳統(tǒng)的小數(shù)據(jù),其主要差異不包括()。

A:數(shù)據(jù)來源B:數(shù)據(jù)特點C:應用需求D:技術框架

答案:數(shù)據(jù)來源

目前,對大數(shù)據(jù)分析技術面臨的主要挑戰(zhàn),描述錯誤的是()。

A:數(shù)據(jù)生存環(huán)境是動態(tài)變化的,具有很強的不確定性B:數(shù)據(jù)往往伴有噪聲,對數(shù)據(jù)的管理和評價容易出現(xiàn)偏差C:數(shù)據(jù)處理分析算法需要在實時性和準確率之間做出平衡D:數(shù)據(jù)分布廣泛,只有在集成后才能更好地處理和分析

答案:數(shù)據(jù)分布廣泛,只有在集成后才能更好地處理和分析

大數(shù)據(jù)技術生態(tài)中,使用流處理模式,適用于大型互聯(lián)網(wǎng)服務日志采集的系統(tǒng)是()。

A:SparkSQLB:RabbitMQC:RocketMQD:Kafka

答案:Kafka

以下不屬于大數(shù)據(jù)分析和挖掘技術平臺的是()。

A:ApacheDrillB:TensorFlowC:ImpalaD:ZooKeeper

答案:ZooKeeper

有大數(shù)據(jù)就有小數(shù)據(jù),二者在理論和技術上既有聯(lián)系、又有區(qū)別。()

A:錯B:對

答案:對

HadoopYARN是一個通用的資源管理系統(tǒng),它可以將資源管理和作業(yè)調(diào)度、監(jiān)控分離,為上層應用提供統(tǒng)一的資源管理和調(diào)度。()

A:對B:錯

答案:對

對數(shù)據(jù)進行可視化處理,可以更形象直觀地觀察數(shù)據(jù)之間的規(guī)律,以便更好地發(fā)現(xiàn)數(shù)據(jù)中潛在的價值和模式。()

A:對B:錯

答案:對

目前,大數(shù)據(jù)的規(guī)模和復雜性不斷提升,越來越需要人工智能理論和技術的支持。()

A:對B:錯

答案:對

ZooKeeper作為一個典型的分布式數(shù)據(jù)一致性解決方案,提供了配置維護、域名服務、分布式同步、組服務等功能。()

A:對B:錯

答案:對

目前,高性能計算和機器學習已經(jīng)成為大數(shù)據(jù)智能分析的核心技術。()

A:錯B:對

答案:對

Tableau屬于可編程的數(shù)據(jù)可視化分析工具。()

A:錯B:對

答案:錯

Python環(huán)境下,可以在第三方庫的支持下進行大數(shù)據(jù)的處理和分析。()

A:錯B:對

答案:對

大數(shù)據(jù)時代,數(shù)據(jù)量和數(shù)據(jù)的價值都呈指數(shù)級增長。()

A:對B:錯

答案:錯

近年來,對數(shù)據(jù)規(guī)模的度量,已經(jīng)開始使用EB和ZB作為單位。()

A:對B:錯

答案:錯

第二章測試

使用pip命令可以下載安裝Python的()。

A:自定義庫B:標準庫C:內(nèi)置庫D:外部擴展庫

答案:外部擴展庫

使用Python的import命令不可以導入()。

A:__bulitins__B:pandasC:numpyD:math

答案:__bulitins__

關于Python語言,以下說法不正確的是()。

A:一條語句可以使用續(xù)行符“”在多行上書寫B(tài):一行只能有一條語句C:一種解釋性高級語言D:嚴格使用縮進來表示程序代碼的邏輯關系

答案:一行只能有一條語句

執(zhí)行語句sum(list(range(1,10,2)))之后,顯示的運算結果是()。

A:25B:45C:[1,3,5,7,9]D:20

答案:25

在Python環(huán)境中執(zhí)行語句i=3;i+=3后,變量i的值是()。

A:6B:不確定C:3D:0

答案:6

已知x=[1,1],y=[2,2],則x+y的結果是()。

A:[2,2]B:[3,3]C:[1,1]D:[1,1,2,2]

答案:[1,1,2,2]

執(zhí)行語句age=[18,20,19,17];age.pop()之后,顯示的結果為()。

A:18B:19C:20D:17

答案:17

執(zhí)行語句x=[1,2,3]*3之后,語句x.index(2)的運算結果是()。

A:2B:0C:3D:1

答案:1

表達式sum([x*xforxinrange(5)])的計算結果是()。

A:15B:30C:5D:20

答案:30

表達式tuple(enumerate(range(3)))的計算結果是()。

A:((1,1),(2,2),(3,3))B:(0,1,2)C:((0,0),(1,1),(2,2))D:(1,2,3)

答案:((0,0),(1,1),(2,2))

執(zhí)行語句系列g=(i**2foriinrange(1,4));list(g);next(g),最后的顯示結果為()。

A:報錯B:(1,4,9)C:[1,4,9]D:[1,2,3]

答案:報錯

執(zhí)行語句系列x,y,z={1:"a",2:"b",3:"c"};x,y=y,z之后,則變量y的值為()。

A:3B:2C:"c"D:1

答案:3

關于Python中字典的使用,以下說法不正確的是()。

A:字典中的每個元素以“鍵:值”形式表示B:字典中的“鍵”允許重復C:可使用字典對象的values屬性訪問字典的所有值D:字典的標識符為{}

答案:字典中的“鍵”允許重復

Python是一種強類型動態(tài)語言,變量的類型可以隨時變化。()

A:錯B:對

答案:對

Python中的range對象是可迭代對象,常用在for循環(huán)中控制循環(huán)的次數(shù)。()

A:對B:錯

答案:對

執(zhí)行語句x=y=3后,變量x、y指向同一個內(nèi)存地址。()

A:對B:錯

答案:對

Python對標識符嚴格區(qū)分大小寫。()

A:錯B:對

答案:對

在Python中定義函數(shù)時,必須要聲明函數(shù)返回值的類型。()

A:對B:錯

答案:錯

Python中函數(shù)的形式參數(shù)與實際參數(shù)的個數(shù)必須一致。()

A:錯B:對

答案:錯

Python表達式Trueor1/0的運算結果為True。()

A:對B:錯

答案:對

Python中的生成器對象具有惰性求值的特點,每次可以訪問其中的任意一個元素。()

A:對B:錯

答案:錯

Python中沒有字符類型,只有字符串類型。()

A:錯B:對

答案:對

Python的一個常量、變量、數(shù)據(jù)類型或函數(shù)等都可以看作是一個對象。()

A:對B:錯

答案:對

以下屬于Python內(nèi)置序列對象的有()。

A:字典(dict)B:集合(set)C:元組(tuple)D:列表(list)

答案:字典(dict);集合(set);元組(tuple);列表(list)

序列結構是Python的一種重要數(shù)據(jù)結構,以下屬于可變序列的有()。

A:集合(set)B:列表(list)C:元組(tuple)D:字典(dict)

答案:集合(set);列表(list);字典(dict)

Python程序常用的基本控制結構有()。

A:迭代結構B:順序結構C:循環(huán)結構D:分支結構

答案:順序結構;循環(huán)結構;分支結構

在Python中定義函數(shù)時,允許使用的函數(shù)參數(shù)形式有()。

A:關鍵字參數(shù)B:可變長度參數(shù)C:位置參數(shù)D:默認值參數(shù)

答案:關鍵字參數(shù);可變長度參數(shù);位置參數(shù);默認值參數(shù)

關于Python類的實例屬性,以下說法正確的是()。

A:同一個類生成的多個對象,其實例屬性互不影響B(tài):類的實例屬性只能在類的構造方法中定義C:類的每個實例對象都擁有該類實例屬性的副本D:在定義類時,以“self.屬性名稱”格式訪問其實例屬性

答案:同一個類生成的多個對象,其實例屬性互不影響;類的每個實例對象都擁有該類實例屬性的副本;在定義類時,以“self.屬性名稱”格式訪問其實例屬性

在Python中定義類的成員方法時,可以采用的不同形式有()。

A:類方法B:抽象方法C:靜態(tài)方法D:實例方法

答案:類方法;靜態(tài)方法;實例方法

以下能夠使用切片方式訪問其中部分成員的對象有()。

A:元組B:字符串C:列表D:字典

答案:元組;字符串;列表

在使用Python的內(nèi)置函數(shù)open打開文件時,能夠指定的文本解碼方式有()。

A:BIG-5B:GBKC:UTF-8D:CP936

答案:GBK;UTF-8;CP936

當Python函數(shù)的實際參數(shù)個數(shù)不確定時,可以使用*或**定義可變長度參數(shù),則可以傳遞的實際參數(shù)類型有()。

A:默認值參數(shù)B:無限制C:位置參數(shù)D:關鍵字參數(shù)

答案:位置參數(shù);關鍵字參數(shù)

第三章測試

設numpy數(shù)組arr=np.arange(10),要將該數(shù)組中偶數(shù)選擇處理,以下正確的是()。

A:np.where(arr%2==0)B:arr[arr%2==True]C:arr[arr%2==0]D:arr[::2]

答案:arr[arr%2==True]

使用numpy的split函數(shù)分割數(shù)組arr,如果該函數(shù)的第二個參數(shù)為[3,5],則表示要劃分arr為()個子數(shù)組。

A:2B:1C:3D:4

答案:3

設數(shù)組a、b均為1行3列的一維數(shù)組,使用numpy.stack函數(shù)連接數(shù)組a和b時,若參數(shù)axis=-1,則()。

A:按默認的軸方向進行連接B:不允許,將提示錯誤C:連接軸為列,等價于axis=1D:連接軸為行,等價于axis=0

答案:連接軸為列,等價于axis=1

設數(shù)組a、b均為1行6列的一維數(shù)組,若執(zhí)行賦值語句a=b;b.shape=2,3,則以下說法正確的是()。

A:數(shù)組a和b均變?yōu)?行3列B:數(shù)組a和b的形狀均保持不變C:數(shù)組b的形狀改變,而數(shù)組a形狀不變D:數(shù)組a和b具有不同的存儲單元地址

答案:數(shù)組a和b均變?yōu)?行3列

ndarray對象是numpy庫的核心數(shù)據(jù)結構,關于該對象的說法,以下不正確的是()。

A:是一個N維數(shù)組B:元素的下標默認從0開始C:元素的數(shù)據(jù)類型相同D:每個元素的存儲空間大小不同

答案:每個元素的存儲空間大小不同

使用numpy庫的array函數(shù)分別創(chuàng)建數(shù)組a和b,其中,則a+b的運算結果是()。

A:B:C:D:不能運算,報錯

答案:

Numpy庫提供了線性代數(shù)子模塊linalg,其中專門用于計算Hermitian矩陣或對稱矩陣特征值和特征向量的函數(shù)是()。

A:eighB:eigC:eigvalshD:eigvals

答案:eigh

在numpy環(huán)境中,如果要將一個二維數(shù)組a2d的相應行中減去一維數(shù)組b1d的每一項,以下方法正確的是()。

A:a2d-b1d[:,:]

B:a2d-b1d[:,None]C:a2d-b1d[:,NaN]D:a2d-b1d

答案:a2d-b1d[:,None]

設數(shù)組x=numpy.arange(1,9,2),則表達式x[numpy.where(x<5,x,-1)]的運算結果為()。

A:array([3,0,0,0])B:array([1,3,-1,-1])C:array([3,7,7,7])D:array([3,1,1,1])

答案:array([3,7,7,7])

設數(shù)組x=numpy.linspace(-2,2,3),則表達式numpy.piecewise(x,[x<0,x>=0],[lambdax:-x,lambdax:x])的運算結果為()。

A:array([1.,0.,1.])B:array([2.,0.,2.])C:array([-2.,0.,-2.])D:array([-1.,0.,-1.])

答案:array([2.,0.,2.])

設有numpy數(shù)組arr=np.arange(9).reshape(3,3),則arr[:,::-1]的作用是()。

A:行列互換B:列倒序C:數(shù)組保持不變D:行倒序

答案:列倒序

設有numpy數(shù)組arr=np.arange(9).reshape(3,3),則要交換該數(shù)組的第1、第2行,以下表達式正確的是()。

A:arr[[0,2,1],:]B:arr[:,[0,2,1]]C:arr[:,[1,0,2]]D:arr[[1,0,2],:]

答案:arr[[1,0,2],:]

形狀兼容時,numpy可以進行廣播操作,以下運算中沒有廣播操作的是()。

A:a=np.ones((2,3));b=np.arange(3);a+bB:a=np.arange(3).reshape(3,1);b=np.arange(3);a+bC:a=np.random.randn(2,3);a*3D:a=np.ones((3,2));b=np.arange(3);a*b

答案:a=np.ones((3,2));b=np.arange(3);a*b

設numpy數(shù)組arr=np.arange(10),要將該數(shù)組中的偶數(shù)選擇出來,以下表達式不正確的是()。

A:np.where(arr%2==0)B:arr[arr%2==0]C:np.where(np.mod(arr,2))D:arr[::2]

答案:np.where(np.mod(arr,2))

numpy提供了random隨機模塊,使用該模塊可產(chǎn)生標準正態(tài)分布隨機數(shù)的是()。

A:randnB:radomC:normalD:rand

答案:randn

使用Numpy的reshape方法,可以同時改變數(shù)組的維數(shù)和大小。()

A:對B:錯

答案:錯

使用Numpy的resize方法,可以同時改變數(shù)組的維數(shù)和大小。()

A:錯B:對

答案:對

如果兩個數(shù)組的維度相同,但大小不同,則這兩個數(shù)組不能進行算術運算。()

A:對B:錯

答案:錯

設數(shù)組a=np.arange(9).reshape(3,3),則表達式a[:,[1,0,2]]的作用是交換數(shù)組a的兩列。()

A:對B:錯

答案:對

如果兩個由數(shù)值數(shù)據(jù)組成的數(shù)組進行點積運算的結果為0,則表示這兩個數(shù)組對應的向量垂直。()

A:對B:錯

答案:對

一個兩行三列的數(shù)組可以看作為兩個三維的向量。()

A:錯B:對

答案:對

在計算數(shù)據(jù)集的中心傾向時,均值對數(shù)據(jù)中的異常值不敏感。()

A:對B:錯

答案:錯

百分位數(shù)常用于描述一組有序數(shù)據(jù)中的各數(shù)據(jù)項如何在最小值和最大值之間分布。()

A:錯B:對

答案:對

數(shù)據(jù)離散度的計算很容易受到其中一小部分異常值的影響。()

A:對B:錯

答案:錯

當計算數(shù)據(jù)的標準差結果為0時,表示數(shù)據(jù)聚集在一起。()

A:錯B:對

答案:對

numpy庫中使用的ndarray數(shù)組要求數(shù)據(jù)類型必須一致。()

A:錯B:對

答案:錯

設數(shù)組a=np.arange(6).reshape(3,2),則表達式a[::-1]的作用是翻轉數(shù)組a的兩列。()

A:對B:錯

答案:對

計算數(shù)據(jù)之間的相關性,可以使用numpy庫的corrcoef函數(shù)。()

A:錯B:對

答案:對

使用numpy庫random子模塊的randint函數(shù)每次只能生成一個隨機整數(shù)。()

A:錯B:對

答案:錯

使用numpy庫的amax函數(shù)可以對多維數(shù)組的每一行求最大值。()

A:錯B:對

答案:對

在計算機上使用數(shù)值近似解方法解決實際問題時,不可避免地會引入誤差,其主要來源類型有()。

A:舍入誤差B:模型誤差C:截斷誤差D:觀測誤差

答案:舍入誤差;模型誤差;截斷誤差;觀測誤差

對Numpy庫的描述,以下正確的是()。

A:是基于Python環(huán)境的科學計算基礎包B:是Python的外部擴展庫C:只支持數(shù)值類型的運算D:其核心功能的實現(xiàn)受ndarray對象的支持

答案:是基于Python環(huán)境的科學計算基礎包;是Python的外部擴展庫;其核心功能的實現(xiàn)受ndarray對象的支持

對Numpy庫中ndarray對象的描述,以下說法正確的是()。

A:對象中每個元素的存儲空間大小相同B:是一個多維數(shù)組C:元素可使用下標索引方式訪問D:對象中元素的數(shù)據(jù)類型必須相同

答案:對象中每個元素的存儲空間大小相同;是一個多維數(shù)組;元素可使用下標索引方式訪問

使用Numpy庫可以創(chuàng)建單位矩陣形式數(shù)組的函數(shù)有()。

A:onesB:eyeC:zerosD:identity

答案:eye;identity

可以創(chuàng)建三角矩陣的Numpy庫函數(shù)有()。

A:triuB:diagC:trilD:tri

答案:triu;tril;tri

在numpy環(huán)境中執(zhí)行語句序列a=np.array([1,2,3]);b=np.unique(np.append(a,2))后,以下說法正確的是()。

A:數(shù)組b的內(nèi)容為array([1,2,3])B:數(shù)組a的內(nèi)容沒有改變C:數(shù)組a和b是同一個數(shù)組D:數(shù)組a和b的內(nèi)容相同

答案:數(shù)組b的內(nèi)容為array([1,2,3]);數(shù)組a的內(nèi)容沒有改變;數(shù)組a和b的內(nèi)容相同

將二維數(shù)組轉換為一維數(shù)組,可以使用的方法有()。

A:ndarray.resizeB:numpy.flattenC:ndarray.reshapeD:numpy.ravel

答案:ndarray.resize;ndarray.reshape;numpy.ravel

使用numpy創(chuàng)建數(shù)組a=np.random.randint(1,10,[3,3]),則執(zhí)行語句b=a[:,::-1]后,以下說法正確的是()。

A:數(shù)組a和b的形狀相同B:數(shù)組a中的元素按行倒置后得到數(shù)組bC:數(shù)組a的內(nèi)容保持不變D:數(shù)組a中的元素按列倒置后得到數(shù)組b

答案:數(shù)組a和b的形狀相同;數(shù)組a的內(nèi)容保持不變;數(shù)組a中的元素按列倒置后得到數(shù)組b

Numpy庫提供了線性代數(shù)子模塊linalg,支持的運算包括()。

A:矩陣的分解和規(guī)范化B:求解線性方程組C:矩陣和矢量的基本運算D:求解矩陣的特征值

答案:矩陣的分解和規(guī)范化;求解線性方程組;矩陣和矢量的基本運算;求解矩陣的特征值

常用的矩陣分解方法包括()。

A:三角分解(LU)B:奇異值分解(SVD)C:正交分解D:QR分解

答案:三角分解(LU);奇異值分解(SVD);QR分解

使用索引訪問數(shù)組中的元素時,索引的形式可以是()。

A:切片索引B:字段名稱索引C:整數(shù)數(shù)組索引D:布爾數(shù)組索引

答案:切片索引;字段名稱索引;整數(shù)數(shù)組索引;布爾數(shù)組索引

設arr是一個3行3列的numpy數(shù)值型數(shù)組,則以下操作返回原始對象視圖的有()。

A:arr.view()B:arr+2C:arr[:]D:arr.flatten()

答案:arr.view();arr[:]

以下屬于numpy庫子模塊的有()。

A:maB:matlibC:randomD:linalg

答案:ma;matlib;random;linalg

numpy庫中的linalg子模塊可以用來()。

A:求兩個向量的歐式距離B:計算兩個矩陣的乘法C:求解線性方程組D:計算矩陣的行列式

答案:求兩個向量的歐式距離;計算兩個矩陣的乘法;求解線性方程組;計算矩陣的行列式

使用numbers=np.random.uniform(0,20,20)語句創(chuàng)建一個numpy數(shù)組,要提取該數(shù)組中的整數(shù)部分,以下方法正確的是()。

A:np.floor(numbers)B:numbers.astype(int)C:numbers-numbers%1D:np.trunc(numbers)

答案:np.floor(numbers);numbers.astype(int);numbers-numbers%1;np.trunc(numbers)

第四章測試

對pandas庫的描述,以下說法錯誤的是()。

A:是一種高效且功能強大的數(shù)據(jù)分析包B:非常適合于關系型和標記型數(shù)據(jù)的處理和分析C:是Python的外部擴展庫,需要預先下載和安裝D:只支持一維和二維的數(shù)據(jù)處理分析

答案:只支持一維和二維的數(shù)據(jù)處理分析

關于DataFrame對象的描述,以下不正確的是()。

A:元素值可變B:等價于二維的ndarray對象C:對象大小可變D:存儲異構數(shù)據(jù)

答案:等價于二維的ndarray對象

關于Series對象的描述,以下不正確的是()。

A:是一個帶標簽的一維數(shù)組B:對象中的元素值是可變的C:對象的大小是可變的D:對象中的數(shù)據(jù)是均勻的

答案:對象的大小是可變的

DataFrame對象使用一種行列交叉的表格結構,則以下描述不正確的是()。

A:缺省情況下,默認的行、列標識都從0開始B:行和列允許增加或刪除C:每一列允許使用不同的數(shù)據(jù)類型D:每一行和列都具有相應的標簽作為標識

答案:每一列允許使用不同的數(shù)據(jù)類型

假設執(zhí)行s=pd.Series(np.random.randn(5))語句,已經(jīng)創(chuàng)建了一個Series對象,則以下允許的操作有()。

A:執(zhí)行s[0]=True,同時修改元素的值和數(shù)據(jù)類型B:執(zhí)行s[:]=s[:]+1,修改所有元素的值C:執(zhí)行s.size=6,改變對象的大小D:執(zhí)行s.index=list("abcde"),改變對象的索引標識

答案:執(zhí)行s.size=6,改變對象的大小

創(chuàng)建Series對象時,不可以作為其輸入數(shù)據(jù)的是()。

A:Python的集合對象B:numpy的ndarray對象C:Python的字典對象D:標量值,如數(shù)字3

答案:Python的集合對象

若DataFrame對象是一個由10行4列組成的數(shù)值型數(shù)據(jù)集,則要使用DataFrame對象的sum函數(shù)統(tǒng)計每一行的總和,應設置參數(shù)()。

A:axis=0B:axis=FalseC:axis=1D:axis=True

答案:axis=1

設df是一個由100行5列組成的DataFrame對象,其中第5列標識為“Species”,數(shù)據(jù)類型是字符串型,要統(tǒng)計該列中每個字符串的長度,以下表達式正確的是()。

A:len(df["species"])B:df["species"].map(lambdas:len(s))C:df["species"].count()D:map(lambdas:len(s),df["species"])

答案:df["species"].map(lambdas:len(s))

假設一個DataFrame對象df的第1列標識為“Species”,由不同物種名稱的字符串組成,要統(tǒng)計該列中不同類別物種的個數(shù),以下表達式正確的是()。

A:count(df["species"].unique())B:len(df["species"].unique())C:df["species"].count().unique()D:df.value_counts("species").unique()

答案:len(df["species"].unique())

假設df為已經(jīng)創(chuàng)建的DataFrame對象,且其列標識分別為“A”、“B”、“C”、“D”,則語句df.sort_values(by=["B","D"])的作用是()。

A:分別按B列、D列降序排序B:先按B列升序排序,B列相同時再按D列升序排序C:分別按B列、D列升序排序D:先按B列降序排序,B列相同時再按D列降序排序

答案:先按B列升序排序,B列相同時再按D列升序排序

在進行數(shù)據(jù)預處理時,可以被pandas理解為缺失值的有()。

A:pandas模塊提供的NaNB:其余選項都是C:Python內(nèi)置的NoneD:numpy模塊提供的nan

答案:其余選項都是

若DataFrame對象df中存在重復數(shù)據(jù),執(zhí)行該對象的drop_duplicates方法,則以下說法不正確的是()。

A:刪除重復數(shù)據(jù)后,行索引保持不變B:可以將df中所有的重復數(shù)據(jù)真正刪除C:只能刪除df中行完全重復的所有數(shù)據(jù)D:可以刪除df中指定列完全重復的所有數(shù)據(jù)

答案:只能刪除df中行完全重復的所有數(shù)據(jù)

若DataFrame對象df存儲的數(shù)據(jù)集中存在不同程度的缺失值NaN,則執(zhí)行該對象的dropna方法刪除這些缺失值時,以下說法正確的是()。

A:對象df中的原數(shù)據(jù)會始終保持不變B:若參數(shù)axis=0,只要某行中存在缺失值,該行數(shù)據(jù)將被全部刪除C:若參數(shù)axis=0且每行都存在缺失值,df將成為一個空的DataFrame對象D:若參數(shù)axis=1且每列都存在缺失值,df將成為一個空的DataFrame對象

答案:對象df中的原數(shù)據(jù)會始終保持不變

使用3σ原則檢測數(shù)據(jù)集中的異常值時,其中的σ是指()。

A:標準差B:方差C:極差D:均值

答案:標準差

以下屬于二進制文件格式的有()。

A:JSONB:TXTC:MSEXCELD:XML

答案:MSEXCEL

在pandas庫與時間相關的類中,帶有時區(qū)信息,表示某個具體時間點的類是()。

A:TimestampB:PeriodC:TimedeltaD:Datetime

答案:Timestamp

在時間序列的處理和分析中,目前不考慮時區(qū)因素而作為國際通用時間標準的是()。

A:ESTB:DSTC:GMTD:UTC

答案:UTC

在Python環(huán)境中,匯編世界時區(qū)信息,且封裝在pandas庫中,為時區(qū)信息的使用帶來極大便利的第三方庫是()。

A:DateutilB:pytzC:PyTimeD:datetime

答案:pytz

數(shù)據(jù)分類是有效提高大數(shù)據(jù)集分析時空效率的必要手段,則以下關于數(shù)據(jù)分類的說法不正確的是()。

A:數(shù)據(jù)分類的時間代價較大時,分類是不必要的B:對分類數(shù)據(jù)的操作速度會更快C:分類數(shù)據(jù)通常占用更少的內(nèi)存D:分類數(shù)據(jù)通常用整數(shù)編碼

答案:數(shù)據(jù)分類的時間代價較大時,分類是不必要的

使用DataFrame對象的sort_values方法對其中存儲的數(shù)據(jù)進行排序時,以下允許的操作是()

A:設置要排序的順序B:設置要排序的索引標識C:設置要排序的軸向D:設置要排序的列名

答案:設置要排序的索引標識

使用DataFrame對象的concat()方法,可以將兩個數(shù)據(jù)集合并成一個數(shù)據(jù)集。()

A:錯B:對

答案:錯

使用DataFrame對象的groupby()方法對數(shù)據(jù)進行分組得到的GroupBy對象包含所有分組計算的結果。()

A:對B:錯

答案:錯

使用Pandas的read_json()函數(shù),在讀取JSON格式文件的同時,可以解析文件中的數(shù)據(jù)內(nèi)容。()

A:錯B:對

答案:對

FuzzyWuzzy是Python環(huán)境下對字符串模糊匹配的第三方庫,它默認使用Python的標準庫difflib進行字符串匹配。()

A:對B:錯

答案:對

對數(shù)據(jù)進行標準差標準化后,數(shù)據(jù)的值限定在[0,1]之間。()

A:對B:錯

答案:錯

使用層次化索引可以在低維上訪問到DataFrame對象的高維元素。()

A:對B:錯

答案:對

numpy庫提供的Series對象即使只有一個軸,也能使用分層索引。()

A:對B:錯

答案:對

使用DataFrame對象的unstack()方法,可以將其中的行轉換為列,得到一個具有多層索引的Series對象。()

A:對B:錯

答案:錯

若兩個數(shù)據(jù)子集的列數(shù)分別為n1、n2,則使用Pandas的merge方法按主鍵合并這兩個數(shù)據(jù)子集時,合并后的結果數(shù)據(jù)集中的列數(shù)為n1+n2。()

A:對B:錯

答案:錯

可以將numpy的ndarray數(shù)組對象轉換為pandas的Series對象。()

A:錯B:對

答案:對

使用DataFrame對象的head方法,僅能查看數(shù)據(jù)集中前5行的數(shù)據(jù)。()

A:錯B:對

答案:錯

可以通過對DataFrame對象的shape屬性重新賦值的方式改變其形狀。()

A:對B:錯

答案:錯

使用DataFrame對象的reindex方法重構索引時,若該對象中原來沒有索引標識“h”,則索引“h”對應的行將填充為NaN。()

A:對B:錯

答案:對

使用DataFrame對象的iloc方法選取行數(shù)據(jù)時,只能使用整數(shù)形式的索引標識。()

A:對B:錯

答案:對

Python的外部擴展庫pandas不具有圖表繪制的功能。()

A:錯B:對

答案:錯

在使用DataFrame對象的groupby方法進行分組計算時,若分組鍵是列標識的列表,則分組的結果會以層次化索引表示和存儲。()

A:對B:錯

答案:對

JSON格式的數(shù)據(jù)是以鍵-值對形式存儲的序列化文本類型數(shù)據(jù),可以使用pandas庫的read_json和to_json方法讀寫。()

A:錯B:對

答案:對

如果數(shù)據(jù)集中表示日期時間的數(shù)據(jù)是一個很大的整數(shù),一般是指在內(nèi)部從新紀元Epoch開始的秒數(shù)。()

A:錯B:對

答案:對

在表示時間序列的頻率中,WOM-3FRI表示每月第3個星期五。()

A:對B:錯

答案:對

以協(xié)調(diào)世界時UTC形式表示的時間戳值是帶有時區(qū)信息的,在進行運算時需要進行時區(qū)的轉換。()

A:錯B:對

答案:錯

執(zhí)行語句序列data=[[4,5,6],[4,5,6],[4,5,6]];df=pd.DataFrame(data,columns=list("ABC"))創(chuàng)建DataFrame對象df,則以下可以將df中值為5的數(shù)據(jù)修改為數(shù)值10的語句是()。

A:df.loc[:,"B"]=5B:df.replace(5,10,inplace=True)C:df[df.values==5]=10D:df["B"]=10

答案:df.loc[:,"B"]=5;df.replace(5,10,inplace=True);df[df.values==5]=10;df["B"]=10

使用pandas庫可以直接讀取的外部文件格式包括()。

A:Excel格式文件B:HTML格式文件C:XML格式文件D:CSV格式文件

答案:Excel格式文件;HTML格式文件;XML格式文件;CSV格式文件

在pandas環(huán)境中對數(shù)據(jù)進行聚合,DataFrame對象的groupby方法是一種常用的形式,則以下相關說法正確的是()。

A:分組后的結果可以直接顯示查看B:一般遵循拆分、應用、合并的過程C:函數(shù)作為分組鍵時,函數(shù)的返回值作為分組的名稱D:分組生成的GroupBy對象包含數(shù)據(jù)分組的所有信息

答案:一般遵循拆分、應用、合并的過程;函數(shù)作為分組鍵時,函數(shù)的返回值作為分組的名稱;分組生成的GroupBy對象包含數(shù)據(jù)分組的所有信息

對時間序列數(shù)據(jù)的重采樣,以下說法正確的是()。

A:降采樣時一般要進行相應的聚合運算B:對以日期為索引的時間序列升采樣時目標頻率必須是源頻率的超時期C:升采樣時會產(chǎn)生大量的缺失值D:本質(zhì)上是頻率轉換的過程

答案:降采樣時一般要進行相應的聚合運算;升采樣時會產(chǎn)生大量的缺失值;本質(zhì)上是頻率轉換的過程

在進行時間序列分析時,以時間順序排列構成的觀測樣本序列數(shù)據(jù)集,一般具有的基本特性包括()。

A:季節(jié)性變化B:周期性C:隨機性D:趨勢性

答案:季節(jié)性變化;周期性;隨機性;趨勢性

對時間序列的分析和預測,可以通過移動窗口并在窗口上進行統(tǒng)計計算的方式。Pandas應用于移動窗口計算的常用函數(shù)有()。

A:ewmB:expandingC:shiftD:rolling

答案:ewm;expanding;rolling

在Pandas環(huán)境中使用分類數(shù)據(jù),以下說法正確的是()。

A:分類數(shù)據(jù)通常占用少的多的內(nèi)存空間B:支持分類類型的底層算法采用整數(shù)編碼數(shù)組,速度更快C:操作分類對象Categorical的方法是通過其cat屬性提供的D:可以人為指定分類數(shù)據(jù)的整數(shù)編碼

答案:分類數(shù)據(jù)通常占用少的多的內(nèi)存空間;支持分類類型的底層算法采用整數(shù)編碼數(shù)組,速度更快;操作分類對象Categorical的方法是通過其cat屬性提供的;可以人為指定分類數(shù)據(jù)的整數(shù)編碼

在Python環(huán)境中,可以使用鏈式編程思想的場景有()。

A:對數(shù)據(jù)集進行一系列變換B:關系運算表達式C:閉包函數(shù)的調(diào)用D:自定義類成員方法的調(diào)用

答案:對數(shù)據(jù)集進行一系列變換;關系運算表達式;閉包函數(shù)的調(diào)用;自定義類成員方法的調(diào)用

在pandas的數(shù)據(jù)合并方法中,既可以按行合并,又可以按列合并的方法有()。

A:concatB:joinC:appendD:merge

答案:concat;join;merge

以下屬于pandas庫自帶的基本數(shù)據(jù)結構的是()。

A:DataFrameB:ndarrayC:listD:Series

答案:DataFrame;Series

假設執(zhí)行df=pd.DataFrame(np.random.randn(4,3),index=range(4),columns=["one","two","three"])語句已經(jīng)正確創(chuàng)建了一個DataFrame對象,則以下允許的操作有()。

A:執(zhí)行df["four"]=df["one"]+df["three"]添加一列B:執(zhí)行df.index=list("abcd")改變對象的索引標識C:執(zhí)行df.pop("two")刪除第二列D:執(zhí)行df.iloc[2]選擇第三行

答案:執(zhí)行df["four"]=df["one"]+df["three"]添加一列;執(zhí)行df.index=list("abcd")改變對象的索引標識;執(zhí)行df.pop("two")刪除第二列;執(zhí)行df.iloc[2]選擇第三行

使用DataFrame對象的describe方法,可以查看數(shù)據(jù)集的()。

A:每個數(shù)值列的數(shù)據(jù)項個數(shù)B:每個非數(shù)值列的類別數(shù)C:每個數(shù)值列的標準差D:每行的最大值和最小值

答案:每個數(shù)值列的數(shù)據(jù)項個數(shù);每個非數(shù)值列的類別數(shù);每個數(shù)值列的標準差

使用DataFrame對象的groupby方法對數(shù)據(jù)進行分組后,得到一個GroupBy對象,則以下關于GroupBy對象的說法正確的是()。

A:該對象包含對數(shù)值列的分組計算結果B:該對象包含要進行分組計算的所有信息C:是一個可迭代對象,由分組鍵值和對應的數(shù)據(jù)塊組成D:可以通過該對象直接查看分組的結果

答案:該對象包含要進行分組計算的所有信息;是一個可迭代對象,由分組鍵值和對應的數(shù)據(jù)塊組成

采用分組機制對數(shù)據(jù)進行計算時,以下對分組聚合和解封的說法正確的是()。

A:transform方法是對分組解封后的數(shù)據(jù)轉換運算B:只能對數(shù)據(jù)集中的數(shù)值型數(shù)據(jù)進行計算C:可以直接在分組對象上執(zhí)行統(tǒng)計計算D:apply方法是在各個分組結果上的聚合運算

答案:transform方法是對分組解封后的數(shù)據(jù)轉換運算;只能對數(shù)據(jù)集中的數(shù)值型數(shù)據(jù)進行計算;可以直接在分組對象上執(zhí)行統(tǒng)計計算;apply方法是在各個分組結果上的聚合運算

在使用pandas庫的get_dummies方法對分類特征進行啞變量處理以滿足某些回歸分析模型對數(shù)值型輸入的要求時,以下說法正確的是()。

A:啞變量處理后的數(shù)據(jù)變得更加稀疏,因此降低了模型的運算速度B:啞變量的數(shù)值沒有數(shù)量大小的意義,一般為0或1C:某一輸入特征有n種分類時,可以設置n-1個啞變量D:get_dummies可以接收DataFrame對象的一列作為要處理的啞變量

答案:啞變量的數(shù)值沒有數(shù)量大小的意義,一般為0或1;某一輸入特征有n種分類時,可以設置n-1個啞變量;get_dummies可以接收DataFrame對象的一列作為要處理的啞變量

在進行數(shù)據(jù)處理分析時,對數(shù)據(jù)進行離散化處理的原因主要有()。

A:簡化數(shù)據(jù)結構,更容易理解B:減少數(shù)據(jù)量,降低算法的時空開銷C:模型算法的要求D:提高算法對樣本的抗噪聲能力

答案:簡化數(shù)據(jù)結構,更容易理解;減少數(shù)據(jù)量,降低算法的時空開銷;模型算法的要求;提高算法對樣本的抗噪聲能力

在進行數(shù)據(jù)的處理分析時,要求對原始數(shù)據(jù)進行標準化處理,其主要原因有()。

A:保證算法的準確性B:消除數(shù)據(jù)特征之間量綱的差異C:保證結果的可靠性D:消除評價指標之間的數(shù)量級差異

答案:消除數(shù)據(jù)特征之間量綱的差異;保證結果的可靠性;消除評價指標之間的數(shù)量級差異

在pandas庫的數(shù)據(jù)組織方式上,允許使用層次化索引,以使得在同一個軸上可以擁有多個索引級別,其主要原因有()。

A:更容易實現(xiàn)不同層次的數(shù)據(jù)交換和排序B:使得DataFrame對象可以存儲和操作三維的數(shù)據(jù)C:能夠以低維方式處理高維數(shù)據(jù)D:數(shù)據(jù)子集的選取和訪問更加簡單

答案:更容易實現(xiàn)不同層次的數(shù)據(jù)交換和排序;使得DataFrame對象可以存儲和操作三維的數(shù)據(jù);能夠以低維方式處理高維數(shù)據(jù);數(shù)據(jù)子集的選取和訪問更加簡單

第五章測試

Matplotlib庫中用于實現(xiàn)繪圖功能的最主要模塊是()。

A:animationB:figureC:styleD:pylot

答案:pylot

使用matplotlib庫繪制圖表時,關于畫布和坐標軸,即figure對象和axes對象的描述,以下不正確的是()。

A:調(diào)用plot方法繪制圖形時,會自動創(chuàng)建一個figure對象和一個axes對象B:一個figure對象可以包含多個axes對象C:一個axes對象只能在一個figure對象中使用D:在同一個figure對象上繪制的多個圖形只能共用一個axes對象

答案:在同一個figure對象上繪制的多個圖形只能共用一個axes對象

為保證數(shù)據(jù)集中的數(shù)據(jù)點值能夠在坐標軸上全部畫出,使得坐標軸的大小適應數(shù)據(jù)的顯示,可以使用Matplotlib庫繪圖模塊的()函數(shù)實現(xiàn)。

A:plotB:axisC:set_axesD:autoscale

答案:autoscale

使用matplotlib庫繪制圖表,要在圖表中添加注解,應調(diào)用pyplot模塊的()方法來實現(xiàn)。

A:figureB:annotateC:plotD:legend

答案:annotate

使用matplotlib.pyplot模塊的subplot方法在畫布上繪制子圖時,在調(diào)用subplot(2,1,1)之后,若再調(diào)用subplot(2,3,4),則創(chuàng)建的子圖是()。

A:第2行的第3個子圖B:第2行的第1個子圖C:第2行的第2個子圖D:第2行的第4個子圖

答案:第2行的第1個子圖

使用matplotlib.pyplot模塊繪制柱形圖和直方圖時,以下說法不正確的是()。

A:繪制柱形圖和直方圖時,柱子的寬度均可以不同B:柱形圖和直方圖所表示的數(shù)據(jù)均應具有連續(xù)性C:直方圖中用柱子的寬度和高度均有意義D:柱形圖中只有柱子的高度有意義

答案:柱形圖和直方圖所表示的數(shù)據(jù)均應具有連續(xù)性

制作詞云圖時,以下可以用來分詞的模塊是()。

A:echartsB:wordcloud2C:WordCloudD:jieba

答案:jieba

繪制三維線框圖,可以使用mplot3d模塊的()方法。

A:plotB:plot_wireframeC:plot3d_wireframeD:plot3d

答案:plot_wireframe

使用Axes3D對象的bar3d(x,y,z,dx,dy,dz)函數(shù)繪制三維柱狀圖時,其中的參數(shù)x、y和z表示()。

A:柱子的體積B:柱子的大小C:柱子錨點的坐標D:柱子的形狀

答案:柱子錨點的坐標

三翼面圖的繪制,可以使用Axes3D對象的()函數(shù)。

A:plot_trisurfB:contourfC:plot_wireframeD:plot_surface

答案:plot_trisurf

使用matplotlib庫繪制圖表時,若要將y軸的刻度設置為對數(shù)形式,應使用坐標軸對象axes的方法是()。

A:set_ylabelB:set_titleC:set_yticksD:set_yscale

答案:set_yscale

使用繪圖模塊pyplot的bar方法繪制柱形圖時,要在同一個繪圖區(qū)上繪制多個柱形圖,且保證這些柱形圖不重疊,正確的做法是()。

A:設置不同的x坐標位置B:設置柱子具有不同的寬度C:設置柱子不同的對齊方式D:同時調(diào)整柱形圖的寬度和x軸上的坐標位置

答案:同時調(diào)整柱形圖的寬度和x軸上的坐標位置

使用繪圖模塊pyplot的hist方法繪制直方圖時,參數(shù)histtype用來設置要繪制的直方圖類型,其值不可以設置為()。

A:barstackedB:stepC:barplotD:stepfilled

答案:barplot

使用pyplot模塊的legend方法在繪圖區(qū)添加圖例時,參數(shù)loc用來指定圖例框的位置,其取值有()種可能。

A:9B:10C:8D:11

答案:10

對常用的二維圖表,以下說法不正確的是()。

A:直方圖既能表現(xiàn)分組的大小,又能表現(xiàn)各分組的頻率高低B:散點圖可以用來推斷數(shù)據(jù)特征之間的相關性C:餅圖用來表現(xiàn)特征的占比情況,且對數(shù)量的比較更容易辨識D:柱狀圖只能在一個維度上進行比較

答案:餅圖用來表現(xiàn)特征的占比情況,且對數(shù)量的比較更容易辨識

matplotlib是可以直接在Python環(huán)境中使用的標準庫,無須事先安裝。()

A:對B:錯

答案:錯

在使用matplotlib.pyplot模塊中的plot()函數(shù)繪制折線圖時,matplotlib會自動創(chuàng)建一個繪圖區(qū)(figure)。()

A:對B:錯

答案:對

堆積圖可以表示不同部分對總量的數(shù)量貢獻,只能表現(xiàn)事物的總體趨勢。()

A:對B:錯

答案:錯

散點圖可以用來判斷不同數(shù)據(jù)集之間是否存在相關性。()

A:錯B:對

答案:對

使用matpotlib.pyplot模塊的xcorr方法繪制互相關圖時,會通過numpy庫的correlate函數(shù)自動計算數(shù)據(jù)之間的相關性。()

A:錯B:對

答案:對

自相關圖可以用來表現(xiàn)同一個數(shù)據(jù)集在不同時間周期內(nèi)的相似度。()

A:錯B:對

答案:對

使用matplotlib.animation模塊的FuncAnimation類繪制動畫時,每一幀的繪制都需要回調(diào)創(chuàng)建構成幀的繪圖對象函數(shù)。()

A:錯B:對

答案:對

使用matplotlib.animation模塊的ArtistAnimation類繪制動畫時,必須預先創(chuàng)建構成動畫的每一幀圖像。()

A:錯B:對

答案:對

OpenGL是一種開放式圖形庫,獨立于硬件和操作系統(tǒng)平臺。()

A:對B:錯

答案:對

NetworkX庫提供了網(wǎng)絡的可視化功能,因此使用NetworkX庫繪制網(wǎng)絡圖時,不需要導入matplotlib庫的繪圖模塊pyplot。()

A:對B:錯

答案:錯

PyLab模塊不屬于matplotlib庫,它能夠單獨導入到Python環(huán)境并實現(xiàn)基本圖表的繪制。()

A:錯B:對

答案:對

使用matplotlib庫既可以在平面直角坐標系下繪圖,又可以在極坐標系下繪圖。()

A:對B:錯

答案:對

mplot3d是專門用來繪制三維圖形的工具包,可以使用frommatplotlibimportmplot3d語句導入到Python環(huán)境。()

A:對B:錯

答案:錯

animation模塊是屬于matplotlib庫的一個子模塊,可以使用frommatplotlibimportanimation語句導入到Python,并使用其中的接口類生成動畫。()

A:錯B:對

答案:對

散點圖可以用于表示三維特征的分布情況。()

A:錯B:對

答案:對

以下屬于圖表基本組成的有()。

A:圖表標題B:圖例C:坐標軸D:繪圖區(qū)

答案:圖表標題;圖例;坐標軸;繪圖區(qū)

第三方庫jieba為在Python環(huán)境中完成詞云圖的制作提供了必要的前提,其主要功能包括()。

A:對分詞結果進行詞頻統(tǒng)計B:以不同模式對文本進行分詞C:子模塊posseg可以進行詞性分析D:子模塊analyse可以進行關鍵詞提取

答案:以不同模式對文本進行分詞;子模塊posseg可以進行詞性分析;子模塊analyse可以進行關鍵詞提取

在matplotlib的pyplot模塊中,可以用來創(chuàng)建圖表中的子區(qū)的方法有()。

A:subplot2gridB:GridSpecPlotC:subplotD:subplots

答案:subplot2grid;s

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論