【MOOC】《數(shù)據(jù)科學(xué)基礎(chǔ)(Matlab)》東北大學(xué)-答案_第1頁(yè)
【MOOC】《數(shù)據(jù)科學(xué)基礎(chǔ)(Matlab)》東北大學(xué)-答案_第2頁(yè)
【MOOC】《數(shù)據(jù)科學(xué)基礎(chǔ)(Matlab)》東北大學(xué)-答案_第3頁(yè)
【MOOC】《數(shù)據(jù)科學(xué)基礎(chǔ)(Matlab)》東北大學(xué)-答案_第4頁(yè)
【MOOC】《數(shù)據(jù)科學(xué)基礎(chǔ)(Matlab)》東北大學(xué)-答案_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

【MOOC】《數(shù)據(jù)科學(xué)基礎(chǔ)(Matlab)》東北大學(xué)-答案

有些題目順序不一致,下載后按鍵盤(pán)ctrl+F進(jìn)行搜索數(shù)據(jù)科學(xué)概論單元測(cè)驗(yàn)一1.單選題:下列關(guān)于數(shù)據(jù)的描述,不正確的是

選項(xiàng):

A、大部分文本格式數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),例如服務(wù)器日志、論壇帖子內(nèi)容。

B、一個(gè)以行列結(jié)構(gòu)記錄的班級(jí)成績(jī)表是結(jié)構(gòu)化數(shù)據(jù)。

C、用以表示人體體重的數(shù)據(jù)(例如62.3Kg)是離散型數(shù)據(jù)。

D、用以表示一個(gè)商品產(chǎn)地的國(guó)家地區(qū)數(shù)據(jù)是定性數(shù)據(jù)。

答案:【用以表示人體體重的數(shù)據(jù)(例如62.3Kg)是離散型數(shù)據(jù)。】2.單選題:下列屬于使用科學(xué)的方法研究數(shù)據(jù)的學(xué)科是

選項(xiàng):

A、地球科學(xué)

B、生物信息學(xué)

C、機(jī)器學(xué)習(xí)

D、統(tǒng)計(jì)學(xué)

答案:【統(tǒng)計(jì)學(xué)】3.單選題:下列屬于使用數(shù)據(jù)的方法研究科學(xué)的案例是

選項(xiàng):

A、商務(wù)智能

B、開(kāi)普勒三大定律

C、人類(lèi)基因組計(jì)劃

D、數(shù)字圖像處理

答案:【人類(lèi)基因組計(jì)劃】4.單選題:以下人物中,哪一位是第四范式的提出者?

選項(xiàng):

A、ClaudeElwoodShannon(香農(nóng))

B、JimGray(吉姆·格雷)

C、NorbertWiener(諾伯特·維納)

D、PeterNaur(彼得·諾爾)

答案:【JimGray(吉姆·格雷)】5.多選題:以下屬于數(shù)據(jù)的可能形式的是

選項(xiàng):

A、文本

B、數(shù)字

C、音頻

D、視頻

E、圖像

答案:【文本;數(shù)字;音頻;視頻;圖像】6.多選題:以下屬于大數(shù)據(jù)的特征的是

選項(xiàng):

A、數(shù)據(jù)規(guī)模大(Volume)

B、數(shù)據(jù)產(chǎn)生/變更速度快(Velocity)

C、數(shù)據(jù)種類(lèi)繁多(Variety)

D、數(shù)據(jù)價(jià)值高(Value)

E、數(shù)據(jù)真實(shí)性(Veracity)

答案:【數(shù)據(jù)規(guī)模大(Volume);數(shù)據(jù)產(chǎn)生/變更速度快(Velocity);數(shù)據(jù)種類(lèi)繁多(Variety);數(shù)據(jù)價(jià)值高(Value);數(shù)據(jù)真實(shí)性(Veracity)】7.多選題:數(shù)據(jù)科學(xué)包括兩個(gè)方面:

選項(xiàng):

A、用數(shù)據(jù)的方法研究科學(xué)

B、用科學(xué)的方法研究數(shù)據(jù)

C、統(tǒng)計(jì)學(xué)

D、天體信息學(xué)

答案:【用數(shù)據(jù)的方法研究科學(xué);用科學(xué)的方法研究數(shù)據(jù)】8.多選題:在分析一家坐落于某大城市的咖啡店的數(shù)據(jù)時(shí),記錄了咖啡店的以下數(shù)據(jù)項(xiàng):咖啡店名稱(chēng)、營(yíng)業(yè)額、郵政編碼、平均每月客戶(hù)數(shù)、咖啡產(chǎn)地。以下表述正確的是

選項(xiàng):

A、咖啡店名稱(chēng)是定性數(shù)據(jù)

B、營(yíng)業(yè)額是定量數(shù)據(jù)

C、郵政編碼是定量數(shù)據(jù)

D、平均每月客戶(hù)數(shù)是定量數(shù)據(jù)

E、咖啡產(chǎn)地是定性數(shù)據(jù)

答案:【咖啡店名稱(chēng)是定性數(shù)據(jù);營(yíng)業(yè)額是定量數(shù)據(jù);平均每月客戶(hù)數(shù)是定量數(shù)據(jù);咖啡產(chǎn)地是定性數(shù)據(jù)】單元作業(yè)一1.通過(guò)文獻(xiàn)檢索,調(diào)查近3年在數(shù)據(jù)科學(xué)領(lǐng)域中的研究進(jìn)展,寫(xiě)一段不少于200字的總結(jié)。

參考答案:【近三年數(shù)據(jù)科學(xué)領(lǐng)域取得了顯著的研究進(jìn)展。在技術(shù)方面,2023年大模型興起,為數(shù)據(jù)科學(xué)帶來(lái)新機(jī)遇,可用于數(shù)據(jù)預(yù)處理等任務(wù),提高工作效率和結(jié)果可理解性7。實(shí)時(shí)數(shù)據(jù)治理和多模態(tài)融合分析成為重要方向,幫助企業(yè)處理海量復(fù)雜數(shù)據(jù)7。2024年,吉林大學(xué)等團(tuán)隊(duì)提出ds-agent,能讓大語(yǔ)言模型智能體處理復(fù)雜機(jī)器學(xué)習(xí)建模任務(wù)。上??萍即髮W(xué)張海鵬課題組在中國(guó)人名表征、人物行跡挖掘、有向圖表征以及大語(yǔ)言模型泛化機(jī)制方面取得多項(xiàng)成果1。在應(yīng)用方面,數(shù)據(jù)科學(xué)在各行業(yè)的應(yīng)用不斷深化,如康復(fù)醫(yī)學(xué)領(lǐng)域正推動(dòng)康復(fù)大數(shù)據(jù)的規(guī)范化發(fā)展5。在政策標(biāo)準(zhǔn)方面,2023年發(fā)布《GB/T42813-2023數(shù)據(jù)論文出版元數(shù)據(jù)》國(guó)家標(biāo)準(zhǔn),2024年中國(guó)在數(shù)據(jù)基礎(chǔ)制度等方面也出臺(tái)了諸多政策36?!?.企業(yè)員工流動(dòng)率能夠?yàn)槠髽I(yè)注入新鮮的活力,增強(qiáng)組織的創(chuàng)新能力,但過(guò)多的員工離職,特別是核心員工的離職則會(huì)導(dǎo)致企業(yè)人力資本投資的損失,員工士氣低落,破壞企業(yè)建立的競(jìng)爭(zhēng)優(yōu)勢(shì)等消極影響。因此通過(guò)對(duì)離職影響因素的分析,企業(yè)管理者可以有效地對(duì)員工的離職行為進(jìn)行管理。假設(shè)現(xiàn)在期望建立一個(gè)企業(yè)員工離職預(yù)測(cè)模型,用以預(yù)測(cè)可能離職的核心員工,請(qǐng)闡述需要采集哪些可能指標(biāo),并說(shuō)明理由。

參考答案:【個(gè)人基本信息年齡:不同年齡階段的員工離職傾向可能不同。例如,年輕員工可能更傾向于尋找新的機(jī)會(huì)來(lái)提升自己的職業(yè)發(fā)展,他們可能對(duì)工作的新鮮感和挑戰(zhàn)性有更高的要求。而年長(zhǎng)員工可能更注重工作的穩(wěn)定性和福利等因素。如果年齡在30歲以下的員工離職率相對(duì)較高,這可能與他們對(duì)職業(yè)晉升速度的期望有關(guān)。性別:雖然不能一概而論,但在某些行業(yè)中,男性和女性在職業(yè)規(guī)劃和工作穩(wěn)定性方面可能存在差異。例如,在一些需要經(jīng)常出差或者工作強(qiáng)度較大的行業(yè),男性員工可能更容易適應(yīng),離職率相對(duì)較低;而女性員工可能因?yàn)榧彝サ纫蛩馗菀纂x職?;橐鰻顩r:已婚員工通常會(huì)考慮家庭因素,如配偶的工作地點(diǎn)、子女的教育等。例如,若企業(yè)辦公地點(diǎn)偏遠(yuǎn),已婚且有子女的員工可能為了方便照顧家庭而離職,選擇距離家庭更近的工作崗位。教育程度:高學(xué)歷員工可能對(duì)工作內(nèi)容的專(zhuān)業(yè)性和挑戰(zhàn)性要求更高。如果企業(yè)不能提供足夠的技術(shù)研發(fā)等高端任務(wù),碩士及以上學(xué)歷的員工可能會(huì)因?yàn)樽陨砟芰o(wú)法充分發(fā)揮而離職,他們更傾向于尋找能與自己知識(shí)水平相匹配的工作環(huán)境。工作相關(guān)信息工作年限:新員工在入職初期可能因?yàn)閷?duì)公司文化不適應(yīng)或者工作內(nèi)容與預(yù)期不符而離職。而工作多年的員工,若離職可能是因?yàn)橛龅搅寺殬I(yè)發(fā)展瓶頸。例如,在公司工作5-10年的員工,若沒(méi)有得到晉升機(jī)會(huì),可能會(huì)考慮跳槽到能提供更高職位的企業(yè)。職位級(jí)別:基層員工離職可能更多是因?yàn)樾劫Y和工作壓力問(wèn)題。而中層和高層管理人員離職可能涉及到公司戰(zhàn)略、權(quán)力分配等復(fù)雜因素。比如,中層管理人員可能因?yàn)閷?duì)公司決策層的戰(zhàn)略規(guī)劃不認(rèn)同,或者在團(tuán)隊(duì)管理過(guò)程中受到過(guò)多的限制而離職。工作部門(mén):不同部門(mén)的工作壓力、發(fā)展前景不同。例如,在技術(shù)創(chuàng)新部門(mén),員工可能因?yàn)榧夹g(shù)更新?lián)Q代快,自身技術(shù)能力跟不上而離職;而在市場(chǎng)部門(mén),員工可能因?yàn)闃I(yè)績(jī)壓力或者市場(chǎng)競(jìng)爭(zhēng)激烈,尋找更輕松的工作環(huán)境而離職。績(jī)效評(píng)估結(jié)果:績(jī)效差的員工可能會(huì)因?yàn)閾?dān)心被辭退或者無(wú)法獲得獎(jiǎng)金等原因而主動(dòng)離職。而績(jī)效優(yōu)秀的員工如果沒(méi)有得到相應(yīng)的獎(jiǎng)勵(lì),如晉升、薪資提升等,也可能會(huì)離職。例如,連續(xù)多年績(jī)效優(yōu)秀但沒(méi)有得到晉升的員工,可能會(huì)被競(jìng)爭(zhēng)對(duì)手以更好的職位吸引走。薪酬福利信息工資水平:如果員工的工資低于同行業(yè)平均水平,尤其是核心員工,他們很可能會(huì)因?yàn)樾劫Y問(wèn)題而離職。例如,一名資深的軟件工程師發(fā)現(xiàn)自己的工資比市場(chǎng)水平低20%,在有其他公司提供更高薪資的情況下,離職的可能性就會(huì)增加。福利種類(lèi):除了法定福利外,企業(yè)提供的補(bǔ)充福利如商業(yè)保險(xiǎn)、帶薪休假、員工培訓(xùn)等也會(huì)影響員工的離職率。例如,重視自我提升的員工可能會(huì)因?yàn)槠髽I(yè)沒(méi)有提供足夠的培訓(xùn)機(jī)會(huì)而離職,而有子女的員工可能會(huì)因?yàn)槠髽I(yè)沒(méi)有提供子女教育補(bǔ)貼等福利而考慮離職。企業(yè)文化和工作環(huán)境企業(yè)文化認(rèn)同感:如果員工對(duì)企業(yè)的價(jià)值觀、使命等不認(rèn)同,就很難長(zhǎng)期在企業(yè)工作。例如,一個(gè)注重環(huán)保的員工在一家對(duì)環(huán)境有較大負(fù)面影響的企業(yè)中工作,可能會(huì)因?yàn)閮?nèi)心的價(jià)值觀沖突而離職。工作壓力和工作氛圍:工作強(qiáng)度過(guò)大、工作氛圍壓抑的環(huán)境會(huì)導(dǎo)致員工離職。例如,在一個(gè)經(jīng)常加班且團(tuán)隊(duì)成員之間關(guān)系緊張的部門(mén),員工離職率可能會(huì)比較高。相反,一個(gè)工作氛圍輕松、團(tuán)隊(duì)合作良好的部門(mén),員工的忠誠(chéng)度可能會(huì)更高?!繑?shù)據(jù)科學(xué)中的數(shù)學(xué)基礎(chǔ)單元作業(yè)二1.求矩陣A的特征值和特征向量。

特征值特征向量2.已知求下列表達(dá)式的值:(1)A-B+I(其中I為單位矩陣)(2)A.*B(3)A^3(4)A/B(5)B\A

每個(gè)小題1分3.有矩陣如下(1)求該矩陣的行列式、秩、逆矩陣、跡;(2)交換該矩陣的第2行和第4行并重新顯示A。

行列式秩逆矩陣跡行交換單元測(cè)驗(yàn)二1.單選題:下面無(wú)法生成[1,3,5,7,9]向量的語(yǔ)句是()。

選項(xiàng):

A、1:2:9

B、1:2:10

C、linspace(1,9,5)

D、linspace(1,10,5)

答案:【linspace(1,10,5)】2.單選題:在MATLAB中,下列說(shuō)法正確的是()。

選項(xiàng):

A、矩陣和向量無(wú)法相加。

B、向量和標(biāo)量無(wú)法相加。

C、兩個(gè)行向量一定能相加。

D、兩個(gè)同型矩陣不一定能相乘。

答案:【兩個(gè)同型矩陣不一定能相乘?!?.單選題:下面語(yǔ)句的結(jié)果更接近0的是()。

選項(xiàng):

A、mean(rand(100,1))

B、mean(randn(100,1))

C、norm(rand(10),2)

D、norm(randn(10),2)

答案:【mean(randn(100,1))】4.單選題:令x=[1,2,3];y=[4;5;6];下列語(yǔ)句不能執(zhí)行的是()。

選項(xiàng):

A、x*y

B、y*x

C、x+y'

D、x.*y

答案:【x.*y】5.單選題:求出tant函數(shù)關(guān)于π/2點(diǎn)處的左極限,下列命令正確的是()

選項(xiàng):

A、symst;f=tan(t);L1=limit(f,t,π/2,’left’)

B、symst;f=tan(t);L1=limit(f,t,pi/2,’right’)

C、symst;f=tan(t);L1=limit(f,t,pi/2,’left’)

D、symst;f=tan(t);L1=limit(f,t,π/2,’right’)

答案:【symst;f=tan(t);L1=limit(f,t,pi/2,’left’)】6.單選題:矩陣A、B進(jìn)行運(yùn)算,下面哪種運(yùn)算是不正確的?

選項(xiàng):

A、A.*B

B、A+B

C、A\B

D、A.+B

答案:【A.+B】7.單選題:語(yǔ)句“[X,D]=eig(A)”執(zhí)行后,D是一個(gè)()。

選項(xiàng):

A、三角陣

B、對(duì)角陣

C、單位陣

D、普通數(shù)值矩陣

答案:【對(duì)角陣】8.單選題:求矩陣A的范數(shù)的函數(shù)是()。

選項(xiàng):

A、trace(A)

B、cond(A)

C、rank(A)

D、norm(A)

答案:【norm(A)】9.單選題:將矩陣A對(duì)角線(xiàn)元素加30的命令是()。

選項(xiàng):

A、A+30*eye(size(A))

B、A+30*eye(A)

C、A+30*ones(size(A))

D、A+30*eye(4)

答案:【A+30*eye(size(A))】10.單選題:建立3階全1矩陣A的語(yǔ)句是()。

選項(xiàng):

A、A=one(3)

B、A=ones(3,1)

C、A=one(3,3)

D、A=ones(3,3)

答案:【A=ones(3,3)】Matlab程序設(shè)計(jì)基礎(chǔ)單元作業(yè)三1.編寫(xiě)程序:找到1000以?xún)?nèi)的所有完數(shù)(一個(gè)數(shù)等于除去其本身外所有因子之和,6=1+2+3)。

參考代碼:%初始化一個(gè)空數(shù)組來(lái)存儲(chǔ)完數(shù)perfect_numbers=[];%遍歷從1到1000的所有數(shù)fori=1:1000%初始化因子之和為0factor_sum=0;%尋找i的因子,不包括i本身forj=1:i-1ifmod(i,j)==0%如果j是i的因子,將其累加到因子之和factor_sum=factor_sum+j;endend%如果因子之和等于該數(shù),將其添加到完數(shù)數(shù)組中iffactor_sum==iperfect_numbers=[perfect_numbersi];endend%輸出完數(shù)數(shù)組disp(perfect_numbers);2.編寫(xiě)程序:計(jì)算所有能既能被3整除又能被5整除的3位數(shù)的和,并輸出結(jié)果。

參考代碼:%初始化和為0sum_result=0;%遍歷所有的三位數(shù)(100到999)fori=100:999%判斷該數(shù)是否既能被3整除又能被5整除ifmod(i,3)==0&&mod(i,5)==0%如果滿(mǎn)足條件,累加到sum_result中sum_result=sum_result+i;endend%輸出結(jié)果disp(sum_result);[vk-content]3.編寫(xiě)函數(shù)sortcolumn:將[12,34,4,57,32,8,34,15]從小到大排成一列。

參考代碼:functionsorted_array=sortcolumn()%輸入數(shù)組input_array=[12,34,4,57,32,8,34,15];%使用sort函數(shù)對(duì)輸入數(shù)組進(jìn)行排序sorted_array=sort(input_array);end單元測(cè)驗(yàn)三1.單選題:在matlab中,跳出當(dāng)前循環(huán)繼續(xù)下次循環(huán)的指令是

選項(xiàng):

A、break

B、pause

C、continue

D、return

答案:【continue】2.單選題:運(yùn)行下列程序,所得的結(jié)果為s=0;a=[2,3,4;5,6,7;8,9,10];fork=as=s+k;enddisp(s)

選項(xiàng):

A、[9,18,27]'

B、[9,18,27]

C、54

D、9

答案:【[9,18,27]'】3.單選題:下列哪組程序段,無(wú)法判斷c為小寫(xiě)英文字母

選項(xiàng):

A、if(c>='a'&&c<='z')...end

B、ifc>='a'&&c<='z'...end

C、if'a'<=c<='z'...end

D、ifc>='a'ifc<='z'...end...end

答案:【if'a'<=c<='z'...end】4.單選題:已知程序x=input('請(qǐng)輸入x的值:');ifrem(x,2)==1y=sqrt(x);elsey=x^(1/3);endy如果輸入x的值為9,那么y的值為多少

選項(xiàng):

A、3

B、0

C、9

D、2.0801

答案:【3】5.單選題:下列選項(xiàng)為matlab中條件的結(jié)果,哪個(gè)結(jié)果代表?xiàng)l件成立

選項(xiàng):

A、0

B、[1,2;0,2]

C、[0,0;0,0]

D、[2,3;4,5]

答案:【[2,3;4,5]】6.單選題:在matlab中要強(qiáng)行終止正在運(yùn)行的程序,需要按鍵盤(pán)上的哪兩個(gè)組合鍵

選項(xiàng):

A、ctrl+c

B、ctrl+v

C、ctrl+a

D、ctrl+z

答案:【ctrl+c】7.單選題:下列關(guān)于函數(shù)文件的描述中,哪一種說(shuō)法是錯(cuò)誤的

選項(xiàng):

A、文件中包含函數(shù)的聲明行

B、文件中可以包含輸入輸出變量

C、運(yùn)算中生成的所有變量都存放在函數(shù)工作空間

D、文件不具備參數(shù)傳遞的功能

答案:【文件不具備參數(shù)傳遞的功能】8.單選題:下列關(guān)于腳本文件的描述中,哪一種說(shuō)法是錯(cuò)誤的

選項(xiàng):

A、文件是多條命令的綜合體

B、文件的擴(kuò)展名為.mat

C、文件中沒(méi)有函數(shù)的聲明行

D、文件中沒(méi)有輸入輸出變量

答案:【文件的擴(kuò)展名為.mat】9.單選題:在matlab中下列哪條指令用于創(chuàng)建文件

選項(xiàng):

A、edit

B、creat

C、open

D、file

答案:【edit】10.單選題:下面哪種數(shù)據(jù)類(lèi)型不是matlab中的數(shù)據(jù)類(lèi)型

選項(xiàng):

A、元胞類(lèi)型

B、字符類(lèi)型

C、指針類(lèi)型

D、結(jié)構(gòu)體類(lèi)型

答案:【指針類(lèi)型】Matlab數(shù)據(jù)可視化單元作業(yè)四1.從國(guó)家氣象局網(wǎng)站上選取某一天的全國(guó)省會(huì)城市的平均氣溫,并結(jié)合省會(huì)城市的地理經(jīng)緯度數(shù)據(jù),利用geobubble函數(shù)繪制該日期的溫度指數(shù)。參考答案:以下是一個(gè)可能的Matlab實(shí)現(xiàn)思路:解決思路:從國(guó)家氣象局網(wǎng)站上獲取所需數(shù)據(jù):確定如何從國(guó)家氣象局網(wǎng)站上爬取數(shù)據(jù)(可能需要使用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)或查找網(wǎng)站是否提供API接口)。提取某一天的全國(guó)省會(huì)城市的平均氣溫?cái)?shù)據(jù)。確保提取的數(shù)據(jù)包含省會(huì)城市的名稱(chēng)、平均氣溫、以及對(duì)應(yīng)的地理經(jīng)緯度信息。整理數(shù)據(jù):將獲取的數(shù)據(jù)存儲(chǔ)在Matlab中的數(shù)據(jù)結(jié)構(gòu)中,如矩陣或表格。檢查數(shù)據(jù)的完整性和準(zhǔn)確性,確保數(shù)據(jù)格式符合后續(xù)處理的要求。繪制溫度指數(shù):使用

geobubble

函數(shù)繪制地理氣泡圖。以經(jīng)緯度作為位置信息,平均氣溫作為氣泡的大小或顏色強(qiáng)度指標(biāo)。以下是一個(gè)簡(jiǎn)化的示例代碼,假設(shè)你已經(jīng)手動(dòng)從國(guó)家氣象局網(wǎng)站獲取了數(shù)據(jù)并存儲(chǔ)在Matlab中:%假設(shè)我們已經(jīng)有以下數(shù)據(jù)存儲(chǔ)在Matlab中%省會(huì)城市名稱(chēng)cityNames={'北京','上海','廣州','深圳','杭州'};%平均氣溫(攝氏度)temperatures=[20,25,30,28,22];%省會(huì)城市的經(jīng)度longitudes=[116.4,121.47,113.23,114.07,120.19];%省會(huì)城市的緯度latitudes=[39.9,31.23,23.16,22.54,30.26];%將數(shù)據(jù)存儲(chǔ)在表格中dataTable=table(cityNames,longitudes,latitudes,temperatures);%使用geobubble函數(shù)繪制地理氣泡圖geobubble(dataTable,'Latitude','Latitudes','Longitude','Longitudes','SizeVariable','temperatures','ColorVariable','temperatures','Basemap','colorterrain')%設(shè)置標(biāo)題title('全國(guó)省會(huì)城市某日平均氣溫');%設(shè)置顏色條標(biāo)簽colorbar('Label','平均氣溫(℃)');2.carbig是Matlab軟件中自帶的一個(gè)汽車(chē)數(shù)據(jù)集,使用loadcarbig命令可以加載該數(shù)據(jù)集。請(qǐng)編寫(xiě)程序?qū)崿F(xiàn)如下功能:(1)以地區(qū)為橫坐標(biāo),汽車(chē)馬力為縱坐標(biāo)繪制散點(diǎn)圖,無(wú)需區(qū)分不同地區(qū)的顏色。提示:使用函數(shù):cellstr和categorical;(2)對(duì)汽車(chē)氣缸數(shù)目(Cylinders)繪制條形圖;(3)如果想研究不同氣缸數(shù)目(Cylinders)下汽車(chē)發(fā)動(dòng)機(jī)排量(Displacement)或馬力(Horsepower)的分布情況,請(qǐng)選取合理的數(shù)據(jù)以合理的可視化形式展現(xiàn),并給出從圖中可見(jiàn)的初步結(jié)論。

參考答案:%加載carbig數(shù)據(jù)集loadcarbig;%(1)以地區(qū)為橫坐標(biāo),汽車(chē)馬力為縱坐標(biāo)繪制散點(diǎn)圖%將地區(qū)轉(zhuǎn)換為分類(lèi)數(shù)據(jù)Origin=categorical(cellstr(Origin));scatter(Origin,Horsepower);title('汽車(chē)馬力與地區(qū)的關(guān)系');xlabel('地區(qū)');ylabel('馬力');%(2)對(duì)汽車(chē)氣缸數(shù)目(Cylinders)繪制條形圖bar(Cylinders);title('汽車(chē)氣缸數(shù)目分布');xlabel('氣缸數(shù)目');ylabel('數(shù)量');%(3)研究不同氣缸數(shù)目下汽車(chē)發(fā)動(dòng)機(jī)排量(Displacement)的分布情況%可以使用箱線(xiàn)圖來(lái)展示不同氣缸數(shù)目的汽車(chē)發(fā)動(dòng)機(jī)排量分布figure;boxplot(Displacement,Cylinders);title('不同氣缸數(shù)目下汽車(chē)發(fā)動(dòng)機(jī)排量的分布');xlabel('氣缸數(shù)目');ylabel('發(fā)動(dòng)機(jī)排量');%另一種可視化方式:使用小提琴圖figure;violinplot(Displacement,Cylinders);title('不同氣缸數(shù)目下汽車(chē)發(fā)動(dòng)機(jī)排量的分布(小提琴圖)');xlabel('氣缸數(shù)目');ylabel('發(fā)動(dòng)機(jī)排量');%從圖中可見(jiàn)的初步結(jié)論:%對(duì)于箱線(xiàn)圖:%可以觀察到不同氣缸數(shù)目的汽車(chē)發(fā)動(dòng)機(jī)排量的中位數(shù)、上下四分位數(shù)、異常值等信息。%氣缸數(shù)目較多的汽車(chē),其發(fā)動(dòng)機(jī)排量的分布范圍通常更廣,中位數(shù)也更大,說(shuō)明氣缸數(shù)目與發(fā)動(dòng)機(jī)排量可能存在正相關(guān)關(guān)系。%對(duì)于小提琴圖:%可以看到不同氣缸數(shù)目的汽車(chē)發(fā)動(dòng)機(jī)排量的概率密度分布。%可以看出不同氣缸數(shù)目的汽車(chē)發(fā)動(dòng)機(jī)排量的分布形狀,以及是否有多個(gè)峰值等信息,進(jìn)一步驗(yàn)證了不同氣缸數(shù)目的汽車(chē)發(fā)動(dòng)機(jī)排量分布存在差異。%如果你想研究不同氣缸數(shù)目下汽車(chē)馬力(Horsepower)的分布情況,可以類(lèi)似地使用箱線(xiàn)圖或小提琴圖figure;boxplot(Horsepower,Cylinders);title('不同氣缸數(shù)目下汽車(chē)馬力的分布');xlabel('氣缸數(shù)目');ylabel('馬力');figure;violinplot(Horsepower,Cylinders);title('不同氣缸數(shù)目下汽車(chē)馬力的分布(小提琴圖)');xlabel('氣缸數(shù)目');ylabel('馬力');%從這些圖中可以得到的初步結(jié)論:%一般來(lái)說(shuō),隨著氣缸數(shù)目的增加,汽車(chē)的馬力也有增加的趨勢(shì),因?yàn)闅飧讛?shù)目的增加通常意味著發(fā)動(dòng)機(jī)的功率更大。%不同氣缸數(shù)目的汽車(chē)馬力分布也有不同的特征,例如,可能存在更多的異常值或不同的分布形狀,這可能反映了不同發(fā)動(dòng)機(jī)設(shè)計(jì)和汽車(chē)類(lèi)型的差異。3.生成一些樣本量為n=30,n=50和n=100的標(biāo)準(zhǔn)正態(tài)分布數(shù)據(jù)。對(duì)數(shù)據(jù)進(jìn)行不同組距的分組,并繪制統(tǒng)計(jì)直方圖。使用subplot將不同組距參數(shù)下的統(tǒng)計(jì)直方圖繪制于同一繪圖窗口中。

參考答案:%生成樣本量為n=30的標(biāo)準(zhǔn)正態(tài)分布數(shù)據(jù)n1=30;data1=randn(n1,1);%生成樣本量為n=50的標(biāo)準(zhǔn)正態(tài)分布數(shù)據(jù)n2=50;data2=randn(n2,1);%生成樣本量為n=100的標(biāo)準(zhǔn)正態(tài)分布數(shù)據(jù)n3=100;data3=randn(n3,1);%不同的組距binWidths=[0.5,1,2];%使用subplot繪制不同組距下的統(tǒng)計(jì)直方圖figure;%對(duì)于樣本量n=30subplot(3,3,1);histogram(data1,binWidths(1));title('n=30,binWidth=0.5');xlabel('Value');ylabel('Frequency');subplot(3,3,2);histogram(data1,binWidths(2));title('n=30,binWidth=1');xlabel('Value');ylabel('Frequency');subplot(3,3,3);histogram(data1,binWidths(3));title('n=30,binWidth=2');xlabel('Value');ylabel('Frequency');%對(duì)于樣本量n=50subplot(3,3,4);histogram(data2,binWidths(1));title('n=50,binWidth=0.5');xlabel('Value');ylabel('Frequency');subplot(3,3,5);histogram(data2,binWidths(2));title('n=50,binWidth=1');xlabel('Value');ylabel('Frequency');subplot(3,3,6);histogram(data2,binWidths(3));title('n=50,binWidth=2');xlabel('Value');ylabel('Frequency');%對(duì)于樣本量n=100subplot(3,3,7);histogram(data3,binWidths(1));title('n=100,binWidth=0.5');xlabel('Value');ylabel('Frequency');subplot(3,3,8);histogram(data3,binWidths(2));title('n=100,binWidth=1');xlabel('Value');ylabel('Frequency');subplot(3,3,9);histogram(data3,binWidths(3));title('n=100,binWidth=2');xlabel('Value');ylabel('Frequency');單元測(cè)驗(yàn)四1.單選題:為了檢驗(yàn)連續(xù)變量x,y之間的線(xiàn)性關(guān)系,下列哪種圖最合適?

選項(xiàng):

A、散點(diǎn)圖

B、條形圖

C、直方圖

D、都不對(duì)

答案:【散點(diǎn)圖】2.單選題:具有對(duì)數(shù)據(jù)橫坐標(biāo)自動(dòng)排序的繪圖命令是()

選項(xiàng):

A、boxplot

B、scatter

C、hist

D、pareto

答案:【pareto】3.單選題:以下能實(shí)現(xiàn)綠色實(shí)心圓數(shù)據(jù)標(biāo)記的散點(diǎn)圖的命令是()

選項(xiàng):

A、scatter(x,y);

B、scatter(x,y,'r.');

C、scatter(x,y,'g.');

D、scatter(x,y,'gx');

答案:【scatter(x,y,'g.');】4.單選題:以下指標(biāo)中,不屬于在箱線(xiàn)圖中能反映的是()

選項(xiàng):

A、最大值

B、中位數(shù)

C、四分位數(shù)

D、平均值

答案:【平均值】5.單選題:下列命令中,不能繪制三維圖形的是

選項(xiàng):

A、histgram2

B、plot3

C、surf

D、meshgrid

答案:【meshgrid】6.單選題:下列程序運(yùn)行后,看到的圖形是()[X,Y,Z]=peaks(30);x=X(1,:);y=Y(:,1);i=find(y>.8&y<1.2);j=find(x>-.6&x<.5);Z(i,j)=nan;surf(X,Y,Z)

選項(xiàng):

A、中間被“切除”矩形區(qū)域的圖形

B、中間被“切除”圓形區(qū)域的圖形

C、中間被“切除”環(huán)形區(qū)域的圖形

D、中間被“切除”三角形區(qū)域的圖形

答案:【中間被“切除”矩形區(qū)域的圖形】7.單選題:在圖形指定位置(x,y)加標(biāo)注的命令是

選項(xiàng):

A、title(x,y,'y=sin(x)');

B、text(x,y,'y=sin(x)');

C、legend(x,y,'y=sin(x)');

D、xlable(x,y,'y=sin(x)');

答案:【text(x,y,'y=sin(x)');】8.單選題:要使函數(shù)y=2e^x的曲線(xiàn)繪制成直線(xiàn),應(yīng)采用的繪圖函數(shù)是

選項(xiàng):

A、plot

B、semilogy

C、semilogx

D、loglog

答案:【semilogy】9.單選題:畫(huà)出帶光照模式的三維曲面圖應(yīng)使用()函數(shù)

選項(xiàng):

A、surf

B、mesh

C、surfc

D、surfl

答案:【surfl】10.單選題:繪制函數(shù)圖應(yīng)使用()函數(shù)。

選項(xiàng):

A、ezplot

B、fplot

C、ezpolar

D、stem

答案:【fplot】11.單選題:subplot(2,2,2)命令繪制的是以下哪一個(gè)位置的子圖?

選項(xiàng):

A、兩行兩列的左下角

B、兩行兩列的右下角

C、兩行兩列的左上角

D、兩行兩列的右上角

答案:【兩行兩列的右上角】數(shù)據(jù)探索性分析單元測(cè)驗(yàn)五1.單選題:下面哪個(gè)不屬于數(shù)據(jù)的屬性類(lèi)型

選項(xiàng):

A、標(biāo)稱(chēng)

B、序數(shù)

C、區(qū)間

D、相異

答案:【相異】2.單選題:下面不屬于創(chuàng)建新屬性的相關(guān)方法的是

選項(xiàng):

A、特征提取

B、特征修改

C、映射數(shù)據(jù)到新空間

D、特征構(gòu)造

答案:【特征修改】3.單選題:以下不屬于數(shù)據(jù)標(biāo)準(zhǔn)化的方法是

選項(xiàng):

A、差分運(yùn)算規(guī)范化

B、最小最大規(guī)范化

C、零-均值規(guī)范化

D、小數(shù)定標(biāo)規(guī)范化

答案:【差分運(yùn)算規(guī)范化】4.單選題:以下關(guān)于相對(duì)數(shù)的表述,不正確的是

選項(xiàng):

A、以“元/人”為單位表示的人均國(guó)內(nèi)生產(chǎn)總值表征了強(qiáng)度相對(duì)數(shù)

B、不同地區(qū)的投資與消費(fèi)比例表征了比例相對(duì)數(shù)

C、某產(chǎn)品的抽檢合格率是結(jié)構(gòu)相對(duì)數(shù)

D、增長(zhǎng)速度是動(dòng)態(tài)相對(duì)數(shù)的表征

答案:【不同地區(qū)的投資與消費(fèi)比例表征了比例相對(duì)數(shù)】5.單選題:以下關(guān)于抗性分析的表述,不正確的是

選項(xiàng):

A、極差反映了數(shù)據(jù)的集中趨勢(shì)

B、方差反映了離中趨勢(shì)

C、偏態(tài)分析屬于分布分析

D、統(tǒng)計(jì)直方圖是頻度分析的一種呈現(xiàn)形式

答案:【極差反映了數(shù)據(jù)的集中趨勢(shì)】6.單選題:以下關(guān)于數(shù)據(jù)探索性分析的表述,不正確的是

選項(xiàng):

A、抗性分析是指分析數(shù)據(jù)對(duì)局部不良的敏感性

B、殘差分析是分析因變量的觀測(cè)值與根據(jù)估計(jì)的方程求出的預(yù)測(cè)值的差距

C、模式發(fā)現(xiàn)是指通過(guò)分析發(fā)現(xiàn)數(shù)據(jù)中潛在的新的模式,不需要對(duì)數(shù)據(jù)降維

D、重新表達(dá)是指找到合適的尺度或數(shù)據(jù)表達(dá)方式進(jìn)行一定的轉(zhuǎn)換,使得有利于簡(jiǎn)化分析

答案:【模式發(fā)現(xiàn)是指通過(guò)分析發(fā)現(xiàn)數(shù)據(jù)中潛在的新的模式,不需要對(duì)數(shù)據(jù)降維】7.單選題:以下原因不屬于導(dǎo)致數(shù)據(jù)缺失的可能原因是

選項(xiàng):

A、信息獲取代價(jià)太大而未能獲取

B、人為原因錄入錯(cuò)誤

C、采集設(shè)備故障

D、邏輯上不存在,例如兒童的收入

答案:【人為原因錄入錯(cuò)誤】8.單選題:進(jìn)行數(shù)據(jù)離散化的原因不包括

選項(xiàng):

A、增加算大模型的魯棒性

B、減少實(shí)際的運(yùn)算量

C、簡(jiǎn)化算法模型的復(fù)雜度

D、增強(qiáng)數(shù)據(jù)集特征取值的可解釋性

答案:【增強(qiáng)數(shù)據(jù)集特征取值的可解釋性】9.單選題:在一個(gè)數(shù)據(jù)集中發(fā)現(xiàn)班級(jí)人數(shù)出現(xiàn)了少量的缺失,下列處理方法中不合理的是

選項(xiàng):

A、刪除具有NA值的行

B、使用眾數(shù)填充缺失數(shù)據(jù)

C、使用中位數(shù)填充缺失數(shù)據(jù)

D、使用平均數(shù)填充缺失數(shù)據(jù)

答案:【使用平均數(shù)填充缺失數(shù)據(jù)】10.單選題:下列哪一項(xiàng)說(shuō)明了X,Y之間的較強(qiáng)關(guān)系?

選項(xiàng):

A、相關(guān)系數(shù)為0.9

B、Beta系數(shù)為0的空假設(shè)的p-value是0.0001

C、Beta系數(shù)為0的空假設(shè)的t統(tǒng)計(jì)量是30

D、都不對(duì)

答案:【相關(guān)系數(shù)為0.9】單元作業(yè)五1.鳶尾花數(shù)據(jù)集是Matlab軟件中自帶的一個(gè)經(jīng)典數(shù)據(jù)集。數(shù)據(jù)集中包含不同品種的花的四個(gè)形狀指標(biāo):萼片長(zhǎng)度、萼片寬度、花瓣長(zhǎng)度、花瓣寬度。在Matlab中使用loadfisheriris命令加載數(shù)據(jù)集后,編寫(xiě)程序計(jì)算如下問(wèn)題:1)按species分離不同類(lèi)別的樣本;2)計(jì)算各類(lèi)別中4個(gè)指標(biāo)的均值、方差、標(biāo)準(zhǔn)差、偏度、峰度等;3)作出個(gè)指標(biāo)數(shù)據(jù)直方圖并檢驗(yàn)該數(shù)據(jù)是否服從正態(tài)分布。

參考答案:%加載鳶尾花數(shù)據(jù)集loadfisheriris;%(1)按species分離不同類(lèi)別的樣本setosa=meas(strcmp(species,'setosa'),:);versicolor=meas(strcmp(species,'versicolor'),:);virginica=meas(strcmp(species,'virginica'),:);%(2)計(jì)算各類(lèi)別中4個(gè)指標(biāo)的均值、方差、標(biāo)準(zhǔn)差、偏度、峰度等%對(duì)于setosa類(lèi)別setosa_mean=mean(setosa);setosa_var=var(setosa);setosa_std=std(setosa);setosa_skewness=skewness(setosa);setosa_kurtosis=kurtosis(setosa);%對(duì)于versicolor類(lèi)別versicolor_mean=mean(versicolor);versicolor_var=var(versicolor);versicolor_std=std(versicolor);versicolor_skewness=skewness(versicolor);versicolor_kurtosis=kurtosis(versicolor);%對(duì)于virginica類(lèi)別virginica_mean=mean(virginica);virginica_var=var(virginica);virginica_std=std(virginica);virginica_skewness=skewness(virginica);virginica_kurtosis=kurtosis(virginica);%輸出結(jié)果disp('Setosa類(lèi)別的統(tǒng)計(jì)信息:');disp(['均值:'num2str(setosa_mean)]);disp(['方差:'num2str(setosa_var)]);disp(['標(biāo)準(zhǔn)差:'num2str(setosa_std)]);disp(['偏度:'num2str(setosa_skewness)]);disp(['峰度:'num2str(setosa_kurtosis)]);disp('Versicolor類(lèi)別的統(tǒng)計(jì)信息:');disp(['均值:'num2str(versicolor_mean)]);disp(['方差:'num2str(versicolor_var)]);disp(['標(biāo)準(zhǔn)差:'num2str(versicolor_std)]);disp(['偏度:'num2str(versicolor_skewness)]);disp(['峰度:'num2str(versicolor_kurtosis)]);disp('Virginica類(lèi)別的統(tǒng)計(jì)信息:');disp(['均值:'num2str(virginica_mean)]);disp(['方差:'num2str(virginica_var)]);disp(['標(biāo)準(zhǔn)差:'num2str(virginica_std)]);disp(['偏度:'num2str(virginica_skewness)]);disp(['峰度:'num2str(virginica_kurtosis)]);%(3)作出各指標(biāo)數(shù)據(jù)直方圖并檢驗(yàn)該數(shù)據(jù)是否服從正態(tài)分布%使用subplot繪制直方圖并進(jìn)行正態(tài)性檢驗(yàn)figure;%對(duì)于setosa類(lèi)別subplot(3,4,1);histogram(setosa(:,1));title('Setosa萼片長(zhǎng)度直方圖');[h,p]=lillietest(setosa(:,1));disp(['Setosa萼片長(zhǎng)度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);subplot(3,4,2);histogram(setosa(:,2));title('Setosa萼片寬度直方圖');[h,p]=lillietest(setosa(:,2));disp(['Setosa萼片寬度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);subplot(3,4,3);histogram(setosa(:,3));title('Setosa花瓣長(zhǎng)度直方圖');[h,p]=lillietest(setosa(:,3));disp(['Setosa花瓣長(zhǎng)度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);subplot(3,4,4);histogram(setosa(:,4));title('Setosa花瓣寬度直方圖');[h,p]=lillietest(setosa(:,4));disp(['Setosa花瓣寬度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);%對(duì)于versicolor類(lèi)別subplot(3,4,5);histogram(versicolor(:,1));title('Versicolor萼片長(zhǎng)度直方圖');[h,p]=lillietest(versicolor(:,1));disp(['Versicolor萼片長(zhǎng)度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);subplot(3,4,6);histogram(versicolor(:,2));title('Versicolor萼片寬度直方圖');[h,p]=lillietest(versicolor(:,2));disp(['Versicolor萼片寬度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);subplot(3,4,7);histogram(versicolor(:,3));title('Versicolor花瓣長(zhǎng)度直方圖');[h,p]=lillietest(versicolor(:,3));disp(['Versicolor花瓣長(zhǎng)度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);subplot(3,4,8);histogram(versicolor(:,4));title('Versicolor花瓣寬度直方圖');[h,p]=lillietest(versicolor(:,4));disp(['Versicolor花瓣寬度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);%對(duì)于virginica類(lèi)別subplot(3,4,9);histogram(virginica(:,1));title('Virginica萼片長(zhǎng)度直方圖');[h,p]=lillietest(virginica(:,1));disp(['Virginica萼片長(zhǎng)度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);subplot(3,4,10);histogram(virginica(:,2));title('Virginica萼片寬度直方圖');[h,p]=lillietest(virginica(:,2));disp(['Virginica萼片寬度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);subplot(3,4,11);histogram(virginica(:,3));title('Virginica花瓣長(zhǎng)度直方圖');[h,p]=lillietest(virginica(:,3));disp(['Virginica花瓣長(zhǎng)度正態(tài)性檢驗(yàn)的p值:'num2str(p)]);subplot(3,4,12);histogram(virginica(:,4));title('Virginica花瓣寬度直方圖');[h,p]=lillietest(virginica(:,4));disp(['Virginica花瓣寬度直方圖正態(tài)性檢驗(yàn)的p值:'num2str(p)]);2.二手汽車(chē)交易是現(xiàn)代社會(huì)的一大需求。二手汽車(chē)交易過(guò)程中,車(chē)齡以及行駛里程數(shù)等都是影響二手汽車(chē)價(jià)格的重要因素。附件提供了一個(gè)二手汽車(chē)交易數(shù)據(jù)集,包含6項(xiàng)特征:price(價(jià)格)、mileage(已行駛英里數(shù))、year(上市年份)、trim(檔次)、engine(發(fā)動(dòng)機(jī)氣缸數(shù))、transmission(換擋方式)。由于數(shù)據(jù)是從許多小廣告中采集并手工錄入的,難免出現(xiàn)異常。請(qǐng)結(jié)合課程內(nèi)容,對(duì)數(shù)據(jù)集進(jìn)行離群值檢測(cè)。

參考答案:%讀取數(shù)據(jù)集data=readtable('car_data.csv');%提取需要分析的數(shù)值型特征price=data.price;mileage=eage;year=data.year;%計(jì)算Z-scorezscore_price=(price-mean(price))/std(price);zscore_mileage=(mileage-mean(mileage))/std(mileage);zscore_year=(year-mean(year))/std(year);%設(shè)定Z-score的閾值,通常取3或-3threshold=3;%找出離群值outliers_price=abs(zscore_price)>threshold;outliers_mileage=abs(zscore_mileage)>threshold;outliers_year=abs(zscore_year)>threshold;%顯示離群值disp('價(jià)格中的離群值:');disp(find(outliers_price));disp('里程數(shù)中的離群值:');disp(find(outliers_mileage));disp('上市年份中的離群值:');disp(find(outliers_year));%可視化離群值figure;%價(jià)格的箱線(xiàn)圖subplot(3,1,1);boxplot(price);title('價(jià)格的箱線(xiàn)圖');%里程數(shù)的箱線(xiàn)圖subplot(3,1,2);boxplot(mileage);title('里程數(shù)的箱線(xiàn)圖');%上市年份的箱線(xiàn)圖subplot(3,1,3);boxplot(year);title('上市年份的箱線(xiàn)圖');%標(biāo)記離群值在原始數(shù)據(jù)中的位置holdon;%價(jià)格的離群值plot(find(outliers_price),price(outliers_price),'ro');%里程數(shù)的離群值plot(find(outliers_mileage),mileage(outliers_mileage),'go');%上市年份的離群值plot(find(outliers_year),year(outliers_year),'bo');holdoff;數(shù)據(jù)回歸單元測(cè)驗(yàn)六1.單選題:在回歸分析中,用來(lái)預(yù)測(cè)或用來(lái)解釋另一個(gè)變量的一個(gè)或多個(gè)變量稱(chēng)為()。

選項(xiàng):

A、隨機(jī)變量

B、因變量

C、非隨機(jī)變量

D、自變量

答案:【自變量】2.單選題:MATLAB中創(chuàng)建非線(xiàn)性回歸模型的函數(shù)是()。

選項(xiàng):

A、fitlm

B、fitnlm

C、regress

D、polyfit

答案:【fitnlm】3.單選題:()屬于機(jī)器學(xué)習(xí)中的回歸問(wèn)題。

選項(xiàng):

A、根據(jù)房屋特性預(yù)測(cè)房?jī)r(jià)

B、預(yù)測(cè)短信是否為垃圾短信

C、識(shí)別車(chē)牌

D、機(jī)場(chǎng)安檢人臉識(shí)別

答案:【根據(jù)房屋特性預(yù)測(cè)房?jī)r(jià)】4.單選題:若每一噸鑄鐵成本y(元)與鑄件廢品率x%建立的回歸方程y=56+8x,下列說(shuō)法正確的是()。

選項(xiàng):

A、廢品率每增加1%,成本每噸增加64元

B、廢品率每增加1%,成本每噸增加8%

C、廢品率每增加1%,成本每噸增加8元

D、廢品率每增加1%,成本每噸增加56元

答案:【廢品率每增加1%,成本每噸增加8元】5.單選題:在線(xiàn)性回歸方程y=a+bx中,回歸系數(shù)b表示()。

選項(xiàng):

A、當(dāng)x=0時(shí),y的平均值

B、x變動(dòng)一個(gè)單位時(shí),y的實(shí)際變動(dòng)量

C、y變動(dòng)一個(gè)單位時(shí),x的平均變動(dòng)量

D、x變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)量

答案:【x變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)量】6.單選題:下列兩個(gè)變量之間的關(guān)系,哪個(gè)是函數(shù)關(guān)系?

選項(xiàng):

A、學(xué)生的性別與數(shù)學(xué)成績(jī)

B、人的工作環(huán)境與健康狀況

C、正方形的邊長(zhǎng)與面積

D、兒子的身高與父親的身高

答案:【正方形的邊長(zhǎng)與面積】7.單選題:在兩個(gè)變量的回歸分析中,作散點(diǎn)圖是為了()。

選項(xiàng):

A、直接求出回歸直線(xiàn)方程

B、直接求出回歸方程

C、根據(jù)經(jīng)驗(yàn)選定回歸方程的類(lèi)型

D、估計(jì)回歸方程的參數(shù)

答案:【根據(jù)經(jīng)驗(yàn)選定回歸方程的類(lèi)型】8.單選題:已知變量x與y正相關(guān),且由觀測(cè)數(shù)據(jù)算得x的樣本平均值為3,y的樣本平均值為3.5,則由該觀測(cè)數(shù)據(jù)算得的線(xiàn)性回歸方程可能是()。

選項(xiàng):

A、y=0.4x+2.3

B、y=2x-2.4

C、y=-2x+9.5

D、y=-0.3x+4.4

答案:【y=0.4x+2.3】9.多選題:下列說(shuō)法正確的是()。

選項(xiàng):

A、當(dāng)變量之間的相關(guān)關(guān)系不是線(xiàn)性關(guān)系時(shí),也能描述變量之間的相關(guān)關(guān)系

B、當(dāng)變量之間的相關(guān)關(guān)系不是線(xiàn)性關(guān)系時(shí),也能直接用線(xiàn)性回歸方程描述它們的相關(guān)關(guān)系

C、把非線(xiàn)性回歸化為線(xiàn)性回歸為我們解決問(wèn)題提供了一種方法

D、當(dāng)變量之間的相關(guān)關(guān)系不是線(xiàn)性關(guān)系時(shí),可以通過(guò)適當(dāng)?shù)淖儞Q使其轉(zhuǎn)換為線(xiàn)性關(guān)系

答案:【當(dāng)變量之間的相關(guān)關(guān)系不是線(xiàn)性關(guān)系時(shí),也能描述變量之間的相關(guān)關(guān)系;當(dāng)變量之間的相關(guān)關(guān)系不是線(xiàn)性關(guān)系時(shí),也能直接用線(xiàn)性回歸方程描述它們的相關(guān)關(guān)系;把非線(xiàn)性回歸化為線(xiàn)性回歸為我們解決問(wèn)題提供了一種方法;當(dāng)變量之間的相關(guān)關(guān)系不是線(xiàn)性關(guān)系時(shí),可以通過(guò)適當(dāng)?shù)淖儞Q使其轉(zhuǎn)換為線(xiàn)性關(guān)系】10.多選題:下列結(jié)論正確的是()。

選項(xiàng):

A、函數(shù)關(guān)系是一種確定性關(guān)系

B、相關(guān)關(guān)系是一種非確定性關(guān)系

C、回歸分析是對(duì)具有函數(shù)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種方法

D、回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種方法

答案:【函數(shù)關(guān)系是一種確定性關(guān)系;相關(guān)關(guān)系是一種非確定性關(guān)系;回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的一種方法】單元作業(yè)六1.讀取附件提供的數(shù)據(jù)集。將數(shù)據(jù)集中的24個(gè)樣本拆分成訓(xùn)練集和測(cè)試集,其中訓(xùn)練集18個(gè),測(cè)試集6個(gè)。使用訓(xùn)練集建立多個(gè)自變量x1—x5和因變量y之間的多元線(xiàn)性回歸模型。分別計(jì)算該模型在訓(xùn)練集和測(cè)試集上的均方根誤差(RMSE)并輸出。

(1)拆分?jǐn)?shù)據(jù)集,2分;(2)建立多元線(xiàn)性回歸模型,4分;(3)計(jì)算均方根誤差值,4分。2.讀取附件提供的數(shù)據(jù)集,第一列為自變量,第二列為因變量。使用MATLAB建立一元線(xiàn)性回歸模型,并做回歸診斷,去除異常值后重新建立回歸模型,并自行繪圖比較前后結(jié)果(要求:將去除異常值前后的回歸直線(xiàn)繪制在一個(gè)圖中)。

(1)建立回歸模型,2分;(2)回歸診斷去除異常值,4分;(3)繪圖比較,4分。數(shù)據(jù)分類(lèi)單元作業(yè)七1.下載bankpep數(shù)據(jù)集,使用MATLAB的分類(lèi)工具箱進(jìn)行分析,實(shí)現(xiàn)如下要求。(1)數(shù)據(jù)集共12列特征,在前11列中選擇適合的特征用于預(yù)測(cè)最后一列的pep特征;(2)使用MATLAB分類(lèi)工具箱,選擇適合的分類(lèi)模型創(chuàng)建分類(lèi)器。(提示:可運(yùn)行多種分類(lèi)器后選擇其中效果最好的模型)(3)將選定分類(lèi)模型結(jié)果的混淆矩陣截圖,并分別計(jì)算準(zhǔn)確率、精確率、召回率和F1,輸出評(píng)估結(jié)果。

(1)2分(2)2分(3)6分。其中:混淆矩陣結(jié)果2分,四個(gè)評(píng)估指標(biāo)每個(gè)1分。2.使用MATLAB自帶的fisheriris數(shù)據(jù)集,編程實(shí)現(xiàn)如下要求。(1)去除setosa類(lèi)別數(shù)據(jù),保留virginica和versicolor兩類(lèi)數(shù)據(jù)。(2)將兩類(lèi)數(shù)據(jù),共100個(gè)樣本拆分成訓(xùn)練集和測(cè)試集,拆分比例為8:2,即80個(gè)樣本用于訓(xùn)練,20個(gè)樣本用于測(cè)試。(提示:不同類(lèi)別的樣本分別拆分)(3)使用訓(xùn)練集數(shù)據(jù)建立SVM分類(lèi)器模型,并應(yīng)用測(cè)試集數(shù)據(jù)進(jìn)行測(cè)試。輸出準(zhǔn)確率。(注意:答案不唯一,算法流程正確即可)

(1)2分;(2)4分;(3)4分。3.使用MATLAB自帶的fisheriris數(shù)據(jù)集的全部樣本數(shù)據(jù),分別采用K=1和K=4建立兩個(gè)KNN模型。設(shè)有一個(gè)新樣本[5.9,3.2,4.8,1.8](注意樣本特征順序與原始數(shù)據(jù)集相同),使用兩個(gè)模型分別預(yù)測(cè)該新樣本的類(lèi)別。要求提交代碼和運(yùn)行結(jié)果。

加載數(shù)據(jù)集1分,創(chuàng)建模型2分,預(yù)測(cè)結(jié)果2分。單元測(cè)驗(yàn)七1.單選題:有關(guān)KNN算法,說(shuō)法正確的是?

選項(xiàng):

A、K的選擇對(duì)分類(lèi)結(jié)果影響很小

B、計(jì)算距離只能采用歐氏距離

C、KNN算法的計(jì)算復(fù)雜度較低

D、KNN算法中的K通常選擇較小的值

答案:【KNN算法中的K通常選擇較小的值】2.單選題:以下不屬于分類(lèi)算法的是?

選項(xiàng):

A、K近鄰

B、支持向量機(jī)

C、樸素貝葉斯

D、K-means

答案:【K-means】3.單選題:以下不屬于分類(lèi)問(wèn)題的是?

選項(xiàng):

A、判斷一個(gè)腫瘤是良性還是惡性

B、預(yù)測(cè)某人某月的信用卡消費(fèi)金額

C、判斷一個(gè)網(wǎng)頁(yè)新聞屬于什么類(lèi)型

D、預(yù)測(cè)兩個(gè)人是否會(huì)成為朋友

答案:【預(yù)測(cè)某人某月的信用卡消費(fèi)金額】4.單選題:混淆矩陣中的TP=16,F(xiàn)P=12,F(xiàn)N=8,TN=4,精確率是()

選項(xiàng):

A、1/4

B、1/2

C、4/7

D、2/3

答案:【4/7】5.單選題:給定一定數(shù)量的紅細(xì)胞、白細(xì)胞圖像以及它們對(duì)應(yīng)的標(biāo)簽,設(shè)計(jì)出一個(gè)紅、白細(xì)胞分類(lèi)器,這屬于什么問(wèn)題?

選項(xiàng):

A、有監(jiān)督學(xué)習(xí)

B、半監(jiān)督學(xué)習(xí)

C、無(wú)監(jiān)督學(xué)習(xí)

D、其他答案都正確

答案:【有監(jiān)督學(xué)習(xí)】6.單選題:利用混淆矩陣計(jì)算召回率的公式是()

選項(xiàng):

A、TP/(TP+FN)

B、(TP+TN)/(TP+TN+FP+FN)

C、都不對(duì)

D、TP/(TP+FP)

答案:【TP/(TP+FN)】7.單選題:混淆矩陣中FN(FalseNegative)的含義是?

選項(xiàng):

A、將負(fù)樣本識(shí)別為負(fù)樣本的數(shù)量(或概率)

B、將正樣本識(shí)別為負(fù)樣本的數(shù)量(或概率)

C、將負(fù)樣本識(shí)別為正樣本的數(shù)量(或概率)

D、將正樣本識(shí)別為正樣本的數(shù)量(或概率)

答案:【將正樣本識(shí)別為負(fù)樣本的數(shù)量(或概率)】8.單選題:假設(shè)您正在使用垃圾郵件分類(lèi)器,其中垃圾郵件是正例(y=1),非垃圾郵件是反例(y=0)。您有一組電子郵件訓(xùn)練集,其中99%的電子郵件是非垃圾郵件,另1%是垃圾郵件。以下哪項(xiàng)陳述是錯(cuò)誤的?

選項(xiàng):

A、一個(gè)好的分類(lèi)器應(yīng)該在交叉驗(yàn)證集上同時(shí)具有高精度precision和高召回率recall。

B、如果您總是預(yù)測(cè)非垃圾郵件(輸出y=0),那么您的分類(lèi)器在訓(xùn)練集上的準(zhǔn)確度accuracy將達(dá)到99%,而且它在交叉驗(yàn)證集上的性能可能類(lèi)似。

C、如果您總是預(yù)測(cè)非垃圾郵件(輸出y=0),那么您的分類(lèi)器的準(zhǔn)確度accuracy將達(dá)到99%。

D、如果您總是預(yù)測(cè)非垃圾郵件(輸出y=0),那么您的分類(lèi)器在訓(xùn)練集上的準(zhǔn)確度accuracy將達(dá)到99%,但在交叉驗(yàn)證集上的準(zhǔn)確率會(huì)更差,因?yàn)樗^(guò)擬合訓(xùn)練數(shù)據(jù)。

答案:【一個(gè)好的分類(lèi)器應(yīng)該在交叉驗(yàn)證集上同時(shí)具有高精度precision和高召回率recall?!?.單選題:ROC曲線(xiàn)越靠近左上角說(shuō)明分類(lèi)器的效果越好。

選項(xiàng):

A、正確

B、錯(cuò)誤

答案:【正確】10.單選題:支持向量機(jī)只能解決數(shù)據(jù)線(xiàn)性可分的問(wèn)題。

選項(xiàng):

A、正確

B、錯(cuò)誤

答案:【錯(cuò)誤】數(shù)據(jù)聚類(lèi)單元測(cè)驗(yàn)八1.單選題:應(yīng)用K均值算法之前,特征縮放是一個(gè)很重要的步驟。原因是

選項(xiàng):

A、在距離計(jì)算中,它為所有特征賦予相同的權(quán)重

B、不管你用不用特征縮放,你總是會(huì)得到相同的簇

C、在Manhattan距離中,這是重要的步驟,但是Euclidian中則不是

D、以上都不是

答案:【在距離計(jì)算中,它為所有特征賦予相同的權(quán)重】2.單選題:在系統(tǒng)聚類(lèi)中是

選項(xiàng):

A、組內(nèi)離差平方和除以組間離差平方和

B、組間離差平方和除以組內(nèi)離差平方和

C、組間離差平方和除以總離差平方和

D、組間均方除以總均方

答案:【組間離差平方和除以總離差平方和】3.單選題:使用層次聚類(lèi)算法對(duì)同一個(gè)數(shù)據(jù)集進(jìn)行分析,生成兩個(gè)不同的樹(shù)形圖有哪些可能的原因

選項(xiàng):

A、距離函數(shù)的選

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論