獨立性檢驗與回歸方程14類題型(原卷版)_第1頁
獨立性檢驗與回歸方程14類題型(原卷版)_第2頁
獨立性檢驗與回歸方程14類題型(原卷版)_第3頁
獨立性檢驗與回歸方程14類題型(原卷版)_第4頁
獨立性檢驗與回歸方程14類題型(原卷版)_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

專題8-6獨立性檢驗與回歸方程14類題型

題型?歸納

題四=皿性檢驗

ms獨立性檢驗與超幾何分布

獨立性檢驗與二項式分布

題園因獨立性檢驗與正態(tài)分布

ms樣本中心的計算及應(yīng)用

題園施相關(guān)系數(shù)的計算

求線性回歸直線方程(結(jié)合相關(guān)系數(shù)與二項式分布,超幾何分布,正態(tài)分布)

題因小殘差分析

題色宛相關(guān)指數(shù)

題四#求非線性回歸方程:幕函數(shù)方程擬合

題因令。求非線性回歸方程:指數(shù)函數(shù)方程擬合

題包中3求非線性回歸方程:對數(shù)函數(shù)方程擬合

題色令且回歸方程與獨立性檢驗

題園#畫相關(guān)系數(shù)與獨立性檢驗

I知識點.梳理

獨立性檢驗

1.獨立性檢驗的基本步驟

(1)提出零假設(shè)Ho:X和Y相互獨立(即X和Y無關(guān))

(2)根據(jù)2x2聯(lián)表給出的數(shù)據(jù)算出力2=7-y)_二(其中〃=a+6+c+d),得到隨機變

(a+Z?)(c+d)(a+c)(b+d)

量/2,并與臨界值均比較.

(3)根據(jù)實際問題需要的可信程度(小概率值a)確定臨界值勺"X與Y有關(guān)系”,這種推斷犯錯誤的概率

不超過「(片2月)x100%,即H。成立;否則就說沒有[1—2(片2/)]義100%的把握認為“X與Y有關(guān)

系”,即Ho不成立.

(4)下表給出了產(chǎn)獨立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值

a0.10.050.010.0050.001

2.7063.8416.6357.87910.828

Xa

(5)臨界值

產(chǎn)統(tǒng)計量也可以用來作相關(guān)性的度量,/越小說明變量之間越獨立,/越大說明變量之間越相關(guān)

/V/V/V

.忽略/的實際分布與該近似分布的誤差后,對于任何小概率值a

n^ad-be)2/V

2

z(a+b)(c+d)(a+c)(b+d)

可以找到相應(yīng)的正實數(shù),使得田2、\成立,我們稱丫為a的臨界值,這個臨界值就可作為判

P(Z%

斷大小的標準.

/V

線性回歸方程

解答線性回歸問題,應(yīng)通過散點圖來分析兩變量間的關(guān)系是否線性相關(guān),然后再利用求回歸方程的公式求

解回歸方程,并利用殘差圖來分析函數(shù)模型的擬合效果,在此基礎(chǔ)上,借助回歸方程對實際問題進行分析.

最小二乘法

AAA

將〉=云+”稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線,

這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求得的6,。叫做6,。的最小二乘估計,其中

n__n/_y_\?a=>—"X?

EXiyi-nxyXL-山-W

b=^l_________=

Z=l!=1

回歸模型的處理方法

森函數(shù)型:y=axn(〃為常數(shù),a,x,y均取正值),兩邊取常用對數(shù)Igy=lg(or"),即/gy=〃/gx+/ga,

令y'=igy,v=igx,原方程變?yōu)閥=?%'+/ga,然后按線型回歸模型求出〃,iga.

指數(shù)函數(shù)方程:1.直接設(shè)指數(shù)求解;2.取對數(shù)化簡,再設(shè)對數(shù)求解

對數(shù)函數(shù)方程:1.直接設(shè)對數(shù)求解;2.對指數(shù)型取對數(shù)

殘差與殘差分析

(1)殘差

A

對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗回歸方程得到的y稱為預(yù)測值,觀測值減去預(yù)

測值稱為殘差.

(2)殘差分析

殘差是隨機誤差的估計結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否

存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.通過觀察殘差圖可以直觀判斷模型是否滿足一元線性回歸模

型中對隨機誤差的假設(shè),那殘差應(yīng)是均值為0,方差為。2的隨機變量的觀測值.

(3)殘差計算思路:先求出回歸方程y=Zw+a(b,。直接套公式即可),然后把表格中每一個尤值通過方

程算出對應(yīng)的每一個y值,最后與表格中的y值對應(yīng)相減即可。數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差異

y—月是隨機誤差的效應(yīng),稱a=y一其為殘差

殘差計算公式:實際觀察值與估計值(擬合值)之間的差

(4)殘差圖

作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數(shù)據(jù),或體重估計值等,這樣作出的圖形稱為殘

差圖.在殘差圖中,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)

域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報精度越高.

(5)殘差平方和法

殘差平方和X(%—月)2越小,模型的擬合效果越好.

i=l

(6)R2

£(%-獷

在回歸分析中,可以用氏2=1一與----------來刻畫回歸的效果,它表示解釋變量對于預(yù)報變量變化的貢獻

ZU-y)2

i=l

里,R2越接近于L表示回歸的效果越好.

E(x-x)2“_

模型的擬合效果用相關(guān)指數(shù)后來表示,R?=]_弋-------,表達式中,x(X—y)2與經(jīng)驗回歸方程

E(,y,-y)2,=1

i=l

_n_n

無關(guān),殘差平方和2(%一月)2與經(jīng)驗回歸方程有關(guān),因此,A?越大,意味著殘差平方和^(外一白了越

Z=1Z=1

小,即模型的擬合效果越好;R2越小,殘差平方和越大,即模型的擬合效果越差

注:決定系數(shù)A?與相關(guān)系數(shù)r的聯(lián)系與區(qū)別

①相關(guān)系數(shù)「反映兩個變量的相關(guān)關(guān)系的強弱及正相關(guān)或負相關(guān),決定系數(shù)R2反映回歸模型的擬合效果.

②在含有一個解釋變量的線性模型中,決定系數(shù)尺2的數(shù)值是相關(guān)系數(shù)r的平方,其變化范圍為[0,1],而相

關(guān)系數(shù)的變化范圍為[-1』].

③當相關(guān)系數(shù)|川接近于1時,說明兩變量的相關(guān)性較強,當|廠|接近于。時,說明兩變量的相關(guān)性較弱;

而當《2接近于1時,說明經(jīng)驗回歸方程的擬合效果較好.

|重點題型?歸類精練

題因O獨立性檢驗

1.某校為了研究學(xué)生的性別和對待某一活動的態(tài)度(支持與不支持)的關(guān)系,運用2x2列聯(lián)表進行獨立性

檢驗.經(jīng)計算K2=6.058,則所得到的統(tǒng)計學(xué)結(jié)論是:有()的把握認為“學(xué)生性別與支持該活動有系”.

2

P(K>k0)0.1000.0500.0250.0100.001

2.7063.8415.0246.63510.828

A.0.025%B.1%C.97.5%D.99%

2.足球運動是深受學(xué)生喜愛的一項體育運動,為了研究是否喜愛足球運動與學(xué)生性別的關(guān)系,從某高校男

女生中各隨機抽取80名學(xué)生進行調(diào)查問卷,得到如下數(shù)據(jù)(104〃2420,〃zeN):

喜愛不喜愛

男生70-m10+m

女生50+m30—m

若有90%以上的把握認為是否喜愛足球運動與學(xué)生性別有關(guān),則機的最小值為()

n(ad-bc)舟上,,

附:/7-------丁」一w—--------r-其中n=a+b+c+a.

(a+6)(c+d)(a+c)(b+d)

a=P^x2>k^0.250.100.050.001

k2.0722.7063.8416.635

A.17B.15C.13D.11

3.“村BA”后,貴州“村超”又火出圈!所謂“村超”,其實是目前火爆全網(wǎng)的貴州鄉(xiāng)村體育賽事一一榕江(三

寶侗寨)和美鄉(xiāng)村足球超級聯(lián)賽,被大家簡稱為“村超”.“村超”的民族風(fēng)、鄉(xiāng)土味、歡樂感,讓每個人盡

情享受著足球帶來的快樂.

某校為了豐富學(xué)生課余生活,組建了足球社團.足球社團為了解學(xué)生喜歡足球是否與性別有關(guān),隨機抽取了

男、女同學(xué)各50名進行調(diào)查,部分數(shù)據(jù)如表所示:

喜歡足球不喜歡足球合計

男生20

女生15

合計100

2_n{ad-bc')2

(a+b)(c+d)(a+c)(b+d)

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

(1)根據(jù)所給數(shù)據(jù)完成上表,依據(jù)a=0.005的獨立性檢驗,能否有99.5%的把握認為該中學(xué)學(xué)生喜歡足球與

性別有關(guān)?

(2)社團指導(dǎo)老師從喜歡足球的學(xué)生中抽取了2名男生和1名女生示范定點射門.據(jù)統(tǒng)計,這兩名男生進球的

概率均為泉這名女生進球的概率為也每人射門一次,假設(shè)各人進球相互獨立,求3人進球總次數(shù)X的分布

列和數(shù)學(xué)期望.

題因M獨立性檢驗與超幾何分布

4.民族要復(fù)興,鄉(xiāng)村要振興,合作社助力鄉(xiāng)村產(chǎn)業(yè)振興,農(nóng)民專業(yè)合作社已成為新型農(nóng)業(yè)經(jīng)營主體和現(xiàn)代

農(nóng)業(yè)建設(shè)的中堅力量,為實施鄉(xiāng)村振興戰(zhàn)略作出了巨大的貢獻.已知某主要從事手工編織品的農(nóng)民專

業(yè)合作社共有100名編織工人,該農(nóng)民專業(yè)合作社為了鼓勵工人,決定對“編織巧手”進行獎勵,為研究

“編織巧手”是否與年齡有關(guān),現(xiàn)從所有編織工人中抽取40周歲以上(含40周歲)的工人24名,40周

歲以下的工人16名,得到的數(shù)據(jù)如表所示.

“編織巧手”非“編織巧手”總計

年齡%0歲19——

年齡〈40歲—10—

總計——40

(1)請完成答題卡上的2x2列聯(lián)表,并根據(jù)小概率值a=0.010的獨立性檢驗,分析“編織巧手”與“年齡”是否

有關(guān);

(2)為進一步提高編織效率,培養(yǎng)更多的“編織巧手”,該農(nóng)民專業(yè)合作社決定從上表中的非“編織巧手”的工

人中采用分層抽樣的方法抽取6人參加技能培訓(xùn),再從這6人中隨機抽取2人分享心得,求這2人中恰有1

人的年齡在40周歲以下的概率.

參考公式:X'gwTdi)其中〃=a+b+c+d.

參考數(shù)據(jù):

a0.1000.0500.0100.005

xa2.7063.8416.6357.879

5.2023年實行新課標新高考改革的省市共有29個,選科分類是高級中學(xué)在校學(xué)生生涯規(guī)劃的重要課題,

某高級中學(xué)為了解學(xué)生選科分類是否與性別有關(guān),在該校隨機抽取100名學(xué)生進行調(diào)查.統(tǒng)計整理數(shù)據(jù)

得到如下的2x2列聯(lián)表:

選物理類選歷史類合計

男生3515

女生2525

合計100

(1)依據(jù)小概率值a=0.05的獨立性檢驗,能否據(jù)此推斷選科分類與性別有關(guān)聯(lián)?

(2)在以上隨機抽取的女生中,按不同選擇類別同比例分層抽樣,共抽取6名女生進行問卷調(diào)查,然后在被

抽取的6名女生中再隨機抽取4名女生進行面對面訪談.設(shè)面對面訪談的女生中選擇歷史類的人數(shù)為隨機變

量X,求隨機變量X的分布列和數(shù)學(xué)期望.

附:—,其中?1一a+b+c+d.

(a+b)(c+d)(a+c)(b+d)

a0.100.050.0250.0100.0050.001

2.7063.8415.0246.6357.87910.828

6.2023年9月23日第19屆亞運會在杭州開幕,本屆亞運會共設(shè)40個競賽大項,包括31個奧運項目和9

個非奧運項目.為研究不同性別學(xué)生對杭州亞運會項目的了解情況,某學(xué)校進行了一次抽樣調(diào)查,分別

抽取男生和女生各50名作為樣本,設(shè)事件4="了解亞運會項目",B="學(xué)生為女生”,據(jù)統(tǒng)計

P(川B)=|,P(B|4)=|.

n(ad-bc)2

附:2

z(a+b)(c+d)(a+c)(b+d)'n=a+b+c+d.

a0.0500.0100.001

3.8416.63510.828

(1)根據(jù)已知條件,填寫下列2x2列聯(lián)表,并依據(jù)a=0.001的獨立性檢驗,能否認為該校學(xué)生對亞運會項目

的了解情況與性別有關(guān)?

了解不了解合計

男生

女生

合計

(2)現(xiàn)從該校了解亞運會項目的學(xué)生中,采用分層隨機抽樣的方法隨機抽取9名學(xué)生,再從這9名學(xué)生中隨

機抽取4人,設(shè)抽取的4人中男生的人數(shù)為X,求X的分布列和數(shù)學(xué)期望.

7.杭州第19屆亞運會又稱“2022年杭州亞運會”,是繼1990年北京亞運會、2010年廣州亞運會之后,中國

第三次舉辦亞洲最高規(guī)格的國際綜合性體育賽事.某高校部分學(xué)生十分關(guān)注杭州亞運會,若將累計關(guān)

注杭州亞運會賽事消息50次及以上的學(xué)生稱為“亞運會達人”,未達到50次的學(xué)生稱為“非亞運會達

人”.現(xiàn)從該校隨機抽取100名學(xué)生,得到數(shù)據(jù)如表所示:

亞運會達人非亞運會達人合計

男生4056

女生24

合計

(1)補全2x2列聯(lián)表,并判斷能否有99%的把握認為是否為“亞運會達人”與性別有關(guān)?

(2)現(xiàn)從樣本的“亞運會達人”中按性別采用分層抽樣的方法抽取6人,然后從這6人中隨機抽取3人,記這3

人中女生的人數(shù)為X,求X的分布列和數(shù)學(xué)期望.

n^ad-bc^

附:K2=n=a+b-\-c+d.

(〃+Z?)(c+d)(〃+c)(b+d)'

P(^K2>k)0.0500.0100.005

k3.8416.6357.879

題園且獨立性檢驗與二項式分布

8.2023年9月23日第19屆亞運會在中國杭州舉行,其中電子競技第一次列為正式比賽項目.某中學(xué)對該

校男女學(xué)生是否喜歡電子競技進行了調(diào)查,隨機調(diào)查了男女生人數(shù)各200人,得到如下數(shù)據(jù):

男生女生合計

喜歡120100220

不喜歡80100180

合計200200400

(1)根據(jù)表中數(shù)據(jù),采用小概率值c=0.05的獨立性檢驗,能否認為該校學(xué)生對電子競技的喜歡情況與性別有

關(guān)?

(2)為弄清學(xué)生不喜歡電子競技的原因,采用分層抽樣的方法從調(diào)查的不喜歡電子競技的學(xué)生中隨機抽取9

人,再從這9人中抽取3人進行面對面交流,求“至少抽到一名男生”的概率;

(3)將頻率視為概率,用樣本估計總體,從該校全體學(xué)生中隨機抽取10人,記其中對電子競技喜歡的人數(shù)為

X,求X的數(shù)學(xué)期望.

參考公式及數(shù)據(jù):力2=7-------------------------------------;其中“=o+Z>+c+d.

(a+b)(c+d)(a+c)(b+d)

a0.150.100.050.0250.01

Xa2.0722.7063.8415.0246.635

9.為學(xué)習(xí)貫徹中央農(nóng)村工作會議精神“強國必先強農(nóng),農(nóng)強方能國強”,某市在某村積極開展香菇種植,助

力鄉(xiāng)村振興.香菇的生產(chǎn)可能受場地、基料、水分、菌種等因素的影響,現(xiàn)已知香菇有菌種甲和菌種乙兩個

品種供挑選,菌種甲在溫度20。€2時產(chǎn)量為28噸/畝,在溫度30℃時產(chǎn)量為20噸/畝;菌種乙在溫度20℃

時產(chǎn)量為22噸/畝,在氣溫30C時產(chǎn)量為30噸/畝.

⑴請補充完整2x2列聯(lián)表,根據(jù)2義2列聯(lián)表和小概率值c=0.1的獨立性檢驗,判斷菌種甲、乙的產(chǎn)量與溫

度是否有關(guān)?

20℃30C合計

菌種甲

菌種乙

合計

(2)某村選擇菌種甲種植,已知菌種甲在氣溫為20。。時的發(fā)芽率為從菌種甲中任選3個,若設(shè)X為菌種

6

甲發(fā)芽的個數(shù),求X的分布列及數(shù)學(xué)期望.

n(ad-bc)2

附:參考公式:r=其中“=a+6+c+d.

(a+匕)(c+d)(“+c)(人+d),

臨界值表:

a0.100.050.01

Xa2.7063.8416.635

10.某市某部門為了了解全市中學(xué)生的視力情況,采用比例分配的分層隨機抽樣方法抽取了該市120名中

學(xué)生,已知該市中學(xué)生男女人數(shù)比例為7:5,他們的視力情況統(tǒng)計結(jié)果如表所示:

視力情況

性別合計

近視不近視

男生30

女生40

合計120

(1)請把表格補充完整,并根據(jù)小概率值a=0.01的獨立性檢驗,判斷近視是否與性別有關(guān);

(2)如果用這120名中學(xué)生中男生和女生近視的頻率分別代替該市中學(xué)生中男生和女生近視的概率,且每名

同學(xué)是否近視相互獨立.現(xiàn)從該市中學(xué)生中任選4人,設(shè)隨機變量X表示4人中近視的人數(shù),求X的分布

列及均值.

n(ad-bc)2

附:Z2其中n=a+b+c+d.

(a+b)(c+d)(a+c)(b+d)

a0.10.050.01

xa2.7063.8416.635

11

11.sinacos/?=5[sin(a+£)+sin(a—/7)],cosasin/?=&[sin(a+S)—sin(a—/?)],cosacos,=

|[cos(a+£)+cos(a-/?)],sinasin。=[cos(a+S)-cos(a-£)]這組公式被稱為積化和差公式,

最早正式發(fā)表于16世紀天文學(xué)家烏爾索斯1588年出版的《天文學(xué)基礎(chǔ)》一書中.在歷史上,對數(shù)出現(xiàn)

之前,積化和差公式被用來將乘除運算化為加減運算.在現(xiàn)代工程中,積化和差的重要應(yīng)用在于求解傅

里葉級數(shù).為了解學(xué)生掌握該組公式的情況,在高一、高三兩個年級中隨機抽取了100名學(xué)生進行考查,

其中高三年級的學(xué)生占,其他相關(guān)數(shù)據(jù)如下表:

合格不合格合計

高三年級的學(xué)生54

高一年級的學(xué)生16

合計100

(1)請完成2x2列聯(lián)表,依據(jù)小概率值a=0.001的獨立性檢驗,分析“對公式的掌握情況”與“學(xué)生所在年級”

是否有關(guān)?

(2)以頻率估計概率,從該校高一年級學(xué)生中抽取3名學(xué)生,記合格的人數(shù)為X,求X的分布列和數(shù)學(xué)期望.

2

附:產(chǎn)n(ad-bc')

(a+b)(c+d)(a+c)(b+d)'n=a+b+c+d

a0.1000.0500.0100.001

2.7063.8416.63510.828

12.隨著科技的發(fā)展,網(wǎng)絡(luò)已逐漸融入了人們的生活.網(wǎng)購是非常方便的購物方式,為了了解網(wǎng)購在我市

的普及情況,某調(diào)查機構(gòu)進行了有關(guān)網(wǎng)購的調(diào)查問卷,并從參與調(diào)查的市民中隨機抽取了男女各100人

進行分析,從而得到表(單位:人):

經(jīng)常網(wǎng)購偶爾或不用網(wǎng)購合計

男性45100

女性65100

合計

⑴完成如表;對于以上數(shù)據(jù),采用小概率值a=0.01的獨立性檢驗,能否認為我市市民網(wǎng)購與性別有

關(guān)聯(lián)?

(2)①現(xiàn)從所抽取的女市民中利用分層抽樣的方法抽取20人,再從這20人中隨機選取3人贈送優(yōu)惠券,求

選取的3人中至少有2人經(jīng)常網(wǎng)購的概率;

②將頻率視為概率,從我市所有參與調(diào)查的市民中隨機抽取20人贈送禮品,記其中經(jīng)常網(wǎng)購的人數(shù)為X,

求隨機變量X的數(shù)學(xué)期望和方差.

參考公式:參二鬻之示.常用的小概率值和對應(yīng)的臨界值如下表:

a0.1500.1000.0500.0250.0100.0050.001

xa2.0722.7063.8415.0246.6357.87910.828

13.某中醫(yī)研究所研制了一種治療A疾病的中藥,為了解其對A疾病的作用,要進行雙盲實驗.把60名

患有A疾病的志愿者隨機平均分成兩組,甲組正常使用這種中藥,乙組用安慰劑代替中藥,全部療期

后,統(tǒng)計甲、乙兩組的康復(fù)人數(shù)分別為20和5.

(1)根據(jù)所給數(shù)據(jù),完成下面2x2列聯(lián)表,并判斷是否有99.9%的把握認為使用這種中藥與A疾病康復(fù)有關(guān)

聯(lián)?

康復(fù)未康復(fù)合計

甲組2030

乙組530

合計

(2)若將乙組未用藥(用安慰劑代替中藥)而康復(fù)的頻率視為這種疾病的自愈概率,現(xiàn)從患有A疾病的人群

中隨機抽取3人,記其中能自愈的人數(shù)為X,求X的分布列和數(shù)學(xué)期望.

附表:

a0.1000.050.010.0050.001

Xa2.7063.8416.6357.87910.828

注:雙盲實驗:是指在實驗過程中,測驗者與被測驗者都不知道被測者所屬的組別,(實驗組或?qū)φ战M),

分析者在分析資料時,通常也不知道正在分析的資料屬于哪一組.旨在消除可能出現(xiàn)在實驗者和參與者意

識當中的主觀偏差和介入偏好.安慰劑:是指沒有藥物治療作用,外形與真藥相像的片、丸、針劑.

14.某企業(yè)生產(chǎn)的產(chǎn)品按質(zhì)量分為一等品和二等品,該企業(yè)計劃對現(xiàn)有生產(chǎn)設(shè)備進行改造,為了分析設(shè)備

改造前后的效果,現(xiàn)從設(shè)備改造前后生產(chǎn)的大量產(chǎn)品中各抽取200件產(chǎn)品作為樣本,產(chǎn)品的質(zhì)量情況

統(tǒng)計如下表:

一等品二等品合計

設(shè)備改造前12080200

設(shè)備改造后15050200

合計270130400

n(ad-bc)2

(〃+Z?)(c+d)(a+c)(b+d)

P^K2>k)0.0500.0100.001

k3.8416.63510.828

(1)判斷能否在犯錯誤的概率不超過0.01的前提下,認為該企業(yè)生產(chǎn)的這種產(chǎn)品的質(zhì)量與設(shè)備改造有關(guān);

(2)按照分層抽樣的方法,從設(shè)備改造前的產(chǎn)品中取得了5件產(chǎn)品,其中有3件一等品和2件二等品.現(xiàn)從

這5件產(chǎn)品中任選3件,記所選的一等品件數(shù)為X,求X的分布列及均值E(X);

(3)根據(jù)市場調(diào)查,企業(yè)每生產(chǎn)一件一等品可獲利100元,每生產(chǎn)一件二等品可獲利60元,在設(shè)備改造后,

用先前所取的200個樣本的頻率估計總體的概率,記生產(chǎn)1000件產(chǎn)品企業(yè)所獲得的總利潤為W,求W的均

值E(W).

題園因獨立性檢驗與正態(tài)分布

15.新型冠狀病毒的傳染主要是人與人之間進行傳播,感染人群年齡大多數(shù)是50歲以上人群,該病毒進入

人體后有潛伏期.潛伏期是指病原體侵入人體至最早出現(xiàn)臨床癥狀的這段時間,潛伏期越長,感染到

他人的可能性越高,現(xiàn)對400個病例的潛伏期(單位:天)進行調(diào)查,統(tǒng)計發(fā)現(xiàn)潛伏期平均數(shù)為7.2,

方差為2.252,如果認為超過8天的潛伏期屬于“長潛伏期”,按照年齡統(tǒng)計樣本,50歲以上人數(shù)占70%,

長期潛伏人數(shù)占25%,其中50歲以上長期潛伏者有60人.

(1)請根據(jù)以上數(shù)據(jù)完成2x2列聯(lián)表,并根據(jù)小概率a=0.05的獨立性檢驗,是否可以認為“長期潛伏”與年齡

有關(guān);

單位:人

50歲以下(含50歲)50歲以上總計

長期潛伏

非長期潛伏

總計

(2)假設(shè)潛伏期X服從正態(tài)分布其中〃近似為樣本平均數(shù)"人近似為樣本方差d,現(xiàn)在很多省

市對入境旅客一律要求隔離14天,請結(jié)合費原則通過計算概率解釋其合理性.

n(ad-bc)2

其中〃=a+b+c+d.

(a+Z?)(c+d)(a+c)(b+d)

a0.10.050.010

Xa2.7063.8416.635

若X?N(〃,52),尸(〃一5<XW〃+5)B0.6827,尸(〃一254XV〃+25)“0.9545,

P(〃一35VXV〃+35人0.9973.

16.某校體育鍛煉時間準備提供三項體育活動供學(xué)生選擇.為了解該校學(xué)生對“三項體育活動中要有籃球”

這種觀點的態(tài)度(態(tài)度分為同意和不同意),隨機調(diào)查了200名學(xué)生,數(shù)據(jù)如下:

單位:人

男生女生合計

同意7050120

不同意305080

合計100100200

(1)能否有99%的把握認為學(xué)生對“三項體育活動中要有籃球”這種觀點的態(tài)度與性別有關(guān)?

(2)現(xiàn)有足球、籃球、跳繩供學(xué)生選擇.

①若甲、乙兩名學(xué)生從這三項運動中隨機選一種,且他們的選擇情況相互獨立互不影響.已知在甲學(xué)生選

擇足球的前提下,兩人的選擇不同的概率為記事件A為“甲學(xué)生選擇足球",事件B為“甲、乙兩名學(xué)生

的選擇不同”,判斷事件A、5是否獨立,并說明理由.

②若該校所有學(xué)生每分鐘跳繩個數(shù)X?N085,169).根據(jù)往年經(jīng)驗,該校學(xué)生經(jīng)過訓(xùn)練后,跳繩個數(shù)都有

明顯進步.假設(shè)經(jīng)過訓(xùn)練后每人每分鐘跳繩個數(shù)比開始時個數(shù)增加10,該校有1000名學(xué)生,預(yù)估經(jīng)過訓(xùn)練

后該校每分鐘跳182個以上人數(shù)(結(jié)果四舍五入到整數(shù)).

n(ad—bc)-

參考公式和數(shù)據(jù):K2=其中“=a+6+c+d;

(a+6)(c+d)(a+c)僅+d)

2

P(K>x0)0.0250.0100.005

%5.0246.6357.879

若X?N(〃,/),貝”(因一“<(7卜0.6827,P(|X-//|<2cr)~0.9545,尸(|X-4<3o■卜0.9973.

17.為調(diào)查學(xué)生數(shù)學(xué)建模能力的總體水平,某地區(qū)組織10000名學(xué)生(其中男生4000名,女生6000名)

參加數(shù)學(xué)建模能力競賽活動.

(1)若將成績在[70,85]的學(xué)生定義為“有潛力的學(xué)生”,經(jīng)統(tǒng)計,男生中有潛力的學(xué)生有2500名,女生中有潛

力的學(xué)生有3500名,完成下面的2x2列聯(lián)表,并判斷是否有99.9%的把握認為學(xué)生是否有潛力與性別有關(guān)?

性別

是否有潛力合計

男生女生

有潛力

沒有潛力

合計

(2)經(jīng)統(tǒng)計,男生成績的均值為80,方差為49,女生成績的均值為75,方差為64.

(i)求全體參賽學(xué)生成績的均值4及方差。2;

(ii)若參賽學(xué)生的成績X服從正態(tài)分布N(%d),試估計成績在[61,93]的學(xué)生人數(shù).

參考數(shù)據(jù):

?

P(K2>fc)0.10.050.010.0050.001

k2.7063.8416.6357.87910.828

②若X?NQ,/),則P(〃一。WXW〃+。)=0.6827,—2cWXW〃+2。)=0.9545,P(/z-3tr<X<

〃+3a-)=0.9973.

n(ad-bc)2

參考公式:K2=n=a+b+c+d.

(a+b)(c+d)(a+c)(b+d)'

18.某學(xué)校號召學(xué)生參加“每天鍛煉1小時”活動,為了了解學(xué)生參與活動的情況,隨機調(diào)查了100名學(xué)生一

個月(30天)完成鍛煉活動的天數(shù),制成如下頻數(shù)分布表:

[0,5](5,10](10,15](15,20](20,25](25,30]

數(shù)

人4153331116

數(shù)

(1)由頻數(shù)分布表可以認為,學(xué)生參加體育鍛煉天數(shù)X近似服從正態(tài)分布NO,M),其中「I近似為樣本的平

均數(shù)(每組數(shù)據(jù)取區(qū)間的中間值),且。=6.1,若全校有3000名學(xué)生,求參加“每天鍛煉1小時”活動超過

21天的人數(shù)(精確到1);

⑵調(diào)查數(shù)據(jù)表明,參加“每天鍛煉1小時”活動的天數(shù)在(15,30]的學(xué)生中有30名男生,天數(shù)在[0,15]

的學(xué)生中有20名男生,學(xué)校對當月參加“每天鍛煉1小時”活動超過15天的學(xué)生授予“運動達人”稱號.

請?zhí)顚懴旅媪新?lián)表:

活動天數(shù)

性別合計

[0,15](15,30]

男生

女生

合計

并依據(jù)小概率值a=0.05的獨立性檢驗,能否認為學(xué)生性別與獲得“運動達人”稱號有關(guān)聯(lián).如果結(jié)論是有關(guān)聯(lián),

請解釋它們之間如何相互影響.

附:參考數(shù)據(jù):P(〃一。WX<〃+a)=0.6827;P(4-2。WXW〃+2(r)=0.9545;<X<

〃+3。)=。.99734=("雷藍?(7i=a+b+c+d)

a0.10.050.010.0050.001

2.7063.8416.6357.87910.828

題包理樣本中心的計算及應(yīng)用

19.如果記錄了無,y的幾組數(shù)據(jù)分別為(0,1),(1,3),(2,5),(3,7),那么y關(guān)于X的經(jīng)驗回歸直線必過點

()

A.(2,2)B.(1.5,2)C.(1,2)D.(1.5,4)

下列說法中正確的有(填正確說法的序號).

①回歸直線§=%+》恒過點(,亍),且至少過一個樣本點;

②若樣本數(shù)據(jù)占,々,?一/的方差為4,則數(shù)據(jù)2%+1,2%+1,…,2/+1的標準差為4;

③已知隨機變量X且尸(X>3)=0.2,則P(l<X43)=0.3;

④若線性相關(guān)系數(shù)/I越接近1,則兩個變量的線性相關(guān)性越弱;

⑤小是用來判斷兩個分類變量是否相關(guān)的隨機變量,當左2的值很小時可以推斷兩個變量不相關(guān).

20.已知兩個變量無和丁之間存在線性相關(guān)關(guān)系,某興趣小組收集了一組x,y的樣本數(shù)據(jù)如下表所示:

X12345

y0.50.611.41.5

根據(jù)表中數(shù)據(jù)利用最小二乘法得到的回歸方程是()

A.y=0.21x+0.53B.y=0.25x+0.21

C.y=0.28x+0.16D.y=0.3lx+0.11

21.己知變量x和y的統(tǒng)計數(shù)據(jù)如表:

X12345

y55668

根據(jù)上表可得回歸直線方程夕=0.72+4,據(jù)此可以預(yù)測當x=8時,'=().

A.9.2B.9.5C.9.9D.10.1

22.近年來,“考研熱”持續(xù)升溫,2022年考研報考人數(shù)官方公布數(shù)據(jù)為457萬,相比于2021年增長了80

萬之多,增長率達到21%以上.考研人數(shù)急劇攀升原因較多,其中,本科畢業(yè)生人數(shù)增多、在職人士考

研比例增大,是兩大主要因素.據(jù)統(tǒng)計,某市各大高校近幾年的考研報考總?cè)藬?shù)如下表:

年份20182019202020212022

年份序號X12345

報考人數(shù)y(萬人)1.11.622.5m

根據(jù)表中數(shù)據(jù),可求得y關(guān)于x的線性回歸方程為9=Q43X+Q71,則根的值為.

23.(多選)為了研究y關(guān)于x的線性相關(guān)關(guān)系,收集了5組樣本數(shù)據(jù)(見下表):

Xi2345

y0.50.811.21.5

假設(shè)經(jīng)驗回歸方程為£=加+0.28,則()

A.另=0.24

B.當x=8時,y的預(yù)測值為2.2

C.樣本數(shù)據(jù)y的40%分位數(shù)為0.8

D.去掉樣本點(3,1)后,%與y的樣本相關(guān)系數(shù)/?不變

題包式相關(guān)系數(shù)的計算

24.(多選)對于樣本相關(guān)系數(shù)廠,下列說法正確的是()

A.廠的取值范圍是[-M]

B.越大,相關(guān)程度越弱

c.制越接近于o,成對樣本數(shù)據(jù)的線性相關(guān)程度越強

D.卜|越接近于1,成對樣本數(shù)據(jù)的線性相關(guān)程度越強

25.(多選)已知關(guān)于變量x,y的4組數(shù)據(jù)如表所示:

X681012

ya1064

根據(jù)表中數(shù)據(jù)計算得到x,y之間的線性回歸方程為夕=-1.4元+20.6,無,y之間的相關(guān)系數(shù)為r(參考公式:

),貝U(

7A/2

A.a=12B.變量x,y正相關(guān)C.r

題包包求線性回歸直線方程(結(jié)合相關(guān)系數(shù)與二項式分布,超幾何分布,正態(tài)分布)

26.近年來,“直播帶貨”成為一種常見的銷售方式,某果農(nóng)2018年至2022年通過直播銷售水果的年利潤》

(單位:萬元)如表所示:

年份20182019202020212022

年份代碼t12345

年利潤%萬元2.42.74.16.47.9

(1)由表中的數(shù)據(jù)判斷,能否用線性回歸模型擬合y與1的關(guān)系?請用相關(guān)系數(shù)「加以說明(精確到0。1);

(2)建立y關(guān)于f的線性回歸方程,并預(yù)測2025年該果農(nóng)通過直播銷售水果的利潤.

參考數(shù)據(jù):t4%=85.2,Ij(x.-y)2=T2Z78,456.95x7.55.

i=lV』1

力(—)(%-刃

參考公式:相關(guān)系數(shù)廠=I廣,,

加(一法(一.

Vi=lZ=1

-刃

回歸方程y=bt+a中斜率和截距的最小二乘估計公式分別為6=-----------------,a=y-bT.

za-n2

1=1

27.比亞迪,這個在中國乘用車市場僦露頭角的中國品牌,如今己經(jīng)在全球汽車品牌銷量前十中占據(jù)一席

之地.這一成就不僅是比亞迪的里程碑,更是中國新能源汽車行業(yè)的里程碑,標志著中國已經(jīng)在全球

范圍內(nèi)成為了新能源汽車領(lǐng)域的強國.比亞迪旗下的宋plus自2020年9月上市以來,在SUV車型中

的月銷量遙遙領(lǐng)先,現(xiàn)統(tǒng)計了自上市以來截止到2023年8月的宋plus的月銷量數(shù)據(jù).

(1)通過調(diào)查研究發(fā)現(xiàn),其他新能源汽車的崛起、購置稅減免政策的頒布等,影響了汽車的月銷量,現(xiàn)將殘

差過大的數(shù)據(jù)剔除掉,得到2022年8月至2023年8月部分月份月銷量y(單位:萬輛)和月份編號x的成

對樣本數(shù)據(jù)統(tǒng)計.

月份2022.82022.92022.122023.12023.22023.32023.42023.62023.7202.8

月份編號12345678910

月銷量(單位:

4.254.594.993.53.783.012.462.723.023.28

萬輛)

請用樣本相關(guān)系數(shù)說明》與x之間的關(guān)系可否用一元線性回歸模型擬合?若能,求出y關(guān)于x的經(jīng)驗回歸方

程;若不能,請說明理由.(運算過程及結(jié)果均精確到0.01)(若舊>075,則線性相關(guān)程度很高,可用一元

線性回歸模型擬合)

(2)為慶祝2023年“雙節(jié)”(中秋節(jié)和國慶節(jié)),某地4s店特推出抽獎優(yōu)惠活動,獎項共設(shè)一、二、三等獎三

個獎項,其中一等獎、二等獎、三等獎分別獎勵1萬元、5千元、2千元,抽中一等獎、二等獎、三等獎的

概率分別為現(xiàn)有甲、乙兩人參加了抽獎活動(每人只有一次抽獎機會),假設(shè)他們是否中獎相互獨

632

立,求兩人所獲獎金總額超過1萬元的概率.

1(%-元)(%-9)z%%一近

i=li=l

參考公式:樣本相關(guān)系數(shù)廠

拒d)2茨「討

Vi=li=l

-2(%-可(%-刃-nxy

b=上「-----------=號--------,a=y-bx.

z=li=l

10_1010____________

參考數(shù)據(jù):£%%=178.26,元y=19.58,£E-10元2=82.5,£貨_10rz6.20,x7620?22.62.

i=li=li=l

28.已知某綠豆新品種發(fā)芽的適宜溫度在6℃~22℃之間,一農(nóng)學(xué)實驗室研究人員為研究溫度》(℃)與綠

豆新品種發(fā)芽數(shù)》(顆)之間的關(guān)系,每組選取了成熟種子50顆,分別在對應(yīng)的8℃~14℃的溫度環(huán)境

(1)由折線統(tǒng)計圖看出,可用線性回歸模型擬合〉與x的關(guān)系,請用相關(guān)系數(shù)加以說明;

(2)建立y關(guān)于x的回歸方程,并預(yù)測在19℃的溫度下,種子發(fā)芽的顆數(shù).

參考數(shù)據(jù):7=24,Z(x,-》)(%->)=70,工回7)~=176,777?8.77.

i=li=l

參考公式:相關(guān)系數(shù)一二?六三,回歸直線方程,二院+》中斜率和截距的最小二乘估計公

、卜一乂州->)

式分別為6=千——屋亍-打.

i=l

29.某騎行愛好者近段時間在專業(yè)人士指導(dǎo)下對騎行情況進行了統(tǒng)計,各次騎行期間的身體綜合指標評分無

與對應(yīng)用時y(單位:小時)如下表:

身體綜合指標評分(X)12345

用時(V/小時)108.5876.5

(1)由上表數(shù)據(jù)看出,可用線性回歸模型擬合y與x的關(guān)系,請用相關(guān)系數(shù)如以說明;

⑵建立y關(guān)于x的回歸方程.

n__

2H一£(即一城%1))____

參考數(shù)據(jù)和參考公式:相關(guān)系數(shù),=,,b=上一---------,&=7-標,6al.73.

回a2力

Vz=li=l

30.火車晚點是人們在旅行過程中最常見的問題之一,針對這個問題,許多人都會打電話進行投訴.某市火

車站為了解每年火車的正點率x%對每年顧客投訴次數(shù)》(單位:次)的影響,對近8年(2015年~2022

年)每年火車正點率x%和每年顧客投訴次數(shù)y的數(shù)據(jù)作了初步處理,得到下面的一些統(tǒng)計量的值.

儲888£8(尤廣元)2

Z=1i=li=l1=1

60059243837.293.8

(1)求y關(guān)于X的經(jīng)驗回歸方程;若預(yù)計2024年火車的正點率為84%,試估算2024年顧客對火車站投訴的

次數(shù);

(2)根據(jù)顧客對火車站投訴的次數(shù)等標準,該火車站這8年中有6年被評為“優(yōu)秀”,2年為“良好”,若從這8

年中隨機抽取3年,記其中評價“良好”的年數(shù)為X,求X的分布列和數(shù)學(xué)期望.

附:經(jīng)驗回歸直線y=淡+。的斜率和截距的最小二乘法估計公式分別為:

另=與---------,a=y-bx

i=l

X

5153

P

142828

31.直播帶貨是一種直播和電商相結(jié)合的銷售手段,目前己被廣大消費者所接受.針對這種現(xiàn)狀,某公司決

定逐月加大直播帶貨的投入,直播帶貨銷售金額穩(wěn)步提升,以下是該公司2023年前6個月的帶貨金額:

月份X123456

帶貨金額y/萬元25435445495416542054

(1)根據(jù)統(tǒng)計表中的數(shù)據(jù),計算變量V與X的樣本相關(guān)系數(shù)r,并判斷兩個變量y與X的相關(guān)程度(若卜1-0.75,

則認為相關(guān)程度較強;否則沒有較強的相關(guān)程度,精確到0.01);

(2)若y與X的相關(guān)關(guān)系擬用線性回歸模型表示,試求

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論