版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1什么是統(tǒng)計學?統(tǒng)計方法可分為哪兩大類?統(tǒng)計學是收集、處 理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結論的科學。方法有描述統(tǒng) 計和推斷統(tǒng)計兩類2統(tǒng)計數(shù)據(jù)可分為哪幾種類型?不同類型數(shù)據(jù)各有什么特點?按 采取計量尺度,分類、順序、數(shù)值型數(shù)據(jù);按統(tǒng)計數(shù)據(jù)收集方法, 觀測、實驗數(shù)據(jù);按被描述對象與時間關系,截面、時間序列數(shù) 據(jù)統(tǒng)計數(shù)據(jù);按所采用的計量尺度不同分;(定性數(shù)據(jù))分類數(shù)據(jù):只能歸于某一類別的非數(shù)字型數(shù)據(jù),它 是對事物進行分類的結果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述;(定性數(shù)據(jù))順序數(shù)據(jù):只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。 它也是有類別的,但這些類別是有序的。(定量數(shù)據(jù))數(shù)值型數(shù)據(jù):按數(shù)字尺度測量的觀察值
2、,其結果表 現(xiàn)為具體的數(shù)值。統(tǒng)計數(shù)據(jù);按統(tǒng)計數(shù)據(jù)都收集方法分;觀測數(shù)據(jù):是通過調查或觀測而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒 有對事物人為控制的條件下得到的。實驗數(shù)據(jù):在實驗中控制實驗對象而收集到的數(shù)據(jù)。統(tǒng)計數(shù)據(jù);按被描述的現(xiàn)象與實踐的關系分;截面數(shù)據(jù):在相同或相似的時間點收集到的數(shù)據(jù), 也叫靜態(tài)數(shù)據(jù)。 時間序列數(shù)據(jù):按時間順序收集到的,用于描述現(xiàn)象隨時間變化 的情況,也叫動態(tài)數(shù)據(jù)。3舉例說明總體、樣本、參數(shù)、統(tǒng)計量、變量這幾個概念:對一 千燈泡進行壽命測試,那么這千個燈泡就是總體,從中抽取一百 個進行檢測,這一百個燈泡的集合就是樣本,這一千個燈泡的壽 命的平均值和標準差還有合格率等描述特征的數(shù)值就
3、是參數(shù),這 一百個燈泡的壽命的平均值和標準差還有合格率等描述特征的數(shù) 值就是統(tǒng)計量,變量就是說明現(xiàn)象某種特征的概念,比如說燈泡 的壽命。4什么是有限總體和無限總體?舉例說明有限總體指總體的范圍能夠明確確定,而且元素的數(shù)目是有限可 數(shù)的,如若干個企業(yè)構成的總體,一批待檢查的燈泡。無限總體 指總體包括的元素是無限不可數(shù)的,如科學實驗中每個試驗數(shù)據(jù) 可看做是一個總體的一個元素,而試驗可無限進行下去,因此由 試驗數(shù)據(jù)構成的總體是無限總體5變量可分為哪幾類?變量可以分為分類變量,順序變量,數(shù)值型變量。變量也可以分為隨機變量和非隨機變量。經驗變量和理論變量。6舉例說明離散型變量和連續(xù)型變量離散型變量,只能
4、取有限個值,取值以整數(shù)位斷開,比如 企業(yè)數(shù) 連續(xù)型變量,取之連續(xù)不斷,不能一一列舉,比如 溫度”1數(shù)據(jù)的預處理包括哪些內容?數(shù)據(jù)審核(完整性和準確性;適用性和實效性),數(shù)據(jù)篩選和數(shù)據(jù)排序。2直方圖和條形圖有什么區(qū)別?條形圖使用圖形的長度表示各類別頻數(shù)的多少,其寬度固定, 直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻 率,寬度表示組距,直方圖各矩形連續(xù)排列,條形圖分開排列, 條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。3餅圖和環(huán)形圖有什么不同?餅圖只能顯示一個樣本或總體各部分所占比例,環(huán)形圖可以同時 繪制多個樣本或總體的數(shù)據(jù)系列,其圖形中間有個 空洞”每個 樣本或總體的數(shù)據(jù)系類
5、為一個環(huán)。4莖葉圖和直方圖相比有什么優(yōu)點?莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出每一個原始數(shù)據(jù),即 保留了原始數(shù)據(jù)的信息。在應用方面,直方圖通常適用于大批量 數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。5使用圖標應注意哪些問題?合理安排統(tǒng)計表結構表頭一般包括表號,總標題和表中數(shù)據(jù) 的單位等內容表中的上下兩條橫線一般用粗線,中間的其他用 細線在使用統(tǒng)計表時,必要時可在下方加注釋,注明數(shù)據(jù)來源。1一組數(shù)據(jù)的分布特征可以從哪幾方面進行測度。一是分布的集中趨勢,反映數(shù)據(jù)向其中心靠攏或聚集的程度;二 是分布的離散程度,反映各數(shù)據(jù)遠離其中心值的趨勢;三是分布 的形狀,反映數(shù)據(jù)分布偏斜程度和峰度。2. 簡述四分位數(shù)的計算
6、方法:首先對數(shù)據(jù)進行排序,然后確定四分位數(shù)所在的位置,該位置上的數(shù)值就是四分位數(shù)。(設25%的四分位數(shù)為Q25%,75%四分位數(shù)為Q75%,根據(jù)四分位數(shù)定義 有:Q25% 位置二n/4,Q75% 位置=3n/4。3. 對于比率數(shù)據(jù)為什么采用幾何平均。在實際應用中,對于比率數(shù)據(jù)的平均采用幾何平均要比算數(shù)平均 更合理。從公式G)中也可看出,G就是平均增長率。4. 簡述眾數(shù)、中位數(shù)、和平均數(shù)的特點和應用場合。眾數(shù)是一組數(shù)據(jù)分布的峰值,不受極端值的影響,缺點是具有不 唯一性。眾數(shù)主要作為分類數(shù)據(jù)的集中趨勢測度值。中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受數(shù)據(jù)極端值的影響。 中位數(shù)以及其他分位數(shù)主要適合于
7、作為順序數(shù)據(jù)的集中趨勢測度 值。均值是就數(shù)值型數(shù)據(jù)計算的,具有優(yōu)良的數(shù)學性質,缺點是易受 數(shù)據(jù)極端值的影響。均值主要適合于作為數(shù)值型數(shù)據(jù)的集中趨勢 測度值。5. 為什么要計算離散系數(shù)。第一,極差、平均差、方差和標準差等都是反映數(shù)據(jù)分散程度的 絕對值,其數(shù)值的大小取決于原變量值本身水平高低的影響。第 二,它們與原變量值的計量單位相同,采用不同計量單位計量的 變量值,其離散程度的測度值也就不同。因此,為消除變量值水 平高低和計量單位不同對離散程度的測度值的影響,需要計算離 散系數(shù)。6. 簡述異眾比率、四分位差、方差或標準差的適用場合 對于順序數(shù)據(jù),但主要使用四分位差來測量其離散程度;對于數(shù) 值型數(shù)
8、據(jù),雖然可以計算異眾比率和四分位差,但主要使用方差 或標準差來測量其離散程度。7. 標準分數(shù)有哪些用途?標準分數(shù)給出了一組數(shù)據(jù)中各數(shù)值的相對位置。在對多個具有不 同量綱的變量進行處理時,常需要對各變量進行標準化處理。它 還可以用來判斷一組數(shù)據(jù)是否有離群數(shù)據(jù)。1. 抽樣推斷的含義:是在根據(jù)隨機原則從總體中抽取部分實際數(shù) 據(jù)的基礎上,運用數(shù)理統(tǒng)計方法,對總體某一現(xiàn)象的數(shù)量性作出 具有一定可靠程度的估計判斷。2. 簡單隨機抽樣:含義:從含有 N個元素的總體中,抽取n個 元素作為樣本,使得每一個容量為 n的樣本都有相同的機會被抽 中,這樣的方式稱為簡單隨機抽樣。特點:簡單隨機抽樣是其 他抽樣方法的基礎
9、。有兩種抽取元素的方式:重復臭氧和不重復 抽樣。分層抽樣:含義:在抽樣之前先將總體的元素劃分為若干層, 然后從各個層中抽取一定數(shù)量的元素組成一個樣本,這樣的樣本 抽樣方式稱為分層抽樣,也成分類抽樣。特點:除了可以對 總體進行評估外,還可以對各層的子總體進行評估??梢园醋?然區(qū)域或行政區(qū)域進行分層,使抽樣的組織和實施都比較方便。 分層抽樣的樣本分布在各個層內,從而使樣本在總體中的分布 比較均勻??梢蕴岣吖烙嫷木取O到y(tǒng)抽樣:含義:先將總體個元素按照某種順序排列,并按某 種規(guī)則確定一個隨機起點,然后,每隔一定的間隔抽取一個元素, 直至抽取n個元素形成一個樣本。特點:簡單易行在總體 中的分布一般也比
10、較均勻,由此估計的誤差通常要小于簡單隨機 抽樣。整群抽樣:含義:先將總體劃分成若干群,然后以群作為抽樣 單位從中抽取部分群,再對抽中的各個群中所包含的所有元素進 行觀察。特點:不需要有總體元素的具體名單而只要有群的名 單就可以進行抽樣。整群抽樣時群內各元素比較集中,對樣本進 行調查比較方便,節(jié)約費用。在群內各元素存在差異時,整群抽 樣可以提供較好的結果,理想的情況是每一群都是整個總體的一 個縮影。3重復抽樣:從總體中抽取一個元素后,把這個元素放回到總體 中再抽取第二個元素,直至抽取 n個元素為止。不重復抽樣:一個元素被抽中后不再放回總體,然后再從所剩下 的元素中抽取第二個元素,直到抽取 n個元
11、素為止。4. 抽樣分布:重復選取容量為n的樣本時,由每一個樣本算出的 統(tǒng)計量數(shù)值的相對頻數(shù)分布或概率分布,稱為樣本統(tǒng)計量的抽樣 分布。5. 樣本統(tǒng)計量的分布與總體分布的關系?由于現(xiàn)實中我們不可能將所有的樣本都抽出來,因此,統(tǒng)計量的 抽樣分布實際上是一種理論分布,但它與總體分布存在著密切的 關系,以均值x的抽樣分布為例,其抽樣分布與原有總體的分布 有關,如果原有總體是正態(tài)分布,那么,無論樣本容量的大小, 樣本均值也服從正態(tài)分布。其分布的數(shù)學期望為總體均值,方差 為總體方差的1/n,即00。如果原有總體的分布不是正態(tài)分布, 就要看樣本容量的大小了,當n為大樣本時(n 30)根據(jù)統(tǒng)計上 的中心極限定
12、理可知,當樣本容量 n增大時,不論原來的總體是 否服從正態(tài)分布,樣本均值的抽樣分布都將趨于服從正態(tài)分布。 其分布的數(shù)學期望為總體均值,方差為總體方差的1/n。6. Z a/2 n的含義:是估計誤差。Za/2的值和樣本量n共同確定 了估計誤差的大小,一旦確定了置信水平 1- a/Za/2的值就確定 了。對于給定的Za/2的值和總體標準差c??梢源_定任一允許的 估計誤差所需要的樣本量。7. 樣本均值抽樣分布的兩個主要特征值:與總體參數(shù)的關系:1. 理解原假設與備擇假設的含義:原假設:通常將研究者想收集證據(jù)予以反對的假設稱為原假設或零假設,用H0表示;備擇假設:通常將研究者想收集證據(jù)予以支持的假設稱
13、為備擇假設或研 究假設,用H1表示。2. 統(tǒng)計檢驗量:根據(jù)樣本觀測結果計算得到的,并據(jù)以對原假設 和備擇假設作出決策的某個樣本統(tǒng)計量,稱為檢驗統(tǒng)計量。標準化檢驗統(tǒng)計量:是將統(tǒng)計檢驗量標準化,標準化的統(tǒng)計檢驗量二(點估計量-假設值)/點估計量的抽樣標準差。3. 第I類錯誤:當原假設為真時拒絕原假設,所犯的錯誤稱為I 類錯誤。犯第I類錯誤的概率通常記為a。第H類錯誤:當原假設為假時沒有拒絕原假設,所犯的錯誤稱為 第H類錯誤,又稱取偽錯誤。犯第H類錯誤的概率通常記為B。它們發(fā)生概率之間的關系:在樣本量不變的情況下,要減小a就 會使B增大,而要增大a就會使B減小,這兩類錯誤此消彼長。4. 顯著性水平:
14、假設檢驗中犯的第I類錯誤的概率,稱為顯著性 水平,記為a。它對于假設檢驗決策的意義:顯著性水平是人們事先制定的犯第I類錯誤的概率a的最大允許值,在實際應用中,顯著性水平往 往是人們事先給出的一個值。5. P值:在原假設為真的條件下,檢驗統(tǒng)計量的觀察值大于或等 于其計算值的概率,稱為 P值,也稱為觀察到的顯著性水平。利用P值決策的準則:如果P值Va,拒絕H0 ;如果P值a, 不拒絕H0.6. 單側檢驗與雙側檢驗的區(qū)別:單側檢驗中,P值位于抽樣分布的一側,而雙側檢驗P值位于分布的兩側,每一側的 P值為1/2.7. 大樣本情形下總體均值左側檢驗的拒絕域:ZV- Z a;右側檢驗的拒絕域:ZZ;雙側檢
15、驗的拒絕域:|Z| Za/2。8. 小樣本情形下總體均值檢驗應該構造的檢驗統(tǒng)計量t應用前提:服從正態(tài)分布9. 小樣本情形下總體均值左側檢驗拒絕域:t V- t an-1);右側檢 驗拒絕域:tt a(n-1);雙側檢驗的拒絕域:|t| t a/2 (n-1)10. 假設檢驗的一般步驟:依照題意建立原假設H0與備擇假設H1判斷樣本大小并計算檢驗統(tǒng)計量根據(jù)顯著水平進行判斷 原假設是否成立。1、 相關關系:變量之間存在的不確定的數(shù)量關系。 相關關系的特 點:一個變量的取值不能由另一個變量唯一確定,當變量 x取某 個值時,變量y的取值可能有幾個2、 相關系數(shù)的取值和意義:取值范圍:一1r1o若0r 1
16、, x、 y之間存在正線性相關關系;一1 r0.8,高度相關;0.5 r|0.8,中度相關;0.3 r|0.5,低度相關;|r|t a/2,表明r在統(tǒng)計上是顯著的,若若|t|t a/2,,表明r在統(tǒng)計上是不顯著的。4、回歸模型:描述因變量y如何依賴于自變量x和誤差項的方 程。估計的回歸方程:利用最小二乘法,根據(jù)樣本數(shù)據(jù)求出的回歸方程的估計?;貧w方程:對變量之間統(tǒng)計關系進行定量描述的以后總數(shù)學表達 式。指具有相關的隨機變量和固定定量之間關系的方程。5、 參數(shù)最小二乘估計的基本原理:使因變量的觀察值yi與估計 值?yi之間的離差平方和達到最小來求得B 0和阻的方法。6、總平方和:對一個具體的觀測值
17、來說,變差的大小可以用實際 觀測值y與其均值? y之差(y?y)來表示。而n次觀測值的總 變差可由這些離差的平方和來表示,稱為總平方和。(143反映 了y的總變差中由于x與y之間的線性關系引起的y的變化部分, 它是可以由回歸直線來解釋的yi變差部分,稱回歸平方和。是各實際觀測點與回歸值的殘差 (yi_?yi)的平方和,它反映除 x對y的線性影響之外的其他因素對 y變差的作用,是不能由回 歸直線來解釋的yi變差部分,稱為殘差平方和??偲椒胶投貧w平方和+殘差平方和7、判定系數(shù):回歸平方和占總平方和的比例。作用:8、在回歸分析中,F(xiàn)檢驗和t檢驗各有什么作用9、 線性關系檢驗的步驟:第一步:提出假設
18、。H0 :仇=0兩個變量之間的線性關系不顯著。第二步:計算檢驗統(tǒng)計量Fo()F=第三步:作出決策。確定顯著水平a,并根據(jù)分子自由度df1=1 和分母自由度df2=n 2查F分布表,找到相應的臨界值Fa。若 FF a,拒絕H0,表明兩個變量之間的線性關系是顯著的;若 Ft a/2,拒絕H0,回歸 系數(shù)等于0的可能性小于a,表明自變量x對因變量y的影響是 顯著的(兩個變量之間存在著顯著的線性關系);若 |t|t a/2,則 不能拒絕H0,表明x對y的影響是不顯著的,二者之間不存在線 性關系。10. 置信區(qū)間估計:對x的一個給定值x0,求出y的平均值的區(qū) 間估計。預測區(qū)間估計:對x的一個給定值x0,
19、求出y的一個個別值的區(qū) 間估計。區(qū)別:1簡述時間序列的各構成要素構成要素分為四種,即趨勢(T)、季節(jié)性or季節(jié)變動(S)、周 期性或循環(huán)波動(C)、隨機性或不規(guī)則波動(I).趨勢是指時間 序列在長時期內呈現(xiàn)出來的某種持續(xù)向上或持續(xù)下降的變動。它 是由某種固定性的因素作用于序列而形成的??梢允蔷€性,也可 以是非線性。季節(jié)變動是指時間序列在一年內重復出現(xiàn)的周期性 波動。循環(huán)波動或周期性波動是指時間序列中呈現(xiàn)出來的圍繞長 期趨勢的一種波浪形或振蕩式變動。不同于趨勢變動,季節(jié)變動 有比較固定的規(guī)律,周期為一年,而循環(huán)波動則無固定的規(guī)律, 變動周期多為一年以上,且周期長短不一。周期性通常是由于經 濟環(huán)境
20、的變化而引起的。隨機性或不規(guī)則波動是由于一些偶然性 的因素產生的。2利用增長率分析時間序列時應注意哪些問題(1)當時間序列中的觀察值出現(xiàn)0或負數(shù)時,不宜計算增長率;(2)不能單純就增長率論增長率,要注意增長率與絕對水平的綜合 分析;大的增長率背后,其隱含的絕對值可能很小,小的增長率 背后其隱含的絕對值可能很大。3簡述平穩(wěn)序列和非平穩(wěn)序列的含義平穩(wěn)序列:基本上不存在趨勢的序列。各觀察值基本上在某個固 定的水平上波動,雖然在不同的時間段波動的程度不同,但并不 存在某種規(guī)律,而其波動可以看成是隨機的。非平穩(wěn)序列:包含趨勢性、季節(jié)性或周期性的序列。它可能只含 有其中的一種成分,也可能是幾種成分的組合。
21、4指數(shù)平滑法的基本含義:是加權平均的一種特殊形式對過去 的觀察值加權平均進行預測的一種方法觀察值時間越遠,其權 數(shù)也跟著呈現(xiàn)指數(shù)的下降,因而稱為指數(shù)平滑有一次指數(shù)平滑、 二次指數(shù)平滑、三次指數(shù)平滑等 該方法使用第T+1期的預測 值等于T期的實際觀測值與第T期預測值的加權平均值一次指 數(shù)平滑法也可用于對時間序列進行修勻,以消除隨機波動,找出 序列的變化趨勢5分解預測的基本步驟:確定并分離季節(jié)成分。計算季節(jié)指數(shù), 以確定時間序列中的季節(jié)成分。然后將季節(jié)成分從時間序列中分 離出去,即用每一個時間序列觀測值除以相應的季節(jié)指數(shù),以消 除季節(jié)成分建立預測模型并進行預測。對消除季節(jié)成分的時間 序列建立線性預測模型,并根據(jù)這一模型進行預測計算出最后 的預測值。用預測值乘以相應的季節(jié)指數(shù),得到最終的觀測值。1指數(shù)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度光纜光纖熔接工程進度控制合同
- 2025年度綜合能源服務承包合同范本
- 2025年度農藥產品風險管理合同
- 2025年度個體廣告公司設計師勞動合同書
- 2025年業(yè)主支付保證合同簡單版(三篇)
- 2025年度國際旅游產品進口合同:旅游資源整合與市場開發(fā)
- 2025年荒地承包經營權租賃合同:二零二五荒田使用權分期支付協(xié)議
- 2025建筑電氣工程施工承包合同
- 2025年度國際文化產業(yè)發(fā)展合作合同
- 2025年度能源項目設備采購合同樣本
- 《亞太經合組織》課件
- 《會展概述》課件
- 《郴州市總體規(guī)劃》課件
- 【高中物理競賽大全】 競賽3 電磁學 50題競賽真題強化訓練解析版-高考物理備考復習重點資料歸納
- 再見2024你好2025展望未來
- 2025屆山東省濟南市歷城二中高二上數(shù)學期末學業(yè)質量監(jiān)測試題含解析
- 2024年全國各地中考試題分類匯編:文學常識
- 2022年版義務教育語文課程標準題庫(教師教資培訓考試專用十三套)
- 英語新課標(英文版)-20220602111643
- 高考模擬作文“文化自信:春節(jié)走向世界”導寫+范文3篇
- 蘇教版三年級下冊數(shù)學計算能手1000題帶答案
評論
0/150
提交評論