2015《社會統(tǒng)計學》期末復習資料正式版_第1頁
2015《社會統(tǒng)計學》期末復習資料正式版_第2頁
2015《社會統(tǒng)計學》期末復習資料正式版_第3頁
2015《社會統(tǒng)計學》期末復習資料正式版_第4頁
2015《社會統(tǒng)計學》期末復習資料正式版_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《社會統(tǒng)計學》期末復習題一、單項選擇題.為了解IT行業(yè)從業(yè)者收入水平,某研究機構從全市IT行業(yè)從業(yè)者隨機抽取800人作為樣本進行調查,其中44%回答他們的月收入在6000元以上,30%回答他們每月用于娛樂消費在1000元以上。此處800人是(A)A.樣本B.總體C.統(tǒng)計量D.變量.在頻數(shù)分布表中,將各個有序類別或組的百分比逐級累加起來稱為(C)A.頻率B.累積頻數(shù)C.累積頻率D.比率.離散系數(shù)的主要目的是(D)A.反映一組數(shù)據(jù)的平均水平B.比較多組數(shù)據(jù)的平均水平C.反映一組數(shù)據(jù)的離散程度D.比較多組數(shù)據(jù)的離散程度.經(jīng)驗法則表明,當一組數(shù)據(jù)正態(tài)分布時,在平均數(shù)加減1個標準差的范圍之內大約有(B)A.50%的數(shù)據(jù)B.68%的數(shù)據(jù)C.95%的數(shù)據(jù)D.99%的數(shù)據(jù).在某市隨機抽取10家企業(yè),7月份利潤額(單位:萬元)分別為72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么這10家企業(yè)7月份利潤額均值為(A)A.39.19B.28.90C.19.54D.27.95.用樣本統(tǒng)計量的值直接作為總體參數(shù)的估計值,這種方法稱為(A)A.點估計B.區(qū)間估計C.有效估計D.無偏估計.某單位對該廠第一加工車間殘品率的估計高達10%,而該車間主任認為該比例(?)偏高。如果要檢驗該說法是否正確,則假設形式應該為(B)A. H0 :兀>0.1;H1:兀<0.1B,H0:兀<0.1; H1 :兀>0.1C.H0:兀=0.1; H1 :兀W0.1D. H0 :兀>0.1; H1 :兀 <0.1.下面哪一項不是方差分析中的假定(D)A.每個總體都服從正態(tài)分布B.觀察值是相互獨立的C.各總體的方差相等D.各總體的方差等于0.判斷下列哪一個不可能是相關系數(shù)(D)A.-0.9B.0C.0.5D.1.2.用于說明回歸方程中擬合優(yōu)度的統(tǒng)計量主要是(D)A.相關系數(shù)B.離散系數(shù)C.回歸系數(shù)D.判定系數(shù).某地區(qū)政府想了解全市332.1萬戶家庭年均收入水平,從中抽取3000戶家庭進行調查,以推斷所有家庭的年均收入水平。這項研究的總體是(A)A.332.1萬戶家庭B.3000戶家庭C.332.1戶家庭的年均收入D.3000戶家庭的年均收入.下列變量屬于數(shù)值型變量的是(A)A.工資收入B.產(chǎn)品等級C.學生對測試改革的態(tài)度D.企業(yè)的類型.如果用一個圖形描述比較兩個或多個樣本或總體的結構性問題時,適合選用哪種圖形(A)A.環(huán)形圖 B.餅圖C.直方圖D.條形圖.在頻數(shù)分布表中,頻率是指(C)(A)Gamma系數(shù)A各組頻數(shù)和上一組頻數(shù)之比B.各組頻數(shù)和下一組頻數(shù)之比C.(A)Gamma系數(shù)15.A.兩個定類變量之間的相關分析可以使用八一..C一/一..15.A.系數(shù)B.系數(shù)C.系數(shù)D..根據(jù)一個樣本均值求出的90%的置信區(qū)間表明(C)A.總體均值一定落入該區(qū)間內B.總體均值有90%的概率不會落入該區(qū)間內C.總體均值有90%的概率會落入該區(qū)間內D.總體均值有10%的概率會落入該區(qū)間內.已知某單位職工平均每月工資為3000元,標準差為500元。如果職工的月收入是正態(tài)分布,可以判斷月收入在2500元―3500元之間的職工人數(shù)大約占總體的(B)A.95%B.68%C.89%D.90%.方差分析的目的是(D)A.比較不同總體的方差是否相等 B.判斷總體是否存在方差C.分析各樣本數(shù)據(jù)之間是否存在顯著差異D.研究各分類自變量對數(shù)值型因變量的影響是否顯著.對于線性回歸,在因變量的總離差平方和中,如果回歸平方和所占比例越大,那么兩個變量之間(A)A.相關程度越大B.相關程度越小 C.完全相關 D.完全不相關.正態(tài)分布中,°值越小,則(B)A.離散趨勢越小B.離散趨勢越大 C.曲線越低平D.變量值越分散.從含有N個元素的總體中,抽取n個元素作為樣本,同時保證總體中每個元素都有相同的機會入選樣本,這樣的抽樣方式稱為(A)A.簡單隨機抽樣B.系統(tǒng)抽樣C.整群抽樣D.分層抽樣.某地區(qū)2001-2010年人口總量(單位:萬人)分別為98,102,103,106,108,109,110,111,114,115,下列哪種圖形最適合描述這些數(shù)據(jù)(D)A.莖葉圖B.環(huán)形圖C.餅圖D.線圖.如果一組數(shù)據(jù)中某一個數(shù)值的標準分值為-1.5,這表明該數(shù)值(D)A.是平均數(shù)的-1.5倍B.比平均數(shù)少1.5 C.等于-1.5倍標準差D.比平均數(shù)低1.5個標準差.某班級10名同學期末統(tǒng)計課測試分數(shù)分別為76、93、95、80、92、83、88、90、92、72,那么該班測試成績的中位數(shù)是(A)A.89B.72C.88D.95.某班級學生期末英語測試平均成績?yōu)?5分,標準差為10分。如果已知這個班學生的測試分數(shù)服從正態(tài)分布,可以判斷成績在65-85之間的學生大約占全班學生的(A)A.68%B.89%C.90%D.95%

.已知某單位平均月收入為3500元,離散系數(shù)為0.2,那么他們月收入的標準差為(A)A.700B.0.2C.3500D.175000.在假設檢驗中,不拒絕虛無假設意味著(D)A.虛無假設是肯定正確的B.虛無假設肯定是錯誤的 C.沒有證據(jù)證明虛無假設是正確的D.沒有證據(jù)證明虛無假設是錯誤的.在因變量的總離差平方和中,如果回歸平方和所占的比例越大,則兩變量之間(A)A.相關程度越高B.相關程度越低C.完全相關D.沒有任何關系.從兩個總體中各選取了6個觀察值,得到組間平方和為234,組內平方和為484,則組間方差和組內方差分別為(C)A.234,121B.117,121c.234,48.4D.117,81.在回歸方程中,若回歸系數(shù)等于0,這表明(B)A.因變量y對自變量x的影響是不顯著的B.自變量x對因變量y的影響是不顯著的C.因變量y對自變量X的影響是顯著的 D.自變量X對因變量y的影響是顯著的.某班級有60名男生,40名女生,為了了解學生購書支出,從男生中抽取12名學生,從女生中抽取8名學生進行調查。這種調查方法屬于(C)A.簡單隨機抽樣B.整群抽樣C.分層抽樣D.系統(tǒng)抽樣.某企業(yè)職工的月收入水平分為以下五組:1)1500元及以下;2)1500-2000元;3)2000—2500元;4)2500—3000元;5)3000元及以上,則3000元及以上這一組的組中值近似為(D)A.3000元B.3500元C.2500元D.3250元.對于右偏分布,平均數(shù)、中位數(shù)和眾數(shù)之間的關系是(A)A.平均數(shù)〉中位數(shù)〉眾數(shù)B.中位數(shù)〉平均數(shù)〉眾數(shù) C.眾數(shù)〉中位數(shù)〉平均數(shù)D.眾數(shù)〉平均數(shù)〉中位數(shù).兩組數(shù)據(jù)的平均數(shù)不相等,但是標準差相等。那么(C)A.平均數(shù)小的,離散程度小B.平均數(shù)大的,離散程度大C.平均數(shù)大的,離散程度小D.兩組數(shù)據(jù)離散程度相同.在假設檢驗中,如果所計算出的P值越小,那么檢驗的結果(A)A.越顯著B.越不顯著C.越真實D.越不真實.如果物價和銷售量之間的線性相關系數(shù)為-0.87,而且二者之間具有統(tǒng)計顯著性,那么二者之間存在著(A)A.高度相關B.中度相關C.低度相關D.極弱相關.回歸平方和(SSR)反映了y的總變差中(A)A.由于x和y之間的線性關系引起的y的變化部分B.除了x對y的現(xiàn)有影響之外的其他因素對y變差的影響C.由于x和y之間的非線性關系引起的y的變化部分 D.由于x和y之間的函數(shù)關系引起的y的變化部分.根據(jù)一個具體的樣本求出的總體均值90%的置信區(qū)間(A)A.以90%的概率包含總體均值B.絕對包含總體均值C.10%的可能性包含總體均值D.絕對不包含總體均值.在假設檢驗中,虛無假設和備擇假設(C)A.都有可能成立B.都不可能成立C.有且只有一個成立D.備擇假設一定成立,虛無假設不一定成立.在方差分析中,某一水平下樣本數(shù)據(jù)之間的誤差稱為(A)A.組內誤差B.組間誤差C.組內平方D.組間平方二、名詞解釋.抽樣單位和抽樣框:一次直接的抽樣所使用的基本單位;指一次直接抽樣時樣本中所有抽樣單位的名單。.普查和抽樣調查:普查:是一種專門的調查,它是為了某種特定的目的而對總體中所有的個體進行的一次全面調查。抽樣調查:是從總體中選取部分個體組成樣本進行調查的一種方式,其目的在于根據(jù)樣本的調查結果推斷總體特征。.參數(shù)和統(tǒng)計量:參數(shù):是研究者想要了解的總體的某種特征值。統(tǒng)計量:是根據(jù)樣本數(shù)據(jù)計算出來的一個量。.方差和標準差:方差:是各數(shù)值和均值離平方的平均數(shù) 標準差:是方差的平方根。.獨立樣本和配對樣本:配對樣本:是指一個樣本中的數(shù)據(jù)和另一個樣本中的數(shù)據(jù)相對應的兩個樣本。獨立樣本:是指我們得到的樣本總體之間是相互獨立的。.總體和樣本:是構成它的所有個體的集合;樣本:就是從總體中按照一定方式抽取的一部分個體的集合。.抽樣分布:是指樣本統(tǒng)計量的概率分布,它是在重復選取容量為N的樣本時,由每個樣本計算出來統(tǒng)計量數(shù)值的相對頻數(shù)分布。.二維表:就是交叉的表格,將兩個變量一個分行排放,一個分列排放,行列交叉處就是同屬于兩個變量的不同類的數(shù)據(jù),也稱為列聯(lián)表。.相關系數(shù):就是對變量之間相關關系程度和方向的度量。.組內均方:組成平方和除以自由度就是組內均方。.普查:普查是一種專門的調查,它是為了某種特定的目的而對總體中所有的個體進行的一次全面調查。普查一般是一次性或周期性的,有統(tǒng)一的標準調查時點。普查具有信息全面、完整的特點,可以為其它抽樣調查提供依據(jù)。但是,普查比較耗時、費力,成本比較高,而且適用范圍比較難,調查內容不深入,只適合調查一些基本的、一般的社會現(xiàn)象。.誤差減少比例:我們將在預測變量Y的值時,知道變量的X值時所減小的誤差(E1-E2)和總誤差E1的比值.散點圖:是在坐標系中,用橫軸表示自變量X,用縱軸表示因變量Y,而變量組(X,Y)則用坐標系中的點表示,不同的變量組在坐標系中形成不同的散點,由坐標系及坐標系中的散點形成的二維圖就是散點圖。.正態(tài)分布:連續(xù)性隨機變量中重要的分布是鐘形概率分布,就是正態(tài)分布。.最小二乘法:對于變量X和Y的觀察值,我們可以用很多直線去描述,但我們需要選用距離各觀察值最近的一條直線,用它來描述X和Y之間的關系和實際的誤差最小,根據(jù)這一思想來確定回歸方程中參數(shù)的方法。.概率抽樣:就是按照隨即原則進行的抽樣,總體中每個個體都有一定的,非零的概率入選樣本,并且入選樣本的概率都是已知的或可以計算的。.中位數(shù):是對中心趨勢的一種測量,是將一組數(shù)據(jù)排序后,處于中間位置的變量值,用Me表示。.相關系數(shù):就是對變量之間相關關系程度和方向的度量。.區(qū)間估計:在估計總體參數(shù)時給出的不是一個數(shù)值,而是一個區(qū)間,是根據(jù)統(tǒng)計量的抽樣分布的特點來進行估計,同時給出總體參數(shù)落入這一區(qū)間的可能性大小。.中心極限定理:無論總體分布是否服從正態(tài)分布,從均值為U,方差為a的平方的總體中抽取變量為n的隨機樣本,當n充分大時(n〉=30),樣本均值的抽樣分布近似服從均值u,方差為a的平方/n。

.假設檢驗:首先先對總體參數(shù)建立一個假設,然后根據(jù)樣本信息去檢驗這一假設是否正確。三、簡答題.判斷以下隨機變量是定性變量還是定量變量,如果是定量變量,確定是離散變量還是連續(xù)變量。(1)網(wǎng)絡供應商的姓名----定性變量 (2)每月的網(wǎng)絡服務費一一定量變量,屬于連續(xù)變量。(3)每月上網(wǎng)時間----定量變量,屬于連續(xù)變量。 (4)上網(wǎng)的主要目的----定性變量(5)上周收到的電子郵件數(shù)量一一定量變量,屬于離散變量。(6)每月用于網(wǎng)上購物的金額----定量變量,屬于離散變量。(7)上月網(wǎng)上購物的次數(shù)----定量變量,屬于離散變量。 (8)使用的電腦的品牌一一定性變量(9)上網(wǎng)是否玩游戲一一定性變量 (10)電腦是否帶有光盤刻錄機一一定性變量2.調查方法主要包括哪幾種?簡要說明各種方法的優(yōu)缺點。答:(一)普查(census): 1.為特定目的專門組織的非經(jīng)常性全面調查,如人口普查、工業(yè)普查等2.通常是一次性或周期性的3.一般需要規(guī)定統(tǒng)一的標準調查時間4.數(shù)據(jù)的規(guī)范化程度較高5.使用范圍比較狹窄,只能調查一些最基本、最一般的現(xiàn)象(二)抽樣調查1.從總體中隨機抽取一部分單位作為樣本進行調查,并根據(jù)樣本調查結果來推斷總體特征的數(shù)據(jù)收集方法。2.具有經(jīng)濟性、時效性強、適應面廣、準確性高等特點(三)重點調查1.重點調查:是指在調查對象中,只選擇一部分重點單位進行的非全面調查。2重點單位:著眼于現(xiàn)象量的方面而言,盡管這些單位在全部單位中只是一部分,但它們在所研究現(xiàn)象的標志總量中卻占有絕大的比重,在總體中具有舉足輕重的作用。(四)典型調查典型調查是一種專門組織的非全面調查。根據(jù)調查的目的,在對所研究的對象進行初步分析的基礎上,有意識地選取若干具有代表性的單位進行調查和研究,借以認識事物發(fā)展變化的規(guī)律。有人也認為它是“目的抽樣”,以若干具有代表性的單位為樣本。.什么是簡單一元線性回歸分析?其作用是什么?答:什么是回歸?回歸是由英國著名統(tǒng)計學家FrancisGalton在19世紀末期研究孩子及其父母的身高時提出來的。Galton發(fā)現(xiàn)身材高的父母,他們的孩子也高。但這些孩子平均起來并不像他們父母那樣高。比較矮的父母情形也類似:他們的孩子比較矮,但這些孩子的平均身高要比他們父母的平均身高高。Galton把這種孩子的身高向中間值靠近的趨勢稱之為一種回歸效應,而他給出的研究兩個數(shù)值變量之間數(shù)量關系的方法稱為回歸分析。什么是回歸分析?回歸分析是對具有相關關系的變量擬合數(shù)學方程,通過一個或一些變量的變化解釋另一變量變化的方法。如果在回歸分析中,只包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。.簡要說明社會研究過程。答:社會研究是以經(jīng)驗的方式,對社會中人們的行為、態(tài)度、關系,以及由此形成的各種社會現(xiàn)象、社會產(chǎn)物所進行的科學的探討活動,以回答問題、建議觀點及理論等。社會研究通常遵循著筆記固定的過程,一般包括五個主要過程:(1)提出問題;(2)形成假設;(3)收集數(shù)據(jù);(4)分析數(shù)據(jù);(5)檢驗假設舉例:提出的問題:流動人口平均初婚年齡高于非流動人口平均初婚年齡,我們可以通過抽樣調查的方法收集數(shù)據(jù)或者尋找二手數(shù)據(jù),并采取適當?shù)姆椒ǚ治鰯?shù)據(jù),根據(jù)數(shù)據(jù)結構檢驗假設是否成立…….按測度水平,變量可分為哪幾類?并舉例說明。答:按測度水平,變量可以分為四類:定類變量;定序變量;定距變量和定比變量。(1)定類變量:當變量的值的含義僅表示個體的不同類別,而不能說明個體的大小、程度等其他特征時,這種變量稱為定類變量。如性別、婚姻狀態(tài)、民族、地區(qū)、職務等。(2)定序變量:當變量值的含義不僅表示個體的不同類別,還可以區(qū)分個體之間的大小、程度等序次差異時,這種變量稱為定序變量。如受教育程度可以分為文盲、小學、初中、高中、大專以上等。(3)定距變量:當變量值不僅可以將個體區(qū)分為不同類別并進行排序,而且可以確定不同類別之間的數(shù)量差別和間隔差距時,這樣的變量稱為定距變量。如智商、溫度等。(4)定比變量:當變量除了具有以上三種變量的全部特征外,還可以計算兩個變量值之間的比值時,這樣的變量稱為定比變量。如身高、年齡、收入、一個地區(qū)的人口數(shù)等。.簡要舉例說明在分析雙變量的關系時,T檢驗和卡方檢驗的主要區(qū)別。答:分析雙變量關系時,T檢驗和卡方檢驗都是主要用于檢驗這兩個變量之間是否存在顯著關系。T檢驗主要用于對一個為數(shù)值型變量、另一個為分類變量且只有兩個類別的變量的雙變量關系的統(tǒng)計顯著性檢驗??ǚ綑z驗主要用于對兩個分類變量之間的相關性進行統(tǒng)計檢驗,判斷變量之間是否存在顯著關系。例如,我們想考察收入和性別是否存在關系,或者兩性的收人是否存在顯著差異,可以用兩獨立樣本T檢驗。如果我們想考察職業(yè)和性別是否存在關系,而職業(yè)和性別都是分類變量,那么可以用卡方檢驗考察不同性別之間職業(yè)是否存在顯著差異。.等距分組和不等距分組有什么區(qū)別?請舉例說明。答:對于數(shù)值型數(shù)據(jù),對其進行審核、篩選和排序后,通常我們會對其進行分組。所謂數(shù)據(jù)分組就是研究者根據(jù)研究需要,按照某種標準將原始數(shù)據(jù)分為不同的組,分組后的數(shù)據(jù)叫做分組數(shù)據(jù)。其中一種分組方法是將全部變量值按照次序劃分為多個區(qū)間,每一區(qū)間里的值作為一組,即為組距分組,采用這種方法分組時,如果各組組距相等,則成為等距分組;如果各組組距不相等,則稱為不等距分組。如:在分析人口時,我們往往將人口分為嬰幼兒組(0~6歲)、少年兒童組(7~17歲)、中青年組(18~59歲)、老年人組(60歲及以上),該分類中各組組距不相等,這就是不等距分組。.舉例說明什么是自變量和因變量,二者之間是什么關系?答:我們將引起其他變量變化的變量稱為自變量,而將由于其他變量的變化而導致自身發(fā)生變化的變量稱為因變量。自變量和因變量之間的關系不僅僅是先后關系,如我們常說的“小樹長高,我也長高"。我們不能說“我長高”是因變量“小樹長高”是自變量,兩者只是有時間上的先后關系,而沒有必然聯(lián)系。自變量和因變量之間還必須存在以下關系:因變量的變化以自變量的變化為前提。例如,受教育程度提高,收入增加,這兩者就是因果關系,受教育程度是自變量,收入是因變量。.簡要說明卡方的擬合優(yōu)度檢驗和獨立性檢驗的含義。答:卡方檢驗用于分類變量之間關系的檢驗。當用于檢驗不同類別的目標量之間是否存在顯著差異時,稱為擬合優(yōu)度檢驗。例如,不同職業(yè)的人群中對某項改革措施的支持率是否一致??ǚ綑z驗還可用于判斷兩個分類變量之間是否存在聯(lián)系。如果兩個分類變量之間沒有關系,則稱為獨立,我們用判斷它們之間是否關聯(lián),這時稱為獨立性檢驗。例如,對性行為的態(tài)度是否和受教育程度有關。.條形圖和直方圖有什么區(qū)別?答:(1)適用范圍不同,條形圖適用于所有類型數(shù)據(jù),而直方圖只適用于數(shù)值型數(shù)據(jù)。(2)條形圖中條形的寬度是固定的,是用條形的長度(或高度)表示各類別的頻數(shù)的多少;而直方圖則是用矩形的面積表示各類別頻數(shù)的多少,矩形的寬度和高度均有意義,寬度表示組距,高度表示每一組數(shù)據(jù)的頻數(shù)密度,而且寬度不一定是固定的,只有等距分組時寬度是固定的。

(3)條形圖中各條形是分開排列的,而直方圖中由于分組數(shù)據(jù)時連續(xù)的,因而直方圖的矩形通常是緊密排列的。.簡述眾數(shù)、中位數(shù)和平均數(shù)作為測量中心趨勢的指標所適用的數(shù)據(jù)類型。答:眾數(shù)是對中心趨勢最低層的測量,是適用范圍最大的一種測量方式,適用于任何類型的數(shù)據(jù),即定類、定序、定距和定比數(shù)據(jù)都可以用眾數(shù)來測量其中心趨勢。中位數(shù)適用于車輛定類數(shù)據(jù)外的所以其他類型數(shù)據(jù),因為中位數(shù)是處于中間位置的變量值,而定類數(shù)據(jù)不存在類別的先后次序或大小,因而中位數(shù)不適用于定類數(shù)據(jù)。平均數(shù)是集中趨勢最主要的測量指標,但是平均數(shù)僅適用于定距數(shù)據(jù)和定比數(shù)據(jù),定類數(shù)據(jù)和定序數(shù)據(jù)計算平均數(shù)沒有意義。一般說來,定類數(shù)據(jù)的中心趨受3U些胸不咯俱序數(shù)指懿N心趨勢測量指標是中位數(shù),而數(shù)值型數(shù)據(jù)(定距和定比數(shù)據(jù))的中心趨勢測量指標是平均數(shù)。14.舉例說明什么是離散變春蓮燕瓦 Q答:如果一個變量的變量值是間斷的,可以一一列舉的,這種變量稱為離散變量。例如兄弟姐妹數(shù)、結婚次數(shù)、工廠生產(chǎn)產(chǎn)品的數(shù)量等,其變量值的取值是0,1,2,3等。離散變量的取值是有限的,而且其取值是以整數(shù)位斷開的,是有最小計量單位的。例如,某人的兄弟姐妹數(shù),只能是1個.2個、3個等。而不能是1.3個、2.7個等。如果一個變量的變量值是連續(xù)不斷的。即可以取無限多個數(shù)值,這種變量稱為連續(xù)變量。例如,年齡,溫度,燈泡的壽命等,它們的取值是連續(xù)不斷的。連續(xù)變量可以取無限多個值,其取值是連續(xù)不斷的,不可以一一列舉的,而且,它們沒有最小計量單位。例如,年齡可以是1歲整,也可以是1.2歲、1.45歲2.544歲等。.SPSS主要有哪些功能?答:SPSS是軟件英文名稱各單詞的首字母,原意為StatisticalPackagefortheSocialSciences,即“社會科學統(tǒng)計軟件包”。但是隨SPSS產(chǎn)品服務領域的擴大和服務功能的深化,SPSS公司已于2000年正式將其英文全稱更改為StatisticalProductandServiceSolutions,意為“統(tǒng)計產(chǎn)品和服務解決方案”。SPSS現(xiàn)在的最新版本為16.0。它是世界上最早的統(tǒng)計分析軟件,由美國斯坦福大學的三位研究生于20世紀60年代末研制,同時成立了SPSS公司,并于1975年在芝加哥組建了SPSS總部。SPSS最突出的特點就是操作界面極為友好,輸出結果美觀漂亮,它使用Windows的窗口方式展示各種管理和分析數(shù)據(jù)方法的功能,使用對話框展示出各種功能選擇項,只要掌握一定的Windows操作技能,粗通統(tǒng)計分析原理,就可以使用該軟件為特定的科研工作服務。是非專業(yè)統(tǒng)計人員的首選統(tǒng)計軟件。SPSS采用類似EXCEL表格的方式輸入和管理數(shù)據(jù),數(shù)據(jù)接口較為通用,能方便的從其他數(shù)據(jù)庫中讀入數(shù)據(jù)。其統(tǒng)計過程包括了常用的、較為成熟的統(tǒng)計過程,完全可以滿足非統(tǒng)計專業(yè)人士的工作需要。對于熟悉老版本編程運行方式的用戶,SPSS還特別設計了語法生成窗口,用戶只需在菜單中選好各個選項,然后按“粘貼”按鈕就可以自動生成標準的SPSS程序。極大的方便了中、高級用戶。.在SPSS中如何定義變量屬性?答:一、變量的命名:對變量進行描述時,首先要定義變量名,它是存取變量的唯一標志。二、變量的類型:在VariableView窗口中,隱藏著很多對話框,如變量的類型、變量值標簽等。三、其他屬性:變量的其他屬性除變量名標簽外均可以通過隱藏的對話框來進行定義。.統(tǒng)計表主要由哪幾部分構成?答:主要是由標題(總標題和標目)、橫行和縱欄和數(shù)字資料三部分構成。統(tǒng)計表一般都包括總標題、橫標題、縱標題、數(shù)字資料、單位、制表日期??倶祟}是指表的名稱,它要能簡單扼要地反映出表的主要內容,橫標題是指每一橫行內數(shù)據(jù)的意義;縱標題是指每一縱欄內數(shù)據(jù)的意義;數(shù)字資料是指各空格內按要求填寫的數(shù)字;單位是指表格里數(shù)據(jù)的計量單位。在數(shù)據(jù)單位相同時,一般把單位放在表格的左上角。如果各項目的數(shù)據(jù)單位不同時,可放在表格里注明。制表日期放在表的右上角,表明制表的時間。各種統(tǒng)計表都應有“備考”或“附注”欄,以便必要時填入不屬于表內各項的事實或說明。.簡述相關系數(shù)的取值和意義。答;相關系數(shù)的取值在一1~1之間,相關系數(shù)的正負號表示兩個變量相關關系的方向,“+”表示正相關,“一”表示負相關。相關系數(shù)的絕對值表示相關關系的程度,絕對值越大,相關程度越強,即r越接近1;反之,絕對值越小,即r越接近0,相關程度越弱。四、計算題(每題15分,共30分).某校社會學專業(yè)同學統(tǒng)計課成績如下表所示。社會學專業(yè)同學統(tǒng)計課成績表學號成績學號成績學號成績101023761010377510105270101024911010387010105388101025871010397610105493101026781010409010105562101027851010417610105695101028961010428610105795101029871010439710105866101030861010449310105982101031901010459210106079101032911010468210106176101033801010478010106276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1)對測試成績按由低到高進行排序,求出眾數(shù)、中位數(shù)和平均數(shù)。(2)(2)對測試成績進行適當分組,編制頻數(shù)分布表,并計算累計頻數(shù)和累計頻率。解(1):測試成績由低到高排序:TOC\o"1-5"\h\z62, 66, 68, 70, 70, 75, 76, 76, 76, 76, 76, 77, 78, 79,80, 80, 80, 81, 82, 82, 83, 83, 85, 86, 86, 87, 87, 88,88, 90, 90, 90, 91, 91, 92, 93, 93, 94, 95, 95, 96, 97,

S3R眾數(shù):76中但姿:唬*E平均數(shù):=(62+66+ +96+97)+42=3490+42=83.095(2): 成績 頻數(shù)累計頻數(shù) 累計頻率60-693 3 3.41% 70-79 11 14 15.91% 70-7915 29 32.95%90-10013 42_守_j?予 17./3曲J「口匚v■4L6.5-0.33V225 ― 合計 AT3盤工—0-3T1-30Xr 22 '」qm 2為研究某種商需所整等件具鋁驕天怎珞影響,收集了12個地區(qū)的有關數(shù)據(jù)通過分析得到以下結果方差分析表變差來源SSdfMSFSig.回歸ABCD0.000殘差20515707EF總計1642766.6711要求:(1)計算上面方差分析表中A、B、C、D、E、F處的值。(2)商品銷售量的變差中有多少是由價格的差異引起的?(3)銷售量和價格之間的相關系數(shù)是多少?解:方差分析表:A=1642866.67-205158.07=1437708.60(SS總計-SS殘差)B=1,E=11-1=10(總計-B)C=A/B=1437708.60/1=1437708.60F=205158.07/10=20515.807變差來源SSdfMSFSig.變差來源SSdfMSFSig.回歸1437707.6011437707.6070.0770.000能差205157.071020515.707總計1642766.6711(2)即商品銷售量的變(3)I=…有77.毋%銷售量和價格之間的相關系數(shù)是0.9355分。解3.某公司招聘職員時,要求對職員進行兩項基本能力測試。已知,A項測試中平均分數(shù)為90分,標準差是12分;B測試中平均分數(shù)為200分,標準差為25一位應試者在A項測試中得了二1。2分,,在B項測試中得了215分。若兩項測試的成績均服從正態(tài)分布,該位應試者哪一項測試更理想?分。解—— - - -0.&該測試者在A項測試中比平均分高出1個標準差,而在B項測試中比平均分高出0.6個標準差。因而.可以說該測試者A項測試比較理想。4.某公司欲了解廣告費用x對銷售量y的影響,收集了20個地區(qū)的數(shù)據(jù),并對工、24.某公司欲了解廣告費用x對銷售量y的影響,收集了20個地區(qū)的數(shù)據(jù),并對工、2.航歸平方和SSR=1602707.6,殘差平方和SSE=40157.07。要求:解:(1)(寫出廣告費用y和銷售量程x之間的線性回歸方程。假如廣告費用投入50000元,根據(jù)回歸方程估計商品銷售量。計算判定系數(shù)R2,并解釋它的意義。y=364+1.42x當x=50000時,y=364+1.42X50000=71364耳馬一工裊_1D39D_].6+(1602707.6+40157.07)1602707.6+1642766.67y進行線,得到:方程的截距為364,回歸系數(shù)為1.42,回=0.875122注:解注:解:(1)已知."二工二7S=0.97556表明在商品銷售量的總變差中,有97.6%可以由回歸方程解釋,說明回歸方程的擬合程度很高;因而表明銷售量是靠廣告費用收入的。.為估計每個網(wǎng)絡用戶每天上網(wǎng)的平均時間是多少,抽取了225個網(wǎng)絡用戶的簡單隨機樣本,得到樣本均值為6.5個小時,樣本標準差為2.5個小時。試用95%的置信水平,計算網(wǎng)絡用戶每天平均上網(wǎng)時間的置信區(qū)間。在所調查也j2$個網(wǎng)絡用戶中,年齡在20歲以下的用戶為90個。以95%的置信水平,計算年齡在20歲以下的網(wǎng)絡用戶比例的置信區(qū)間。網(wǎng)絡用戶每天平均上網(wǎng)時間的95%的置信區(qū)間為:即(6.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論