版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
17四月2024講師教材實驗設(shè)計課程大綱實驗設(shè)計基本概念實驗方案設(shè)計實驗結(jié)果分析方差分析一、實驗設(shè)計的基本概念實驗設(shè)計的優(yōu)點術(shù)語及定義正交實驗設(shè)計原理實驗設(shè)計表發(fā)展歷程1920年,英國統(tǒng)計學(xué)家費歇爾用于農(nóng)田實驗;三、四十年代,英、美等國對DOE進行了進一步的研究,得以廣泛應(yīng)用于冶金、建筑、醫(yī)藥等行業(yè);二戰(zhàn)后,日本將其作為管理技術(shù)之一引進,經(jīng)發(fā)展成田口方法;現(xiàn)在,6SIGMA將其作為最主要的改善工具。日本經(jīng)濟發(fā)展中至少有10%的DOE的作用實驗方式:嘗試方法:依據(jù)數(shù)據(jù)每次實驗結(jié)果加入自己的專業(yè)判斷,以決定下一次實驗的參數(shù)組合。此方法需要很強的專業(yè)知識。單因子實驗方法:一次只改變一個輸入因子,以尋求該因子的最佳設(shè)定值。此方法不適合兩個因子同時影響輸出特性值的情況。多因子(多元配置)實驗方法:所有因子排列組合,對每一種可能都進行實驗,以找到最佳組合。此法只在因子數(shù)少時才使用。。正交實驗方法:通過由各因子在實驗中出現(xiàn)相同次數(shù),以平衡各因子的影響大小??赏瑫r解決以上兩個缺點。4/17/20246。DOE
簡介I任何事物都可看做一個過程。由于輸入的變化、各種干擾因素的影響以及各波動源之間可能存在的交互作用,使得過程的輸出變化不定。究竟是哪些因素顯著的影響著輸出的波動?在哪些條件下輸出能夠控制在理想的范圍內(nèi)?實驗設(shè)計(DOE)可幫我們解開其中之謎!過程輸入輸出
干擾DOE簡介IIDOE過程可分為實驗方案的設(shè)計和實驗結(jié)果的數(shù)據(jù)分析兩部分。實驗方案的設(shè)計包括確定實驗指標、選取因素、確定因素水平、建立實驗指標的數(shù)學(xué)模型和方案。實驗結(jié)果的數(shù)據(jù)分析是應(yīng)用線性代數(shù)、概率論和數(shù)理統(tǒng)計等數(shù)學(xué)工具對實驗數(shù)據(jù)進行分析處理,包括極差分析、方差分析.DOE
的優(yōu)點科學(xué)合理的安排實驗,從而減少實驗次數(shù),縮短實驗周期,提高經(jīng)濟效益從眾多的影響因素中找出影響輸出的主要因素分析影響因素之間交互作用影響的大小分析實驗誤差的影響大小,提高實驗精度找出較優(yōu)的參數(shù)組合,并通過對實驗結(jié)果的比較、分析,找出達到最優(yōu)化方案進一步實驗的方向?qū)ψ罴逊桨傅妮敵鲋颠M行預(yù)測術(shù)語及定義實驗因子和水平實驗設(shè)計表輸出變量因子因子:實驗中,影響實驗輸出的要素。又稱因素或輸入自變量x??煽匾蜃?實驗過程中可以設(shè)置和保持在希望的水平。噪聲因子:可導(dǎo)致實驗結(jié)果發(fā)生偏差,但無法控制。水平水平:實驗中各因子的不同取值。一般因素均取2-3個水平做實驗。水平范圍選擇要考慮對結(jié)果的影響程度,選擇適度。低-1高1實際影響實驗影響低-1高1實際影響實驗影響水平2水平:只需要考察因子對實驗結(jié)果的線性影響;3水平:考察因子對實驗結(jié)果的非線性影響。低-1中0高1Y低-1高1Y輸出變量實驗設(shè)計的輸出結(jié)果;盡可能使用計量型數(shù)據(jù);關(guān)注均值的最優(yōu)化及變差的最少化。例子某公司生產(chǎn)DVD-ROM用激光頭,經(jīng)定義分析激光頭與激光管的粘接力過小,要提高粘接力,需進行材料粘接實驗。水平因素(因子)輸出變量(實驗結(jié)果)ABC粘接時間粘接溫度膠牌號1(—)A1=10SB1=200555粘接力2(+)A2=8SB2=250360X3A3=5SB3=270Tu90術(shù)語及定義交互作用:因子間相互影響的程度。如粘接時間粘接溫度。實驗次數(shù):各因子的水平組合數(shù)。粘接力高溫低溫短粘接時間長粘接時間正交實驗設(shè)計表實驗設(shè)計表是實驗設(shè)計的工具,正交表是實驗設(shè)計表的代表。L(2)43正交實驗代號實驗次數(shù)因子數(shù)全因子實驗數(shù)水平正交實驗設(shè)計表實驗次數(shù)因子ABC1112212132114222正交實驗設(shè)計表原理正交實驗表的性質(zhì):整齊可比性:同一張表上,每個因素的每個水平出現(xiàn)的次數(shù)相等。均衡分散性:任意兩列的水平數(shù)字配對完全相等。111122121221222211212112假設(shè)最優(yōu)實驗點111不在實驗中,可通過相鄰實驗點(211,112,121)很容易找到。常用正交設(shè)計表L(2)43L(2)87L(2)1211L(2)1615L(3)94L(3)2713L(4)165L(5)256L(2*3)1817L(4*2)814L(4*2)16112二、實驗方案設(shè)計實驗設(shè)計方案實驗設(shè)計流程實驗設(shè)計的成功因素實驗設(shè)計的類別和用途選擇實驗類別需考慮:實驗?zāi)繕艘蜃雍退綌?shù)每次實驗的成本根據(jù)不同的目標和因子數(shù),包括6種實驗類別。實驗設(shè)計類別實驗類型目標可控因子數(shù)全因子實驗尋找最有利于輸出的因子水平建立可評估所有交互影響的數(shù)學(xué)模型4因子之內(nèi)部分因子實驗尋找最有利于輸出的因子水平建立可評估所有交互影響的數(shù)學(xué)模型5因子以上篩選實驗從大量因子中找到少數(shù)關(guān)鍵因子7因子以上中心復(fù)合設(shè)計優(yōu)化,建立非線性影響存在時的數(shù)學(xué)模型,(響應(yīng)表面方法)3因子以上可靠設(shè)計優(yōu)化,當存在噪聲因子變化的場合發(fā)現(xiàn)輸出最小變異時對應(yīng)的因子水平。5因子以上田口可靠設(shè)計優(yōu)化,優(yōu)化產(chǎn)品或制造過程函數(shù),使輸出對噪聲因子敏感最小,對輸入因子敏感性最大7因子以上實驗類別的選擇流程確定實驗?zāi)繕诉x定因子篩選DOE因子>7實驗精度不高全/部分因子DOE優(yōu)化DOE結(jié)果分析目標達成結(jié)束DOE
運作
流程確定實驗?zāi)繕酥朴唽嶒炘O(shè)計計劃確定實驗類別實驗準備驗證測量系統(tǒng)實驗及記錄數(shù)據(jù)結(jié)果分析優(yōu)化組合驗證實驗控制DOE實驗計劃表項目名稱:日期:DOE目標:相關(guān)背景:輸出特性:測量方法:規(guī)格:因子對輸出的影響目前水平范圍易改變性低水平高水平備注:制訂實驗計劃的注意事項:最好選擇單一輸出變量;在選擇因子實驗時,根據(jù)經(jīng)驗和歷史數(shù)據(jù)先篩選,以降低成本;對與無法確認實驗影響程度的因子,可先通過篩選實驗確定其對輸出的影響;確定可能影響輸出變量的噪聲因子。DOE成功的關(guān)鍵準確衡量實驗指標詳細的輸入因子可靠的設(shè)計方案詳盡的實驗計劃合格的測量系統(tǒng)可追溯的實驗條件運用DOE,優(yōu)選ASIMODEL857蝕刻(ETCHING)工藝,提高印刷電路板的線路質(zhì)量案例I實驗方案的設(shè)計明確目的,確定指標實驗?zāi)康?優(yōu)選蝕刻(ETCHING)工藝,明確蝕刻溫度、速度、銅厚對蝕刻效果的影響,使制程變差最小化實驗指標:線寬目標值為5mil+/-1mil
制定因素水平表根據(jù)以往的蝕刻操作記錄,并參閱有關(guān)資料,選取如下因素水平表,并認為因子間存在交互影響。設(shè)計實驗方案本實驗選用正交表L8(2/7),溫度(TEMP)、速度(SPEED)、銅厚(COPPERTHK)作全因子實驗,以考察因子間的交互影響。設(shè)計實驗方案(MINITAB)創(chuàng)建因子設(shè)計方案設(shè)計實驗方案(MINITAB)選擇3因子2水平的全因子實驗設(shè)計實驗方案(MINITAB)選擇全因子設(shè)計方案分區(qū)(不同人,時間,地點)選擇中心點,考察非線性影響選擇重復(fù)實驗,考察實驗誤差,判斷因子水平的顯著影響設(shè)計實驗方案(MINITAB)命名因子名稱,確定因子的數(shù)據(jù)類型設(shè)計實驗方案(MINITAB)隨機實驗設(shè)計實驗方案(MINITAB)多因子的交互影響全因子實驗設(shè)計方案(MINITAB)標準順序?qū)嶒烅樞蛑行狞c分區(qū)蝕刻溫度蝕刻速度銅厚81111(50)1(78)1(1.5)5211-1(45)-1(50)123111-1-1(1.3)64111-113511-11-17611-1111711-1-1-1481111-1。運用正交實驗,優(yōu)選SANMINA(ASIA)波峰焊接工藝,提高印刷電路板的焊接質(zhì)量案例2。實驗方案的設(shè)計明確目的,確定指標實驗?zāi)康?優(yōu)選波峰焊接工藝,提高印刷電路板的焊接質(zhì)量實驗指標:衡量波峰焊接質(zhì)量的好壞,是疵點(搭絲,拉尖,漏焊,半焊,氣孔等)數(shù)目的多少.據(jù)各種疵點影響整機電性能的重要程度,采用加權(quán)平均法,以加權(quán)疵點數(shù)作為實驗指標.具體作法如下:。加權(quán)疵點數(shù)Y=∑αiCiY越小越好.實驗指標。
制定因素水平表根據(jù)以往的波焊操作記錄,并參閱有關(guān)資料,選取如下因素水平表又據(jù)專業(yè)知識,可能忽略因素間的交互作用.。設(shè)計實驗方案本實驗選用正交表L9(3/4),由于四個因素將四個列全部排滿,因此,無法估計實驗誤差的大小.為此,一般的做法是,采用重復(fù)實驗的方法(例如,每號方案至少做兩次實驗),或者選用更大的正交表(例如,選取L18(2/1*3/7)或L27(3/13).但是,這樣做均會導(dǎo)致實驗次數(shù)成倍增加.本例,在其后的方差分析中,將影響小的因素當誤差看待,來檢驗其它因素的顯著性,這也不失為一種方法.實驗方案表3、實驗結(jié)果分析實驗結(jié)果的確定及測量極差分析方差分析回歸分析影響實驗結(jié)果分析精度的幾個重要因素實驗誤差項每個實驗組合中取得多個數(shù)據(jù)引起的變異樣本數(shù)量樣本數(shù)量大則實驗誤差小,樣本數(shù)量不得少于3個,但要考慮成本。實驗結(jié)果的評價方法對于多指標要轉(zhuǎn)化為綜合指標,如案例2。極差分析特點:簡單,可直接手工計算,只能定性分析因子對輸出變量的影響。案例2從上表可以看出,9個實驗方案中,第5號方案加權(quán)缺陷數(shù)最少.因此,直接看的最好方案為第5號方案,相應(yīng)的工藝條件為:A2B2C3D1.實驗結(jié)果的直觀分析實驗結(jié)果的極差分析列表計算下列各值KA1=(42.31+35.23+25.3)/3=34.28KA2=(40.48+11.4+14.39)/3=22.09KA3=(28.1+16.67+21.58)/3=22.12KB1=36.97KB2=21.1KB3=20.42KC1=24.46KC2=32.43KC3=21.6KD1=25.1KD2=25.91KD3=27.48RA的水平極差=12.19RB的水平極差=16.55RC的水平極差=10.83RD的水平極差=2.38極差分析表K134.2836.9724.4625.1K222.0921.132.4325.91K322.1220.4221.627.48R12.1916.5510.832.38實驗結(jié)果的極差分析按極差大小,判斷因素的影響大小本列因素的主次關(guān)系為:主次BACD最佳工藝確定
由于Y的數(shù)值越小越好,所以比較各因素的Ti大小,可得最佳工藝為:A2B3C3D1,此方案不在已做的9個實驗之中.方差分析特點:分析方法復(fù)雜;可定量地分析出各因子對輸出的影響程度;能確定實驗誤差;可從統(tǒng)計上確定真正的重要因子。方差分析原理見附錄單因子方差分析例子:某公司品質(zhì)部想確認三個供應(yīng)商供應(yīng)的電阻對產(chǎn)品性能的影響有無差別。實驗因子各取5個樣品的實驗結(jié)果電阻123451供應(yīng)商A10121314192供應(yīng)商應(yīng)商C2118151216單因子方差分析結(jié)果(MINITAB)SourceDFSSMSF值P值供應(yīng)商水平影響221.7310.871.290.311誤差12101.208.43總和14122.93S=2.904R-Sq=17.68%R-Sq(adj)=3.96%Individual95%CIsForMeanBasedonPooledStDev水平樣本MeanStDevA513.6003.362(----------*-----------)B515.8001.643(----------*-----------)C516.4003.362(-----------*----------)-------+---------+---------+---------+--12.515.017.520.0當P<0.05時表示不同供應(yīng)商水平對實驗結(jié)果有顯著影響雙因子方差分析PCBA焊接品質(zhì)與焊接溫度和焊錫絲的松香含量有關(guān),根據(jù)不同水平的焊接溫度和松香比重實驗得出相應(yīng)的焊點不良數(shù).實驗因子輸出YA(溫度)B(含量)111302124031355421305226562355731358321593375Two-wayANOVA:YversusA,BSourceDFSSMSFPA2138.8969.4440.200.827B21438.89719.4442.060.242Error41394.44348.611Total82972.22S=18.67R-Sq=53.08%R-Sq(adj)=6.17%雙因子方差分析結(jié)果(MINITAB)當P<0.05時表示因子的不同水平對實驗結(jié)果有顯著影響案例2實驗結(jié)果的方差分析修正項的計算CT=Square(T)/n=235.46*235.46/9=6160.16總波動平方和ST及自由度fTST=∑SquareYi-CT=(42.31*42.31+…+21.58*21.58)-6160.16=1020.08fT=n-1=8各列波動平方和以第1列為例,計算如下:S1=SA=(SquareT1+SquareT2+SquareT3)/r–CT=(102.84*102.84+66.27*66.27+66.35*66.35)/3–6160.16=296.54f1=fA=3-1=2驗證公式S1+S2+S3+S4=ST實驗結(jié)果的方差分析方差分析將上述計算結(jié)果整理為下面的方差分析表方差分析表明,相對于因素D而言,A,B,C三個因素的影響均是顯著的.最佳工藝的確定,與前面一樣,為A2B3C3D1.對影響不顯著的因素可以從成本考慮選擇水平實驗結(jié)果的方差分析注:F=各因素均方差/誤差均方差,在沒有誤差欄時候,用最小的方差項代替.Se=SD,fe=fD計算各因素F值查表F臨界值=F
0.05(2,8)=8.65F值>F臨界值,因素有顯著影響.方差分析的顯著性判定因子對響應(yīng)平均值的影響排列LevelABCD134.2836.9624.4625.10222.0921.1032.4325.91322.1220.4221.6027.48Delta12.1916.5410.832.39Rank2134。驗證實驗驗證實驗結(jié)果表明,上述工藝條件確實是最佳的,其焊接質(zhì)量大幅度改進.DOE
實驗數(shù)據(jù)(只做一次實驗)案例IStdOrderRunOrderCenterPtBlocks溫度速度銅厚線寬81111116.75211-1-114.723111-1-15.164111-114.53511-11-17.17611-1116.31711-1-1-15.5481111-17.9實驗結(jié)果分析(MINITAB)輸出變量確定殘值圖形確定主要影響因子確定殘值與變量的對比圖形分析(MINITAB)由圖可知,速度為影響線寬的主要因子FactorialFit:線寬versus溫度,速度,銅厚EstimatedEffectsandCoefficientsfor線寬(codedunits)
TermEffect系數(shù)SECoefTPConstant5.97500.0750079.670.008溫度0.15000.07500.075001.000.500速度2.05001.02500.0750013.670.046銅厚-0.8500-0.42500.07500-5.670.111溫度*速度0.45000.22500.075003.000.205溫度*銅厚-0.0500-0.02500.07500-0.330.795速度*銅厚-0.1500-0.07500.07500-1.000.500S=0.212132R-Sq=99.57%R-Sq(adj)=96.97%P<0.05為顯著因子越接近1,回歸擬合的越好回歸分析(MINITAB)回歸方程:線寬=5.98+0.075溫度+1.02速度-0.425銅厚方差分析AnalysisofVariancefor線寬(codedunits)SourceDFSeqSSAdjSSAdjMSFPMainEffects39.89509.895003.2983373.300.0862-WayInteractions30.45500.455000.151673.370.376ResidualError10.04500.045000.04500Total710.3950P>0.05為影響不顯著由圖可知,殘值不呈正態(tài)分布,收集的數(shù)據(jù)太少殘值沒有隨機分布,擬合模型不好殘值分析—查看擬合模型的適合性各因子水平產(chǎn)生的殘值相等,表明水平變化不能減少輸出變量的變差殘值與輸出變量對比分析—尋找減少變差的機會實驗結(jié)果(重復(fù)實驗6次)StdOrder實驗順序CenterPtBlocks溫度速度銅厚線寬1211150781.36.31121145781.37.33331145501.35.51541145781.57.92651150501.34.52561145501.3556.31481150501.54.61391145501.55.346101150501.54.642111150501.34.741121145501.35.57131145781.57.7……………………第一種分析方法:與單次實驗方法同回歸分析(MINITAB)FactorialFit:線寬versus溫度,速度,銅厚EstimatedEffectsandCoefficientsfor線寬(codedunits)TermEffect系數(shù)SECoefTPConstant5.92080.02524234.620.000溫度-0.8333-0.41670.02524-16.510.000速度1.98330.99170.0252439.300.000銅厚0.13330.06670.025242.640.012溫度*速度-0.2250-0.11250.02524-4.460.000溫度*銅厚-0.0750-0.03750.02524-1.490.145速度*銅厚0.19170.09580.025243.800.000S=0.174840R-Sq=97.84%R-Sq(adj)=97.53%P<0.05表示有顯著影響因子對輸出變量的貢獻方差分析(MINITAB)是否有顯著影響判斷擬合是否適合,P<0.05表示擬合不良AnalysisofVariancefor線寬(codedunits)SourceDFSeqSSAdjSSAdjMSFPMainEffects355.750055.750018.5833607.910.0002-WayInteractions31.11581.11580.371912.170.000ResidualError411.25331.25330.0306LackofFit10.08330.08330.08332.850.099PureError401.17001.17000.0292Total4758.1192回歸方程:線寬=5.92-0.42溫度+0.99速度-0.067銅厚-0.11溫度*速度-0.038溫度*銅厚+0.096速度*銅厚圖形分析-(MINITAB)紅色為顯著性影響超過紅線表示有顯著影響主效應(yīng)及交互分析(MINITAB)可以看出影響程度依次為速度,溫度,銅厚當兩條線有交叉趨勢時表示有交互影響,即在速度大時,溫度越低,線相對越寬;而隨著速度減低,溫度越低,線反而相對變窄殘值分析—MINITAB正態(tài)分布擬和良好,殘值隨機分布,表示擬合好.殘值與輸出變量對比分析銅厚高水平比低水平,速度低水平比高水平時產(chǎn)生的輸出變差少優(yōu)化—MINITAB(只考慮平均值)優(yōu)化—MINITAB(只考慮平均值)最佳預(yù)測值因子對標準差的影響分析1.計算標準差(在因子設(shè)計找到下圖)因子對標準差的影響分析2.對標準差進行因子設(shè)計分析,如下圖.因子對標準差的影響分析FactorialFit:標準差versus溫度,速度,銅厚EstimatedEffectsandCoefficientsfor標準差(codedunits)TermEffectCoefSECoefTPConstant0.168250.00269662.400.010溫度-0.02426-0.012130.002696-4.500.139速度0.036240.018120.0026966.720.094銅厚-0.01738-0.008690.002696-3.220.192溫度*速度0.027040.013520.0026965.010.125溫度*銅厚0.028260.014130.0026965.240.120速度*銅厚0.001480.000740.0026960.270.830S=0.00762645R-Sq=99.23%R-Sq(adj)=94.59%AnalysisofVariancefor標準差(codedunits)SourceDFSeqSSAdjSSAdjMSFPMainEffects30.00440.00440.0014725.260.1452-WayInteractions30.00300.00300.001017.560.173ResidualError10.0000.0000.000Total70.00752972因子對標準差的影響分析分析結(jié)果表明因子對標準差無顯著影響;圖形分析略優(yōu)化—MINITAB(考慮標準差最小化)優(yōu)化—MINITAB(考慮標準差最小化)優(yōu)化—MINITAB(結(jié)合平均值和標準差最,使能力最大化)第二種分析方法:分別進行方差分析和回歸分析方差分析(結(jié)果與前同)回歸分析(結(jié)果與前同)附錄:方差分析的基本概念什么是方差分析(ANOVA)?
(analysisofvariance)檢驗多個總體均值是否相等通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等研究分類型自變量對數(shù)值型因變量的影響一個或多個分類尺度的自變量兩個或多個(k個)處理水平或分類一個間隔或比率尺度的因變量有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個分類的自變量雙因素方差分析:涉及兩個分類的自變量什么是方差分析?(例題分析)消費者對四個行業(yè)的投訴次數(shù)行業(yè)觀測值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對幾個行業(yè)的服務(wù)質(zhì)量進行評價,消費者協(xié)會在四個行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費者對總共23家企業(yè)投訴的次數(shù)如下表什么是方差分析?(例題分析)分析四個行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗這四個行業(yè)被投訴次數(shù)的均值是否相等若它們的均值相等,則意味著“行業(yè)”對投訴次數(shù)是沒有影響的,即它們之間的服務(wù)質(zhì)量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異方差分析中的有關(guān)術(shù)語因素或因子(factor)所要檢驗的對象要分析行業(yè)對投訴次數(shù)是否有影響,行業(yè)是要檢驗的因素或因子水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)就是因子的水平觀察值在每個因素水平下得到的樣本數(shù)據(jù)每個行業(yè)被投訴的次數(shù)就是觀察值方差分析中的有關(guān)術(shù)語實驗這里只涉及一個因素,因此稱為單因素四水平的實驗總體因素的每一個水平可以看作是一個總體比如零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)可以看作是四個總體樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這四個總體中抽取的樣本數(shù)據(jù)方差分析的基本思想和原理方差分析的基本思想和原理(圖形分析)零售業(yè)旅游業(yè)航空公司家電制造從散點圖上可以看出不同行業(yè)被投訴的次數(shù)是有明顯差異的同一個行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理(圖形分析)僅從散點圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異也可能是由于抽樣的隨機性所造成的需要有更準確的方法來檢驗這種差異是否顯著,也就是進行方差分析所以叫方差分析,因為雖然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進行方差分析時,需要考察數(shù)據(jù)誤差的來源方差分析的基本思想和原理1. 比較兩類誤差,以檢驗均值是否相等2. 比較的基礎(chǔ)是方差比3. 如果系統(tǒng)(處理)誤差明顯地不同于隨機誤差,則均值就是不相等的;反之,均值就是相等的4. 誤差是由各部分的誤差占總誤差的比例來測度的方差分析的基本思想和原理方差分析的基本思想和原理(兩類誤差)隨機誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的這種差異可以看成是隨機因素的影響,稱為隨機誤差
系統(tǒng)誤差因素的不同水平(不同總體)下,各觀察值之間的差異比如,不同行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差方差分析的基本思想和原理(兩類方差)數(shù)據(jù)的誤差用平方和(sumofsquares)表示,稱為方差組內(nèi)方差(withingroups)因素的同一水平(同一個總體)下樣本數(shù)據(jù)的方差比如,零售業(yè)被投訴次數(shù)的方差組內(nèi)方差只包含隨機誤差組間方差(betweengroups)因素的不同水平(不同總體)下各樣本之間的方差比如,四個行業(yè)被投訴次數(shù)之間的方差組間方差既包括隨機誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理(方差的比較)若不同行業(yè)對投訴次數(shù)沒有影響,則組間誤差中只包含隨機誤差,沒有系統(tǒng)誤差。這時,組間誤差與組內(nèi)誤差經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就會接近1若不同行業(yè)對投訴次數(shù)有影響,在組間誤差中除了包含隨機誤差外,還會包含有系統(tǒng)誤差,這時組間誤差平均后的數(shù)值就會大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會大于1當這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,也就是自變量對因變量有影響判斷行業(yè)對投訴次數(shù)是否有顯著影響,實際上也就是檢驗被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對投訴次數(shù)有顯著影響方差分析的基本假定方差分析的基本假定每個總體都應(yīng)服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本比如,每個行業(yè)被投訴的次數(shù)必需服從正態(tài)分布各個總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,四個行業(yè)被投訴次數(shù)的方差都相等觀察值是獨立的比如,每個行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨立方差分析中的基本假定在上述假定條件下,判斷行業(yè)對投訴次數(shù)是否有顯著影響,實際上也就是檢驗具有同方差的四個正態(tài)總體的均值是否相等如果四個總體的均值相等,可以期望四個樣本的均值也會很接近四個樣本的均值越接近,推斷四個總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分方差分析中基本假定
如果原假設(shè)成立,即H0:
m1=m2=m3=m4四個行業(yè)被投訴次數(shù)的均值都相等意味著每個樣本都來自均值為
、方差為
2的同一正態(tài)總體
Xf(X)
1
2
3
4
方差分析中基本假定
若備擇假設(shè)成立,即H1:
mi(i=1,2,3,4)不全相等至少有一個總體的均值是不同的四個樣本分別來自均值不同的四個正態(tài)總體
Xf(X)
3
1
2
4
問題的一般提法問題的一般提法設(shè)因素有k個水平,每個水平的均值分別用
1,
2,,
k
表示要檢驗k個水平(總體)的均值是否相等,需要提出如下假設(shè):H0:
1
2
…
k
H1:
1,
2,,
k
不全相等設(shè)
1為零售業(yè)被投訴次數(shù)的均值,
2為旅游業(yè)被投訴次數(shù)的均值,
3為航空公司被投訴次數(shù)的均值,
4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為H0:
1
2
3
4
H1:
1,
2,
3,
4不全相等2單因素方差分析2.1數(shù)據(jù)結(jié)構(gòu)2.2分析步驟2.3統(tǒng)計決策2.4單因素方差分析案例單因素方差分析的數(shù)據(jù)結(jié)構(gòu)(one-wayanalysisofvariance)
觀察值(j)因素(A)i
水平A1水平A2
…水平Ak12::n
x11
x21
…
xk1x12
x22
…
xk2::
:
:::
:
:x1n
x2n
…
xkn分析步驟提出假設(shè)構(gòu)造檢驗統(tǒng)計量統(tǒng)計決策提出假設(shè)一般提法H0:m1=m2=…=
mk
自變量對因變量沒有顯著影響
H1:m1,m2,…,mk不全相等自變量對因變量有顯著影響
注意:拒絕原假設(shè),只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等構(gòu)造檢驗的統(tǒng)計量構(gòu)造統(tǒng)計量需要計算水平的均值全部觀察值的總均值誤差平方和均方(MS)
構(gòu)造檢驗的統(tǒng)計量(計算水平的均值)假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)計算公式為式中:ni為第i個總體的樣本觀察值個數(shù)
xij為第i個總體的第j個觀察值
構(gòu)造檢驗的統(tǒng)計量(計算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個數(shù)計算公式為構(gòu)造檢驗的統(tǒng)計量(例題分析)構(gòu)造檢驗的統(tǒng)計量(計算總誤差平方和SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計算公式為前例的計算結(jié)果:
SST=(57-47.869565)2+…+(58-47.869565)2=115.9295構(gòu)造檢驗的統(tǒng)計量(計算水平項平方和SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機誤差,也包括系統(tǒng)誤差計算公式為前例的計算結(jié)果:SSA=1456.608696構(gòu)造檢驗的統(tǒng)計量(計算誤差項平方和SSE)每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內(nèi)平方和該平方和反映的是隨機誤差的大小計算公式為前例的計算結(jié)果:SSE=2708構(gòu)造檢驗的統(tǒng)計量(三個平方和的關(guān)系)
總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關(guān)系SST=SSA+SSE前例的計算結(jié)果:4164.608696=1456.608696+2708構(gòu)造檢驗的統(tǒng)計量(三個平方和的作用)
SST反映全部數(shù)據(jù)總的誤差程度;SSE反映隨機誤差的大??;SSA反映隨機誤差和系統(tǒng)誤差的大小如果原假設(shè)成立,則表明沒有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統(tǒng)誤差判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組內(nèi)方差之間差異的大小構(gòu)造檢驗的統(tǒng)計量(計算均方MS)各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計算方法是用誤差平方和除以相應(yīng)的自由度三個平方和對應(yīng)的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個數(shù)SSE的自由度為n-k構(gòu)造檢驗的統(tǒng)計量(計算均方MS)組間方差:SSA的均方,記為MSA,計算公式為組內(nèi)方差:SSE的均方,記為MSE,計算公式為構(gòu)造檢驗的統(tǒng)計量(計算檢驗統(tǒng)計量F)將MSA和MSE進行對比,即得到所需要的檢驗統(tǒng)計量F當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即構(gòu)造檢驗的統(tǒng)計量(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE
1a
F分布F
(k-1,n-k)0拒絕H0不能拒絕H0F統(tǒng)計決策
將統(tǒng)計量的值F與給定的顯著性水平
的臨界值F
進行比較,作出對原假設(shè)H0的決策根據(jù)給定的顯著性水平
,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值F
若F>F
,則拒絕原假設(shè)H0,表明均值之間的差異是顯著的,所檢驗的因素對觀察值有顯著影響若F<F
,則不能拒絕原假設(shè)H0,表明所檢驗的因素對觀察值沒有顯著影響單因素方差分析表(基本結(jié)構(gòu))單因素方差分析(例題分析)無交互作用的雙因素方差分析
(無重復(fù)雙因素分析)雙因素方差分析(例題分析)不同品牌的彩電在各地區(qū)的銷售量數(shù)據(jù)品牌因素地區(qū)因素地區(qū)1地區(qū)2地區(qū)3地區(qū)4地區(qū)5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例】有4個品牌的彩電在5個地區(qū)銷售,為分析彩電的品牌(品牌因素)和銷售地區(qū)(地區(qū)因素)對銷售量是否有影響,對每種品牌在各地區(qū)的銷售量取得以下數(shù)據(jù)。試分析品牌和銷售地區(qū)對彩電的銷售量是否有顯著影響?(=0.05)數(shù)據(jù)結(jié)構(gòu)
數(shù)據(jù)結(jié)構(gòu)
是行因素的第i個水平下各觀察值的平均值
是列因素的第j個水平下的各觀察值的均值
是全部kr個樣本數(shù)據(jù)的總平均值分析步驟(提出假設(shè))
提出假設(shè)對行因素提出的假設(shè)為H0:m1=m2
=
…=mi=…=
mk(mi為第i個水平的均值)H1:mi
(i=1,2,…,k)不全相等對列因素提出的假設(shè)為H0:m1=m2
=
…=mj=…=
mr(mj為第j個水平的均值)H1:mj
(j=1,2,…,r)不全相等分析步驟(構(gòu)造檢驗的統(tǒng)計量)計算平方和(SS)總誤差平方和行因素誤差平方和列因素誤差平方和隨機誤差項平方和分析步驟(構(gòu)造檢驗的統(tǒng)計量)
總離差平方和(SST)、水平項離差平方和(SSR和SSC)、誤差項離差平方和(SSE)之間的關(guān)系SST=SSR+SSC+SSE分析步驟(構(gòu)造檢驗的統(tǒng)計量)
計算均方(MS)誤差平方和除以相應(yīng)的自由度三個平方和的自由度分別是總離差平方和SST的自由度為kr-1行因素的離差平方和SSR的自由度為k-1列因素的離差平方和SSC的自由度為r-1隨機誤差平方和SSE的自由度為(k-1)×(r-1)
分析步驟(構(gòu)造檢驗的統(tǒng)計量)計算均方(MS)行因素的均方,記為MSR,計算公式為列因素的均方,記為MSC,計算公式為隨機誤差項的均方,記為MSE,計算公式為分析步驟(構(gòu)造檢驗的統(tǒng)計量)
計算檢驗統(tǒng)計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度汽車維修與租賃業(yè)務(wù)管理服務(wù)合同2篇
- 四年級下學(xué)期教學(xué)計劃集錦五篇
- 小學(xué)三年級上冊英語教案
- 元旦晚會主持稿集合15篇
- 寫給老師的道歉信模板集合八篇
- 秋天的校園作文400字范文(10篇)
- 幼兒園春季學(xué)期工作總結(jié)5篇
- 我的愿望小學(xué)作文15篇
- 畢業(yè)實習(xí)總結(jié)(集合15篇)
- 工程居間協(xié)議協(xié)議書3篇
- 礦井軌道質(zhì)量標準及架線維護規(guī)程
- 打字測試評分標準
- VBOXTools軟件操作手冊
- 外研版(三年級起點)五年級上冊重點知識點復(fù)習(xí)
- 2023-2024學(xué)年四川省涼山州小學(xué)數(shù)學(xué)六年級上冊期末自測試卷
- 2023年報告文學(xué)研究(自考)(重點)題庫(帶答案)
- GB/T 18691.5-2021農(nóng)業(yè)灌溉設(shè)備灌溉閥第5部分:控制閥
- 安全帶管理登記臺帳
- 第26課《詩詞五首-漁家傲》課件【教材精講精研】部編版語文八年級上冊
- 湖南省高等教育自學(xué)考試 畢業(yè)生登記表
- 湖北省武漢市江漢區(qū)2021-2022七年級初一上學(xué)期期末數(shù)學(xué)試卷+答案
評論
0/150
提交評論