標(biāo)準(zhǔn)腸桿菌的數(shù)值分類方法_第1頁(yè)
標(biāo)準(zhǔn)腸桿菌的數(shù)值分類方法_第2頁(yè)
標(biāo)準(zhǔn)腸桿菌的數(shù)值分類方法_第3頁(yè)
標(biāo)準(zhǔn)腸桿菌的數(shù)值分類方法_第4頁(yè)
標(biāo)準(zhǔn)腸桿菌的數(shù)值分類方法_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、    標(biāo)準(zhǔn)腸桿菌的數(shù)值分類方法        摘要:利用SAS軟件中的Cluster過(guò)程編制程序繪制了分類的樹(shù)枝,結(jié)合專業(yè)知識(shí)及統(tǒng)計(jì)上分類較佳標(biāo)準(zhǔn),對(duì)腸桿菌中的89株標(biāo)準(zhǔn)菌進(jìn)行數(shù)值分類,收到了良好的效果。關(guān)鍵詞:腸桿菌SAS軟件聚類分析數(shù)值分類中分類號(hào):R 378.2文章編號(hào):1004-4337(2000)01-0019-02微生物中細(xì)菌的分類方法有多種1,隨著醫(yī)學(xué)的迅猛發(fā)展,利用計(jì)算機(jī)對(duì)細(xì)菌進(jìn)行數(shù)值分類,已越來(lái)越受到人們的重視。本文利用SAS軟件中的聚類分析,對(duì)89株標(biāo)準(zhǔn)

2、腸桿菌的數(shù)值分類進(jìn)行了探討。1資料我們研究了細(xì)菌細(xì)胞結(jié)構(gòu)的30分鐘脫氫酶檢測(cè)方法,來(lái)指示完整細(xì)胞脫氫酶活性和部分水解酶活性,并以脫氫酶反應(yīng)作為細(xì)菌分類標(biāo)志。共選取了20項(xiàng)指標(biāo),每一株細(xì)菌在每項(xiàng)指標(biāo)下的反應(yīng)是陽(yáng)性輸入微機(jī)時(shí)記為1、陰性變?yōu)?,每菌株根據(jù)穩(wěn)定情況重復(fù)做215次實(shí)驗(yàn),取其均值作為在相應(yīng)指標(biāo)下的原始數(shù)據(jù),見(jiàn)表1。表1標(biāo)準(zhǔn)腸桿菌的資料(±S)及聚類均數(shù)指標(biāo)名稱標(biāo)準(zhǔn)菌資料±S類別編號(hào)12345678色氨酸X10.2472±0.43380.0000.0000.0000.9001.0001.0000.0001.000香草酸X20.0449±0.20840

3、.0000.0000.0000.0000.0000.0001.0000.000肌醇X30.1236±0.33100.0000.0000.2000.0000.0001.0000.0000.000亮氨酸X40.2562±0.43690.0000.0000.0001.0001.0001.0000.0001.000蘇氨酸X50.2146±0.39130.0530.0000.3200.9300.0000.6000.0001.000賴氨酸X60.3558±0.44950.3070.0160.8000.9670.0000.7140.0001.000精氨酸X70.015

4、4±0.09580.0000.0000.0000.0170.0000.0000.0000.200乙酸鈉X80.5349±0.46060.8560.0161.0000.4040.0000.7430.8330.200阿拉伯糖X90.5004±0.47270.9240.1601.0000.2870.0000.0570.3330.575丙二酸鈉X100.0073±0.03960.0000.0000.0000.0000.0000.0000.0000.225葡萄糖X110.9865±0.10791.0000.9921.0001.0001.0001.0001

5、.0001.000乳糖X120.1685±0.37650.3330.0001.0000.0000.0000.0000.0000.000麥芽糖X130.9865±0.10791.0000.9921.0001.0001.0001.0001.0001.000甘露醇X140.6270±0.48451.0000.5921.0000.1000.0000.0001.0000.000蔗糖X150.1528±0.35550.0000.0400.4000.0200.0001.0000.3330.200纖維二糖X160.0901±0.26480.0340.0000.

6、9200.0200.5000.0290.0000.000海藻糖X170.7989±0.39501.0000.3921.0000.9800.5001.0001.0000.750甜糖X180.0857±0.23990.0370.0000.0800.0000.0000.4760.0000.000谷氨酸X190.7520±0.41290.8440.3520.9601.0001.0001.0001.0001.000葡萄糖酸X200.5401±0.44450.7640.1080.9600.5370.0000.5901.0000.6752方法及結(jié)果 2.1系統(tǒng)聚類SA

7、S軟件聚類分析提供了五個(gè)過(guò)程:Cluster、Fastclus、Varclus、Tree及Aceclus過(guò)程。我們采用了Cluster系統(tǒng)聚類過(guò)程對(duì)89株標(biāo)準(zhǔn)菌株進(jìn)行了聚類。Clustcr過(guò)程中有11種聚類方法,經(jīng)類平均法、重心法、最小方差法、最短距離法、中位數(shù)法等幾種方法聚類,以類平均法較為理想,結(jié)果見(jiàn)表2。表2系統(tǒng)聚類中類平均法的聚類過(guò)程編號(hào)類別連接的類頻數(shù)SPRSQRSQERSQCCCPSFPST2距離88OB3OB420.000001.0000.00087OB28OB2920.000001.0000.00016CL23OB67300.009070.7850.64315.1817.83.

8、54.54515OB130B1920.005870.7790.62915.9218.6.4.54714CL24OB2050.008610.7710.61516.3719.42.94.75213OB52OB5520.006620.7640.55917.2220.5.4.82812CL16CL18550.107680.6560.5836.4913.436.04.84211CL21CL15120.016830.6390.5666.0013.86.15.13210CL14OB7860.012940.6260.5476.4814.73.05.7153CL4CL6870.076950.1540.311-7

9、.847.88.58.5762CL3OB9880.049230.1050.196-5.0410.25.010.2131CL2OB85890.104850.0000.0000.0010.214.2812.2選擇合適的類數(shù)表2中的SPRSQ、RSQ、ERSQ、CCC、PSF和PST2,是六個(gè)衡量聚類情況的統(tǒng)計(jì)量。其中SPRSQ為半偏R2,它表示每一次合并對(duì)信息損失程度的大??;RSQ為R2,它反映的是累計(jì)聚類結(jié)果,上一次的R2減去本次半偏R2等于本次R2;ERSQ為在一致無(wú)效假設(shè)下近似期望的R2;CCC是打印在均勻原假設(shè)之下的立方聚類檢驗(yàn)統(tǒng)計(jì)量;PSF是偽F統(tǒng)計(jì)量;PST2是t2統(tǒng)計(jì)量。因此,當(dāng)CC

10、C和PSF出現(xiàn)峰值所對(duì)應(yīng)的分類數(shù)較合適,而SPRSQ、RSQ、和PST2出現(xiàn)峰值的前一行所對(duì)應(yīng)的分類數(shù)較合適。符合條件的可能不只一種情況,然后還要結(jié)合專業(yè)看資料大概屬于多少類別,再來(lái)確定分類結(jié)果。本資料結(jié)合專業(yè)上標(biāo)準(zhǔn)菌來(lái)自的屬類情況及統(tǒng)計(jì)上聚類結(jié)果較佳標(biāo)準(zhǔn),得知用類平均法分成13類比較理想,其中5類是獨(dú)立菌,菌株的編號(hào)分別為9、57、78、80、85。非獨(dú)立菌的8類均數(shù)(即凝聚點(diǎn))見(jiàn)表1的第2至第9列數(shù)字。2.3打印樹(shù)枝按照SAS軟件中Tree過(guò)程可按水平(或豎直)擺放樹(shù)狀。對(duì)于例數(shù)較多的資料,我們編制了樹(shù)枝的專用程序2,可將89株標(biāo)準(zhǔn)菌的聚類結(jié)果打印出樹(shù)枝。 3討論3.1聚類分析是物以類聚的

11、一種統(tǒng)計(jì)分析方法,它的目的是把分類對(duì)象按一定規(guī)則分成組或類。這些組或類不是事先給定的,而是根據(jù)數(shù)據(jù)特征而定的。在細(xì)菌分類中,如果將每一個(gè)細(xì)菌在多項(xiàng)指標(biāo)下的反應(yīng)情況量化,得到原始數(shù)據(jù)矩陣,就可以采用聚類分析進(jìn)行數(shù)值分類。3.2本研究的全部資料輸入586微機(jī),建立FoxBase庫(kù)后,調(diào)入SAS 6.04版中的Cluster過(guò)程并自編樹(shù)枝對(duì)標(biāo)準(zhǔn)菌進(jìn)行聚類,將專業(yè)知識(shí)及聚類最佳判斷標(biāo)準(zhǔn)有機(jī)地結(jié)合起來(lái),得到了比較理想的數(shù)值分類結(jié)果。3.3目前,對(duì)細(xì)菌的數(shù)值分類用的較多的是中國(guó)科學(xué)院微生物研究所的MINTS軟件包,但此軟件包能處理的最多樣品數(shù)為255例3,而SAS軟件對(duì)例數(shù)沒(méi)有要求。當(dāng)例數(shù)較多的資料進(jìn)行聚類時(shí),可先用Fastclus過(guò)程聚成若干類,然后再用本文的方法進(jìn)行系統(tǒng)聚類。作者單位:郭秀花(解放軍北京醫(yī)學(xué)高等??茖W(xué)校北京100071)徐桂永(解放軍北京醫(yī)學(xué)高等??茖W(xué)校北京100071)李愛(ài)國(guó)(解放軍北京醫(yī)學(xué)高等??茖W(xué)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論