怎樣學好統(tǒng)計學1_第1頁
怎樣學好統(tǒng)計學1_第2頁
怎樣學好統(tǒng)計學1_第3頁
怎樣學好統(tǒng)計學1_第4頁
免費預覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、統(tǒng)計學的領域?qū)懡o在統(tǒng)計學院學習的學弟學妹如果學了幾年統(tǒng)計,還連統(tǒng)計的那個經(jīng)典定義都背不出就不應該了,在此我不再啰嗦一遍。統(tǒng)計學也不是什么神秘的學科,它的目的主要是通過數(shù)據(jù)探索信息,因此也就相應有一系列的流程:收集、整理、分析和表述(數(shù)據(jù))。按照這個流程,統(tǒng)計下屬的眾多學科的地位與作用也就一目了然。今日我取標題為“統(tǒng)計學的領域”,說實話這個題目有些狂妄。夠資格寫這種題目的人,恐怕至少應該在統(tǒng)計學界混過數(shù)十載。不幸的是,本人一向提倡“人不猖狂枉少年 ”。 如果沒有足夠的熱情和斗志,是不可能取得一番成就的。正值青春年少,安能不立鴻鵠之志?此為題外話。1、收集數(shù)據(jù)一般來說,數(shù)據(jù)的來源無非是試驗和調(diào)查。

2、 平時我們談統(tǒng)計學似乎不太注重數(shù)據(jù)的收集問題,然而試驗設計和調(diào)查技術(包括抽樣等)都是很有用的學問。就我們這種純粹的統(tǒng)計學院來說,試驗設計的地位似乎不太高,而我所了解的生物統(tǒng)計、 醫(yī)學統(tǒng)計等領域?qū)λ囊髤s特別高,有志于生物醫(yī)學統(tǒng)計方向的同學一定要注意研究這門課,有些名詞諸如正交設計、隨機區(qū)組試驗、拉丁方試驗等都是你們將來會遇見的,方差分析一般則是試驗設計之后最基本的統(tǒng)計分析方法; 對于調(diào)查,一方面它是由統(tǒng)計學的理論作背景支撐的(大數(shù)定律、數(shù)理統(tǒng)計、抽樣理論等), 另一方面涉及到實務操作方面的技術,做過調(diào)查的同學應該都了解調(diào)查的“艱辛”, 當然如果有統(tǒng)計學的指導,我們也會發(fā)現(xiàn)一些讓人變聰明的技

3、術,舉個例子,對于吸毒問題,受眾(調(diào)查客體)一般都會低報(不愿意告訴訪員自己吸毒), 對于這種情況我們該怎么處理?暫且把懸念留在這里;如果事先不知道答案,恐怕是很難想象這件事情與拋硬幣有任何瓜葛的。對于我們這個統(tǒng)計學院(素以經(jīng)濟統(tǒng)計強勢著稱),從收集數(shù)據(jù)角度來說,國民經(jīng)濟核算與經(jīng)濟社會統(tǒng)計也是兩門比較重要的課程,搞經(jīng)濟統(tǒng)計不能不對于經(jīng)濟數(shù)據(jù)的來龍去脈了如指掌,要不然統(tǒng)計指標都是從何計算而來有何意義都搞不清楚,還從何談起經(jīng)濟統(tǒng)計?2、整理數(shù)據(jù)數(shù)據(jù)不是說收集上來就可以馬上作分析,有實踐經(jīng)驗的人都知道,在收集數(shù)據(jù)的過程中,總會有各種意想不到的情況發(fā)生,但也是天要下雨娘要嫁人沒辦法的事情, 你總不能把

4、那些在問卷上偷懶空著不填或者亂填一氣的同志們抓來嚴刑拷打。 在此我有必要提醒各位,一定要做好心理準備,無論你們在學校里老師教授給你們多完美的理論,到現(xiàn)實中往往會四處碰壁的??罩{(diào)查項目不填寫的我們 稱 之 為 缺 失 值 ( Missing Value ) , 胡 亂 填 寫 的 可 能成 為 離 群 點 或 野 值( Outlier ) ,對于這樣的數(shù)據(jù),我們應該事先做一些處理才能進行下一步的統(tǒng)計分析, 不然會對統(tǒng)計結(jié)果產(chǎn)生一些不良影響,這些道理用腳趾頭想想就能明白(都用不著用膝蓋想)。當然數(shù)據(jù)的整理還包括很多其它內(nèi)容,諸如重新編碼( Recode) 或者進行某種綜合計算等等,這里不詳談,因

5、為都是很陳舊的內(nèi)容了。我想把我所知道的統(tǒng)計學中比較近代的技術介紹給大家,讓大家對我們的前沿知識有所了解。關 于缺 失值的 處理, 目前已 經(jīng)發(fā)展 起來 比較完 備的 插 補技術( Imputation ) , 這里面包括均值插補、熱平臺插補、冷平臺插補、最近鄰插補、EMB法、Bootstrap、Jackknife、MCMCMonte-Carlo Markov Chain )等知識。相信如果大家看看近代現(xiàn)代統(tǒng)計學的發(fā)展,這些名詞一定不會陌生。對于數(shù)據(jù)中的離群點,也要先思考一下,不要輕易刪除,一個窮山村中冒出一個大富翁的可能性不一定就是0,在離群點中反而有可能隱藏對我們有啟發(fā)的信息(比如一位同學的

6、學分績太高以至于成了“野值”,我們就不能把他 / 她從班里“刪除”,而應該借鑒學習經(jīng)驗)。3、分析數(shù)據(jù)不可否認,當今社會對于統(tǒng)計的需求,大部分都在于這一塊。數(shù)理統(tǒng)計的紙老虎 會讓很多數(shù)學功底不好的同志望而卻步,再加上統(tǒng)計中眾多術語如P 值、 置信區(qū)間、 卡方統(tǒng)計量等又會讓很多人覺得費解(曾經(jīng)有一次我給一位同志解釋了好半天X與Y兩個變量的相關系數(shù)對方死活就不明白,我瘋了),如果再來一些稍微前沿一些的統(tǒng)計分析方法例如結(jié)構(gòu)方程模型什么的,他們更是會云里霧里找不著北, 然而來自統(tǒng)計分析的打擊似乎是無窮盡的,他們最后發(fā)現(xiàn)統(tǒng)計軟件也不太會用, 要花很多錢購買,更可怕的還都是英文的, 我琢磨著,他們一定心想

7、,蒼天吶,如果還有來生,我, 一定要學統(tǒng)計,作為統(tǒng)計人也不要太得意,首先統(tǒng)計分析方法你不一定會用,其次即使你會用也未必能用對地方。這個領域我?guī)缀跻呀?jīng)無法介紹,因為數(shù)百年的發(fā)展,讓統(tǒng)計方法擴充得讓人很難概括全面了。最簡單的分類莫過于描述統(tǒng)計 與 推斷統(tǒng)計 了(事實上按照C. R. Rao書中寫的,還應該包括探索性統(tǒng)計分析);描述統(tǒng)計大家應該都懂,數(shù)據(jù)是什么就是什么,在原始數(shù)據(jù)的基礎上稍作加工,提煉一下信息,讓人對一個數(shù)據(jù)集(樣本)在心中有一個大致的了解,比如一國的GDP國家統(tǒng)計局不可能每年都向人民群眾公布張三家的雞下蛋買了多少錢以及某紅星工廠鋼鐵年產(chǎn)值多少錢,等等, 而是公布一個總數(shù),讓大家對我

8、國的國力有大致的了解; 推斷統(tǒng)計就需要用到一些比較精深的統(tǒng)計理論了,最重要的支撐莫過于數(shù)理統(tǒng)計,所以這門課大家也一定要學好,要知道相比起數(shù)學系的數(shù)學課,數(shù)理統(tǒng)計根本就沒什么難度。推斷統(tǒng)計中,根據(jù)是否需要對分布作假設又可以分為參數(shù)統(tǒng)計和非參數(shù)統(tǒng)計, 后者出現(xiàn)的年代要晚,因此在理論和應用方面可能不如前者, 二者的比較又足以寫一大篇文章,此處作罷,但是無論如何,從參數(shù)統(tǒng)計到非參數(shù)統(tǒng)計,你的統(tǒng)計思維必將經(jīng)歷一個重大轉(zhuǎn)變,如果學得夠深入,你甚至可以由此聯(lián)想人生得失問題;不是和大家開玩笑,有時候統(tǒng)計確實能為我們展現(xiàn)一種人生觀。相關的名詞恐怕也不是一兩頁紙能列舉完的:相關分析(包括典型相關分 析)、回歸分析

9、(包括投影尋蹤回歸、分位數(shù)回歸)、對應分析、信度分析、生 存分析、聚類分析、判別分析、因子分析、路徑分析和主成分分析等。如果你至今還只知道普通最小二乘法(OLS而不知道偏最小二乘法(PLS)這樣的名詞, 那只能說明你還在一個古董世界徘徊,需要加把勁了。關于數(shù)據(jù)分析方法,當然首先要打好基礎,掌握那些基本方法,若想在方法領域有所造詣,那么請回家把概率論與數(shù)理統(tǒng)計多翻幾遍,然后開始啃國外的教材以及文章。我常常遇到這種情況,就是一種方法,我看國外最早的論文是二十世紀六七十年代的,而國內(nèi)最早的論文則往往已經(jīng)是二十一世紀了??梢钥闯觯瑖鴥?nèi)在方法上的研究與國外的差距有多大。聰明人會從這里發(fā)現(xiàn)一個“市場”,我

10、就不誘導大家了,這對于國內(nèi)統(tǒng)計學的長遠發(fā)展不太有利。還有一點,也是要提醒大家切記,統(tǒng)計分析方法往往都有理論假設或前提,在實際應用時,務必務必要注意!首先要檢查數(shù)據(jù)是否滿足我們的理論條件,不要拿來就作分析,即使統(tǒng)計軟件會“不假思索”地給你輸出漂亮的結(jié)果。 (統(tǒng)計軟件有時候挺害人的,不要完全相信它們)4、表述數(shù)據(jù)我認為世上不存在不懶的人,因此數(shù)據(jù)的表述一定也是一門學問。你要是把統(tǒng)計軟件輸出的P 值活生生拿給別人看,八成會被毆;你要是膽敢告訴人家聚類分析碎石圖上石頭的位置表示特征根的大小,被扁的概率將一致趨近于1。統(tǒng)計是用來說明問題的,不是用來嚇唬人的。把我們的分析結(jié)果表述給人家看, 就需要經(jīng)過一定

11、的“轉(zhuǎn)化”。 不要輕視數(shù)據(jù)的表述問題,有些統(tǒng)計方法之所以能“紅”起來,就是因為 人們?yōu)樗姆治鼋Y(jié)果找到了巧妙的解釋。上面說的是統(tǒng)計學方面的表述,外觀形式方面的問題同樣應該注意。表格中的數(shù)據(jù)不使用右對齊(或小數(shù)點對齊)、 圖形畫得花里胡哨或土里土氣,都會讓統(tǒng)計的功效受損,雖然只是“面子問題”。 學了那么長時間的統(tǒng)計,不應該不知道 圖的標題 應該寫在圖下方 而 表的標題 應該寫在表上方 , 平時看文章多注意別人是怎樣表達的。好了, 統(tǒng)計學本身就從流程上介紹到這里。稍微再談談我所見到的統(tǒng)計學發(fā)展趨勢: 一方面是 學科結(jié)合 的趨勢, 單單只會一門統(tǒng)計學恐已難以立足,統(tǒng)計學的發(fā)展動力,越來越多地來自于其

12、它各個學科,若不是這些學科給統(tǒng)計學“出難題”, 統(tǒng)計學的發(fā)展可能早已經(jīng)停止了,醫(yī)學會問你,怎樣設計試驗既能得出顯著的統(tǒng)計結(jié)果又能節(jié)約成本?心理學會問你,人的情商是一個隱變量,應該怎樣測量?金融學會問你,股票市場上時序數(shù)據(jù)的異方差怎樣處理?市場營銷學會問你, 怎樣從超市的海量數(shù)據(jù)中挖掘出有用的商品信息?法學會問你,某甲殺人的概率有多大?新聞傳播學會問你,大眾對某位候選者的真實支持率有多高?等等 , ; 另一方面是計算機的廣泛應用趨勢, 我也要特別強調(diào),計算機在未來的統(tǒng)計中必將扮演越來越重要的角色,想要搖著筆桿子去追趕奔四3.2 絕對是不可能了, 計算機方面又尤其要數(shù)編程能力 最重要, 這番話是對

13、那些想沖到統(tǒng)計時代前沿的同學們說的,統(tǒng)計方法的發(fā)展太快,以至于很多統(tǒng)計軟件都跟不上,因此,若自己掌握計算機編程技術的話就能不必受到統(tǒng)計軟件的制約。我在中國人民大學統(tǒng)計學院已經(jīng)學習了四年, 感觸頗多,牢騷也不少。生活 方面不多說,大家最好早點學會 自強自立,早已經(jīng)過了 18歲,有空聽聽鄭智化 的水手。學習方面說這樣幾點吧:首先,不要指望你的老師會教給你所有的知識, 同時也要明白你所學的知識 是很不全面的。大學與高中不一樣,這里不是一個純粹的教學的地方, 更多地是 思想碰撞交流的地方。如果到現(xiàn)在你還在上課時埋頭認真地把老師說的每一個字 記下來,那么你可能還沒理解什么叫大學。 統(tǒng)計學紛繁蕪雜的體系,

14、不是老師在 幾節(jié)課上能講出來的。老師可以告訴你,統(tǒng)計學都有什么內(nèi)容,剩下的就是你自 己多多努力奮斗。其次,攻書莫畏難??赡苓@也是大學與高中的區(qū)別之一, 高中某一道題不會 做可能會影響你的考試成績,而大學則不是用來為難人的地方。 此路不通可以走 彼路,你若不擅長積分,那么對于書中證明用到積分的地方大可不必仔細看, 總 之要有自己擅長的地方,然后注意培養(yǎng)自己的優(yōu)勢,以最快的速度向前發(fā)展。不 過話說回來,不要被我誤導,我不是說可以隨意放棄一些課程, 基礎仍然是要打 好的,在這個條件下,你可以選擇自己擅長的方向發(fā)展。再次,不要忽視圖書館的豐富資源,不僅包括圖書,而且還有大量電子資源, 注意上網(wǎng)看看,學校都購買了大量的 論文數(shù)據(jù)庫,不用實在可惜了。里面的統(tǒng)計 刊物可以趁早接觸一些,對于論文寫作以及知識面的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論