




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1/ChinaR10thAIAI時(shí)代的R數(shù)據(jù)數(shù)據(jù)的時(shí)代新時(shí)代的2017中國R語言會(huì)議(上海華東師范大20171202數(shù)據(jù)的數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科目2/ChinaR10th1數(shù)據(jù)的時(shí)1統(tǒng)計(jì)學(xué)的濫信息時(shí)代的數(shù)據(jù)科2新時(shí)代的21數(shù)據(jù)的時(shí)1統(tǒng)計(jì)學(xué)的濫信息時(shí)代的數(shù)據(jù)科2新時(shí)代的2數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科2/ChinaR10th概率論的發(fā)1494年,現(xiàn)代會(huì)計(jì)學(xué)之父帕西奧利提出獎(jiǎng)金分配問概率論的發(fā)假設(shè)兩個(gè)人A和B在玩一種游戲,勝者得10分,負(fù)者得0分,先得60分者獲勝。如果突然游戲終止,而此時(shí)A的得分是50分,B的得分是30分,獎(jiǎng)金應(yīng)該如何分配給AB1654年,帕斯卡正式創(chuàng)立概率32歲的帕斯卡和54歲的費(fèi)馬通信討論獎(jiǎng)金分配的問題,得到了正確的答案7:1。1812年,拉普拉斯完善了古典概率數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)PAGE3/ChinaR10th計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科蒲豐投針LyL2D蒲豐投針LyL2D TimesofDropping:數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科PAGE4/ChinaR10thPlayfairPlayfair的線圖數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科PAGE5/ChinaR10th赫歇赫歇爾的散點(diǎn)圖位置 100120140 位置 100120140年倫敦倫敦霍亂防治圖南丁南丁格爾的玫瑰圖目1數(shù)據(jù)的時(shí)目1統(tǒng)計(jì)學(xué)的濫信息時(shí)代的數(shù)據(jù)科2新時(shí)代的2數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科PAGE9/ChinaR10th統(tǒng)計(jì)學(xué)的起凱特勒,近代統(tǒng)計(jì)學(xué)之統(tǒng)計(jì)學(xué)的起高爾頓,早期的統(tǒng)計(jì)大1855年發(fā)現(xiàn)了父子的遺傳身高向平均值回歸的現(xiàn)象。1969律,發(fā)表了專著《遺傳天才1892年發(fā)表了專著《指紋學(xué)1901年,高爾頓資助并與其學(xué)生皮爾遜等人聯(lián)合創(chuàng)辦了科學(xué)提勒,數(shù)理統(tǒng)計(jì)的先19世紀(jì)時(shí)就發(fā)現(xiàn)了很多現(xiàn)代統(tǒng)計(jì)學(xué)中的成果,但是由于論都是丹麥語,很多先驅(qū)性的工作當(dāng)時(shí)沒被重視,直到年后才廣為人知也是精算領(lǐng)域的先驅(qū),在最初的精算師國際組織中擔(dān)任要職推斷統(tǒng)計(jì)卡爾·皮爾推斷統(tǒng)計(jì)1857年出生于英國,被譽(yù)為是“數(shù)理統(tǒng)計(jì)的創(chuàng)始人1895年提出皮爾遜分布族,1900年提出卡方檢驗(yàn)皮爾遜以傾斜分布的方式提出了革命性的思想,對(duì)19世紀(jì)費(fèi)希1890年出生于英國,被譽(yù)為是“推斷統(tǒng)計(jì)之父1912年提出了最大似然估計(jì)。1925年出版的《研究者用的統(tǒng)計(jì)方法》是第一本推斷統(tǒng)計(jì)學(xué)的教科書,對(duì)統(tǒng)計(jì)方法的奈1894年出生于俄國,區(qū)間估計(jì)和假設(shè)檢驗(yàn)理論的創(chuàng)始人。和艾貢·皮爾遜(卡爾·皮爾遜之子)共同做了很多偉大的數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科PAGE10/ChinaR10th目1數(shù)據(jù)的時(shí)目1統(tǒng)計(jì)學(xué)的濫信息時(shí)代的數(shù)據(jù)科2新時(shí)代的2數(shù)據(jù)數(shù)據(jù)的時(shí)代新時(shí)代的什么是數(shù)據(jù)科學(xué)數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科PAGE10/ChinaR10th數(shù)據(jù)科學(xué)的來C.F.JeffWu于1997年非常旗幟鮮明地提出了“Statistics=DataScience?”從2008年DJatil和JeffHammerbacher把他們?cè)贚inedIn和acebook的工作職責(zé)定義為“數(shù)據(jù)科學(xué)家”的那段時(shí)期開始,數(shù)據(jù)科學(xué)開始在業(yè)界流行起來。定Wikipedia上的定義:數(shù)據(jù)科學(xué)是一門利用數(shù)據(jù)學(xué)習(xí)知識(shí)的數(shù)據(jù)數(shù)據(jù)的時(shí)代新時(shí)代的什么是數(shù)據(jù)科學(xué)數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科PAGE11/ChinaR10thScience,機(jī)機(jī)器學(xué)計(jì)算科統(tǒng)計(jì)數(shù)據(jù)科商業(yè)智傳數(shù)據(jù)分領(lǐng)域知a圖形摘自《數(shù)據(jù)科學(xué)中的R語言數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科PAGE12/ChinaR10th計(jì)算機(jī)的發(fā)計(jì)算機(jī)的發(fā)世界上第一臺(tái)通用計(jì)算機(jī),1946年在美國的賓夕法尼亞大學(xué)美國國防部用它來進(jìn)行彈道計(jì)算,占地170平方米,重達(dá)噸,每秒鐘可進(jìn)行5000次運(yùn)算ENIAC以電子管作為元器件(一共用了18000個(gè)電子管UNIVAC世界上第一臺(tái)商用計(jì)算機(jī),1951年研制成功并交付給美國人是第二代計(jì)算機(jī)的代表數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科PAGE13/ChinaR10th早期的AI時(shí)人早期的AI時(shí)1940年,控制論之父維納研究計(jì)算機(jī)如何像大腦一樣工作1950年,人工智能之父的圖靈提出了著名的“圖靈測(cè)試1956年,達(dá)特茅斯大學(xué)的會(huì)議上正式使用了“人工智能”這神經(jīng)網(wǎng)1943年,心理學(xué)家WarrenMcCulloch和數(shù)理邏輯學(xué)WalterPitts提出神經(jīng)元的數(shù)學(xué)模型1957年,康內(nèi)爾大學(xué)教授FrankRosenblatt提出的“感知1969年,MarvinMinsky和SeymourPapert出版了《感知機(jī):1986年,Hinton和DavidRumelhart發(fā)表了BP算法“第五代計(jì)算機(jī)”時(shí)日本第五代“第五代計(jì)算機(jī)”時(shí)1978年,日本通產(chǎn)省委托東京大學(xué)計(jì)算機(jī)中心主任TohruMoto-Oka研究下一代計(jì)算機(jī)系統(tǒng)1981年,TohruMoto-Oka為首的委員會(huì)提交了報(bào)告《知識(shí)信日本人選擇了邏輯程序語言Prolog,走的是規(guī)則和邏輯路線。1992年,日本政府宣布第五代計(jì)算機(jī)研制失敗。數(shù)據(jù)挖掘時(shí)Data數(shù)據(jù)挖掘時(shí)上個(gè)世界90年代開始流行,世紀(jì)之交時(shí)跟隨人們對(duì)知識(shí)爆商業(yè)智能時(shí)BusinessIntelligence商業(yè)智能時(shí)上個(gè)世界90年代末開始在業(yè)界出現(xiàn),本世紀(jì)初非?;馃幔ǔV赣脭?shù)據(jù)倉庫、OLAP行數(shù)據(jù)分析以實(shí)現(xiàn)商業(yè)價(jià)值。數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的數(shù)據(jù)中的科學(xué)統(tǒng)計(jì)學(xué)的濫觴信息時(shí)代的數(shù)據(jù)科PAGE17/ChinaR10th大數(shù)大數(shù)據(jù)時(shí)AIAI時(shí)數(shù)據(jù)的數(shù)據(jù)的時(shí)代新時(shí)代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建目19/ChinaR10th1數(shù)據(jù)的時(shí)12新時(shí)代的2R的發(fā)展歷R的使用建議1數(shù)據(jù)的時(shí)12新時(shí)代的2R的發(fā)展歷R的使用建議數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建PAGE19/ChinaR10thR的誕生S語言是R語言R的誕生S語言誕生于20世紀(jì)70年代由JohnM.Chambers領(lǐng)導(dǎo)的1998年美國計(jì)算機(jī)學(xué)會(huì)(ACM)授予了S語言的主要設(shè)計(jì)者JohnM.Chambers“軟件系統(tǒng)獎(jiǎng)。1993年,S語言的許可證被MathSoft公司買斷,S-PLUS成2008年,TIBCO收購了已改名的Insightful公司R語言吸收了很多Scheme語言的特Scheme語言誕生于1975年的MIT,是LISP語言的一個(gè)方有一次R語言的作者Ross準(zhǔn)備用Scheme向別人演示詞法作用域的時(shí)候,由于手邊沒有Scheme的書,就用S來演示卻失敗了,這讓他萌生了改進(jìn)S語言的想法。R的誕生1993年,R語R的誕生1992年RossIhaka和RobertGentleman在奧克蘭大學(xué)成為言;而他們名字的首字母都是R,于是R便成為這門語言的1993年,Ross和Robert將R的部分二進(jìn)制文件放到了卡耐基·梅隆大學(xué)統(tǒng)計(jì)系的Statlib中,并在S語言的新聞列表蘇黎世理工學(xué)院的MartinM極力勸說兩位原作者公布源代R成為自由軟件。于是19956R的源代碼正式發(fā)布到了自由軟件協(xié)會(huì)的FTP上。1997年,R核心團(tuán)隊(duì)成1997年第一批核心團(tuán)隊(duì)的成員數(shù)目為11位2008年R核心團(tuán)隊(duì)成員數(shù)目增加到了19位2011年開始,R核心團(tuán)隊(duì)成員數(shù)目達(dá)到20位R的特JohnM.Chambers2009年第一期《RJournal》上對(duì)R的R的特aninterfacetocomputationalproceduresofmanykinds(各類;interactive,hands-oninrealtime(具有可交互性,可以實(shí)時(shí);functionalinitsmodelofprogramming(函數(shù)式編程模式;“;modular,builtfromstandardizedpieces(模塊化,由標(biāo)準(zhǔn)化;數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建VB.NET、PHP、Delphi、AssemblyLanguageVB.NET、PHP、Delphi、AssemblyLanguageChinaR10thPAGE22/R在數(shù)據(jù)分析應(yīng)用領(lǐng)域的發(fā)KDNuggets關(guān)于“數(shù)據(jù)分析/數(shù)據(jù)挖掘R在數(shù)據(jù)分析應(yīng)用領(lǐng)域的發(fā)R2011KDNuggets調(diào)查數(shù)據(jù)分析類編程語言開始就排名第一,從2012年開始,在關(guān)于“數(shù)據(jù)挖掘和數(shù)據(jù)分析”工具的調(diào)查中,也超過了Excel和Rapidminer成為第一。2017年8月的“數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)平臺(tái)”的調(diào)查中,Python超過R成為第一IEEE熱門編程語言排行20178月發(fā)布的排行版中,R排名第6,前10名的編程語言為Python、C、Java、C++、C#、R、JavaScript、TIOBE編程語言排行201711月發(fā)布的排行版中,R語言排名第11,前10名的編程語言為Java、C、C++、Python、C#、JavaScript數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建PAGE23/ChinaR10th目1數(shù)據(jù)的時(shí)目12新時(shí)代的2R的發(fā)展歷R的使用建議數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的R的發(fā)展歷程不同分析領(lǐng)域的RR的使用建PAGE23/ChinaR10th統(tǒng)計(jì)計(jì)簡(jiǎn)統(tǒng)計(jì)計(jì)最早版本的RFortran編寫,當(dāng)前版本主要是C/C++。R包可以很方便地支持C/C++和Fortran的開發(fā)。R的優(yōu)R語言編程容易,代碼易讀性能相對(duì)較差,不過可以通過集C/C++或Fortran的庫來解決矩陣式編簡(jiǎn)矩陣式編早期的R常被拿來和Matlab、進(jìn)行比較R的優(yōu)數(shù)據(jù)可視簡(jiǎn)數(shù)據(jù)可視早期的R受歡迎的重要原因是可以生編程靈活,是自定義統(tǒng)計(jì)圖形的首選R的優(yōu)可視化資源非常豐富,其中g(shù)gplot2包實(shí)現(xiàn)了“TheGrammarofGraphics”中主流的JavaScript有很好的結(jié)合,社區(qū)中存在很多像recharts這樣的優(yōu)秀第三統(tǒng)計(jì)學(xué)方簡(jiǎn)統(tǒng)計(jì)學(xué)方R語言崛起之初常被拿來和SAS比較。業(yè)界中RSAS可以進(jìn)行很好的配合R的優(yōu)蒙特卡洛方簡(jiǎn)蒙特卡洛方R的優(yōu)最優(yōu)化方簡(jiǎn)最優(yōu)化方早期R的優(yōu)化功能很弱,常被用來和R的優(yōu)開源免費(fèi),資源豐富,編程靈活雜的方法,但是可以結(jié)合COIN-OR進(jìn)行擴(kuò)展機(jī)器學(xué)簡(jiǎn)機(jī)器學(xué)早期機(jī)器學(xué)習(xí)資源不如Python豐富,導(dǎo)致很多R用戶投入了Python陣營。流工具的作者直接參與了R包的開發(fā)比如xgboostR的優(yōu)學(xué)習(xí)門檻低,代碼易讀直接使用的運(yùn)算性能相對(duì)較差深度學(xué)簡(jiǎn)深度學(xué)習(xí)框架很少直接提供R的支持。MXNet對(duì)R提供了完美的原生支持,在RStudio的貢獻(xiàn)下,目前也有了Tensorflow和Keras的R包R的優(yōu)在R的框架下可以完美地融合到分析流程中,Windows下的安裝和使用非常文學(xué)化編簡(jiǎn)文學(xué)化編早期的R就引入了文學(xué)化編程的思想謝益輝的knitr發(fā)布后顛覆了這個(gè)領(lǐng)域,后續(xù)的bookdown有可能會(huì)改變科技類R的優(yōu)資源非常豐富,功能非常強(qiáng)大Markdown框架的話可以比較容易系統(tǒng)架簡(jiǎn)系統(tǒng)架早期的R并未向后臺(tái)服務(wù)器方向發(fā)展,在業(yè)界通常是和Java進(jìn)行整合。Shiny問世后擁有了完美的服務(wù)器框架,此外fiery包也可以提供強(qiáng)大的后臺(tái)服R的優(yōu)Shiny框架非常簡(jiǎn)潔,可能是門檻最低的網(wǎng)站系統(tǒng)構(gòu)建工具,與JavaScript可性能較差,一般不用作生產(chǎn)系統(tǒng)數(shù)數(shù)據(jù)的時(shí)代新時(shí)代的R的發(fā)展歷
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 美容經(jīng)絡(luò)按摩培訓(xùn)
- 2025年度環(huán)境風(fēng)險(xiǎn)評(píng)估與環(huán)境保護(hù)合同
- 肺部感染護(hù)理診斷及措施
- 耳前瘺管護(hù)理查房
- 2024淮安市輔仁職業(yè)技術(shù)學(xué)校工作人員招聘考試及答案
- 招商代理合同范本
- 裝飾裝修工程合同范本大全
- 洗車店承包與服務(wù)合同樣本
- 腹水常規(guī)操作規(guī)程
- 農(nóng)業(yè)機(jī)械租賃合同協(xié)議
- 《中醫(yī)診斷學(xué)課件》
- 工程結(jié)構(gòu)靜力試驗(yàn)
- MQL4命令中文詳解手冊(cè)
- 辦公耗材采購 投標(biāo)方案(技術(shù)方案)
- 國家開放大學(xué)《人文英語3》章節(jié)測(cè)試參考答案
- 撤銷冒名登記(備案)申請(qǐng)表
- 牛排培訓(xùn)大全課件
- 軍事地形學(xué)課件
- 分水嶺腦梗死課件
- 車站夜間吊裝方案
- 液壓與氣動(dòng)技術(shù)PPT完整版全套教學(xué)課件
評(píng)論
0/150
提交評(píng)論