植物分類學的信息化工具_第1頁
植物分類學的信息化工具_第2頁
植物分類學的信息化工具_第3頁
植物分類學的信息化工具_第4頁
植物分類學的信息化工具_第5頁
已閱讀5頁,還剩137頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

植物分類學的信息化工具提

綱1、分類學信息化的緣起2、生物多樣性信息學的概念與學科架構(gòu)

3、重要信息平臺介紹4、分類學數(shù)據(jù)管理工具5、e-Science

軟件工具研發(fā)6、人工智能及未來技術(shù)趨勢1.

分類學信息化的緣起中科院昆明植物所

iFlora

戰(zhàn)略

2012年分類學信息化的起步與發(fā)展

2004年20182001年GBIF全球生物多樣性信息網(wǎng)絡(luò)中科院標本館網(wǎng)絡(luò)工程項目

2000年(美國國家級的標本信息平臺)

2011年BoL

(Barcode

od

Life)生命條碼生物名錄ToL

(Tree

of

Life)

1994年首屆全國生物多樣性信息學會議

2009年2008年全球生命大百科2007年2007年科學研究的范式革命?在科學研究上,從經(jīng)典分類學、細胞生物學、分子生物學、

組學研究,數(shù)據(jù)

的深度與廣度不斷強化,數(shù)據(jù)的體量也越來越大。科研已經(jīng)走向了數(shù)據(jù)密集

型的第四范式,數(shù)據(jù)平臺與信息技術(shù)成為最基礎(chǔ)的條件。分類學面臨的挑戰(zhàn)與歷史機遇

A、分類學的危機從信息的角度看,經(jīng)典分類學的信息提供能力與數(shù)據(jù)質(zhì)量

存在嚴重不足。對整個科學大廈的服務(wù)與支撐能力日漸微

弱。研究范式落后其他學科。B、信息化時代的機遇但分類學價值并沒有改變,大量的問題仍需分類學來解決,

分類學依然是最為基礎(chǔ)的學科。信息化帶來了信息采集與

加工能力的大幅度提升,使得數(shù)據(jù)整合變得容易,依賴于

大數(shù)據(jù),人們繪制地球生物的時空圖譜的希望變?yōu)榭赡堋?/p>

這為分類學提供了新的機會。實例:Kew

的新科學戰(zhàn)略戰(zhàn)略一:研究與記錄全球植物與菌物

的多樣性,以及它們對人類的用途戰(zhàn)略二:基于邱園無與倫比的全球收

藏資源,管理、提供豐富的科學

數(shù)據(jù)

憑證戰(zhàn)略三:傳播植物與真菌的科學知識,

實現(xiàn)對科學、教育、保護政策和

管理

等方面影響力的最大化Kew

的研究焦點:

植物及菌物的多樣性研究與記錄館藏收集社會傳播1、世界植物在線門戶2、世界植物現(xiàn)狀報告3、熱帶重點植物分布區(qū)4、生命之樹5、世界種子銀行6、有用植物與菌物門戶網(wǎng)7、典藏數(shù)字化8、下一代植物及菌物科學家培訓計劃

9、植物園科普生物多樣性

信息學與空間分析組√√√√√√√√重點項目的團隊合作(注

:√表示參與)植物及菌物

的比較生物采集與館藏

組鑒定與命名

組保育生物學

組自然資本與

植物健康組學組世界植物在線門戶世界植物現(xiàn)狀報告熱帶重點植物分布區(qū)植物與菌物的生命之樹

世界種子銀行有用植物與菌物門戶網(wǎng)

典藏數(shù)字化下一代植物及菌物科學家

培訓計劃植物園科普√

√√

√√

√√

√√

√√

√√

√√

√信息化對分類學意義◆◆◆必由之路:

數(shù)據(jù)密集型科學時代的必然選擇,所以不要拒絕

工具,不要拒絕App,不要拒絕在線合作希望之路

信息化本身提供了很多的機會。例如常規(guī)的工作

變換了信息化手段就是創(chuàng)新。網(wǎng)絡(luò)社會也帶來了科普的重大利好。變革之路

我們的研究方法將產(chǎn)生根本性的改變。大數(shù)據(jù)變

得可能,因此對數(shù)據(jù)處理將成為極為重要的基礎(chǔ)能力。2.生物多樣性信息學

的概念與學科架構(gòu)Biodiversity

Informatics?

生物多樣性信息學

Biodiversity

Informatics上世紀70年代啟蒙,92年被提出,2000以后被學界接受。

2000年

Science

組織專欄,連發(fā)5篇文章介紹2009年6月2009年8月第一次國際盛會(69個國家,500名代表)

中國首屆生物多樣性信息學研討會(

2013年9月13,第三屆BI會議在辰山植物園召開)生物多樣性信息學的主要問題WFO

世界植物志在線項目啟動/主要研究方向中科院植物所,生物多樣性委員會

NSII

國家標本平臺CVH

中國數(shù)字植物標本館CFH

中國自然標本館PPBC

中國植物圖像庫CNPC

中國高等植物信息系統(tǒng)COL-ChinaEOL-ChinaBHL-ChinaABCD

亞洲生物多樣性保護和數(shù)據(jù)庫網(wǎng)絡(luò)中科院昆明植物所

iFlora

戰(zhàn)略

“智能植物志”(iFlora)是指將現(xiàn)代植物學、DNA測序技術(shù)與信息技術(shù)相結(jié)合,通過系列關(guān)鍵技術(shù)的集成和攻關(guān),構(gòu)建便捷、準確識別植物和掌握相關(guān)數(shù)字化信息的新一代“智能植物志”(或智能裝置)生物多樣性軟件工具開發(fā)中國動物信息網(wǎng)中國生物物種名錄(動物部分)

生物標本地理信息管理系統(tǒng)

動物信息集成系統(tǒng)物種潛在分布地預測系統(tǒng)動物行為記錄軟件期刊文獻全文共享管理系統(tǒng)

動物疫病網(wǎng)蝴蝶圖像在線鑒定系統(tǒng)昆蟲目級階元標本圖像自動鑒定系統(tǒng)微生物領(lǐng)域云中科院微生物研究所以中科院應用微生物研究網(wǎng)絡(luò)、全國科學院聯(lián)盟應用微

生物分會

世界微生物數(shù)據(jù)中心

等基礎(chǔ),建立一個整

合的微生物領(lǐng)域云:?

促進數(shù)據(jù)積累、挖掘和共享?

解決數(shù)據(jù)和計算為核心的重要科學問題

?

開發(fā)服務(wù)于微生物學家的個性化信息服務(wù)探索出一條利用云技術(shù),全面切入并促進從資源到產(chǎn)業(yè)

的科研創(chuàng)新價值鏈的新模式。Biodiversity

Informatics

學科構(gòu)架理解證據(jù)數(shù)據(jù)文化3.

重要信息平臺介紹Biodiversity

Informatics

學科構(gòu)架理解證據(jù)數(shù)據(jù)文化/dwca-validator//dwca-assistant/

/nameparser/

/白宮

Office

of

Science

and

Technology

Policy

要求

2013

年起所有公開預算?支持/科技部要求科學數(shù)據(jù)必須共享/自然科學基金支持的論文必須開放共享有關(guān)生物多樣性的綜合性門戶網(wǎng)絡(luò)平臺:EOL

實作了物種數(shù)據(jù)的管理平臺,讓數(shù)據(jù)可被

志愿的管理者審

閱。所有人的貢獻皆公開顯示

在個人的檔案?頁面。///Home.aspx物種名錄、志書GBIF

Web

API

/developer/summary//access/390

Million

Specimens4.1

Million

Type

Specimens11

TAFs

(Taxonomic

Access

Facilities)歐盟國家分類學集成網(wǎng)站/main/species/NCBIEBI重要的生物信息學中心National

Center

for

Biotechnology

Information

(US)

European

Bioinformatics

Institute

(EU)www.ebi.ac.ukDDBJ

DNA

Data

Bank

of

Japan

(JP)

www.ddbj.nig.ac.jpExPASy

Expert

of

Protein

Analysis

System

(Switzerland

)www.expasy.chPDB

Protein

Data

Bank

(US)/pdb/CBIPKU

北京大學生物信息中心

(CN)/chinese/BioSino

中國生物信息中心

(CN

)生物信息學數(shù)據(jù)庫EMBL、GenBank和DDBJ是國際上三大主要核酸序列數(shù)據(jù)庫EMBL

http://www.edi.ac.uk/ebi_docs/embi_db/edi/topembl.htmlDDBJ

http://www.ddbj.nig.ac.jp/GenBank

/Web/Genbank/其他重要的序列庫DbEST

http://www//dbEST/GSDB

/gsdb/SGD

/Saccharomyces/

UniGene

/UniGene/TDB

/tdb/tdb.htmlAceDB

http://www.sanger.ac.uk/Software/Acedb/Webace

http://webace.sanger.ac.uk/國內(nèi):華大基因

/index生物信息學常用軟件生物信息數(shù)據(jù)的檢索工具——Entrez文獻的檢索與管理軟件——Reference

manager

序列同源搜索分析工具——Blast核酸、蛋白質(zhì)序列比對分析軟件——DS

gene\DNASIS

生物大分子空間三維結(jié)構(gòu)顯示與分析軟件——Rasmol

生物圖像對比分析軟件——Scion

Image

(NIH

image)

生物科學數(shù)據(jù)處理軟件——Origin2012年7月12日,華大基因和生物醫(yī)學中心

(BioMed

Central)宣布其共同創(chuàng)辦的生物

學期刊《GigaScience》首刊正式發(fā)行DELTA

System/lep/hints.htm/tree//pages/1156278/overview/apiALA.au/Virtual

Biodiversity

Researchand

Access

Network

forTaxonomySupporting

biodiversityresearchcommunities!http://www.biovel.eu/web-services/ModEco:物種分布分析與建模/ModEco/MaxEnt:基于最大熵理論的物種生境分布預測

/~schapire/maxent/DesktopGARP:物種分布預測模型

/desktopgarp/OpenModeller:

跨平臺的生態(tài)位模型工具

/

核心網(wǎng)絡(luò)GBIF

全球最大的標本數(shù)據(jù)庫,免費下載

TPL

/

植物名稱審核最權(quán)威的名錄

IPNI

/

全球植物名稱索引(名稱文獻最全)

EOL

生命大百科(集成信息最全面)BHL

/

生物多樣性歷史文獻庫

COL

/

生物名錄(最全面)NSIICVHCFHPPBC

國家標本平臺(中國標本最全面)

中國數(shù)字植物標本館(中國植物標本)

中國自然標本館(野外考察數(shù)據(jù)管理)

中國植物圖像庫(審核過的植物圖像庫)ColChina

/

物種2000中國節(jié)點4.

分類學數(shù)據(jù)管理技能分類學數(shù)據(jù)管理技能1、野外調(diào)查與圖庫管理(CFH)

2、標本數(shù)據(jù)查詢(NSII)3、常用數(shù)據(jù)格式與軟件介紹

4、名稱批量校對5、植物志編譯6、植物名錄與植物志編輯系統(tǒng)

7、社區(qū)共享與數(shù)據(jù)論文3、常用數(shù)據(jù)格式與軟件介紹

?平面文件

(flat-file)重點是要知道:

數(shù)據(jù)怎樣進行導入導出–

txt,csv–

純文本,數(shù)據(jù)結(jié)構(gòu)依靠特殊標記由軟件解析?關(guān)系數(shù)據(jù)庫

(relational

DB)–

基于實體聯(lián)系模型

(E-R模型)–

表中的記錄(record/tuple)鍵唯一確定–

表之間通過外鍵建立聯(lián)系–

有通用的標準:SQL–

Excel、

Access、

Sqlite

、MySQL、SQL

Server、Oracle

?數(shù)據(jù)交換文件格式–

XML、JSON、YAML4.

名錄自動校對:/App/NameChecker/植物名稱批量校對/BioBook/ParseNames.aspx

植物學名校對工具?

Taxonomic

Name

Resolution

Service

(分類學名稱解析系統(tǒng),

TNRS)依據(jù)的數(shù)據(jù)源為Tropicos,

Global

Compositae

Checklist(/compositaeweb/

),

USDA

Plants(/java/)和NCBI

Taxonomy(/Taxonomy/)。登錄網(wǎng)站http:///TNRSapp.html/使用?

Plantminer

(植物名稱校對者)依據(jù)的數(shù)據(jù)源為Tropicos,

World

Checklist

of

Selected

Plant

Families

(WCSP)

(/wcsp/)和The

Plant

List

(

Carvalho

et

al.,

2010)。打開

/,使用Email接受結(jié)果?

Taxonstand

(學名標準化軟件包)Taxonstand是一個R軟件包,

它依據(jù)The

Plant

List的數(shù)據(jù)進行名錄比對,

校正錯誤

名稱,

給出名稱所在的科、相應的接受名和命名人。?

install.packages

("Taxonstand")/article/2015/1005-0094-23-2-252.html5、植物志編譯系統(tǒng)///目前支持的特性:???????????自動識別

Excel

電子表格識別常見的列表頭,自動關(guān)聯(lián)到植物志屬性字段植物名稱自動識別,支持中名、學名根據(jù)Excel表格生成植物志網(wǎng)頁批量生成學名索引、中文名稱筆畫索引、中文拼音索引網(wǎng)頁批量處理照片(聲稱縮略圖、縮放圖)自動識別照片名稱中的物種信息,并按科、屬、種的拉丁名生成目錄,分

類整理照片物種照片與物種網(wǎng)頁自動關(guān)聯(lián)網(wǎng)頁模版可以替換、定制生成可切換分類系統(tǒng)的物種樹修改Excel表格、照片后,一鍵發(fā)布重新生成即可更新6.

植物名錄與植物志編輯系統(tǒng)?

實例:?

PVH

校園網(wǎng)網(wǎng)站系列?

名錄管理功能:Excel

名錄表格上傳,批量導入后臺

的MySQL數(shù)據(jù)庫,前端Web頁面實現(xiàn)名錄的逐條編

輯功能?

植物志編輯系統(tǒng):采用Wiki機制,保留歷史版本,支

持地圖功能,自動超鏈接,Markdown格式支持。GBIF的典型大數(shù)據(jù)特征:?4億條記錄,450個數(shù)據(jù)提供者,1萬多個數(shù)據(jù)集?100多萬個物種名稱?特點和關(guān)鍵數(shù)據(jù)的缺乏:瀕危種、入侵種?只有58%以上的物種有1條以上的地標化記錄(0.1度網(wǎng)格)

?22%以下的物種有10條以上的地標化記錄(0.1度網(wǎng)格)?6%的物種有100條以上的記錄7.

社區(qū)共享與數(shù)據(jù)論文發(fā)表數(shù)據(jù)論文是數(shù)據(jù)共享的有效途徑如何發(fā)表數(shù)據(jù)論文??

GBIF官網(wǎng):

ttp:///publishingdata/datapapers?

林永昌鼓勵發(fā)表「資料論文」是促進生物多樣性數(shù)

據(jù)公開分享的有效策略

(PDF)C、參與公民科學,以眾包開展大規(guī)模研究5.

e-Science

軟件工具研發(fā)1.

網(wǎng)絡(luò)信息資源搜集2.

虛擬工作組(群組)3.

數(shù)字標本館4.

野外考察圖像處理5.

自然筆記App6.

活植物管理系統(tǒng)7.

園丁筆記App8.

自然保護區(qū)生物資源管理系統(tǒng)

9.

植物志網(wǎng)站編譯系統(tǒng)10.

植物志電子書編譯打包系統(tǒng)www.iBe-Science軟件工具研發(fā)?國內(nèi)唯一支持無限二級域名?可以創(chuàng)建生物多樣性網(wǎng)站的平臺

?具備Wiki

方式植物志編輯?具備名錄管理?具備圖庫管理?具備完整的用戶社區(qū)管理?(用戶可以創(chuàng)建群組)?(群內(nèi)自建角色系統(tǒng))?(跨域的單點登錄系統(tǒng))?(具備網(wǎng)站二次開發(fā)與擴展能力)專業(yè)軟件工具庫人工搜集網(wǎng)址Spider爬行采集生物多樣性信息

導航網(wǎng)站知識分析與抽取人工知識校對用戶收藏網(wǎng)址生物多樣性

搜索引擎人工整理基礎(chǔ)庫多終端訪問

(Web+桌面+移動)互聯(lián)網(wǎng)生物多樣性

信息源數(shù)據(jù)庫基礎(chǔ)庫

(物種、地理)生物多樣性

本體知識庫生物多樣性

網(wǎng)絡(luò)資源庫索引庫專題標本庫專題圖像庫數(shù)字化文獻庫電子志書名錄專題應用面向用戶的個性化生物多樣性e-Science工作平臺植物志編撰系統(tǒng)與案例課題、研究專題門戶網(wǎng)站創(chuàng)建系統(tǒng)

野外考察技術(shù)體系活植物管理系統(tǒng)注冊會員

>680物種信息

>

500萬條

地理地標信息

>

700萬

集成

CPNI

2.0

TPL

COL

COL-China2013

API集成

GBIF

EOL

BHL

IPNI

CFH搜索搜索

中國植物志,CNKI集成搜索系統(tǒng)上線(軟件著作權(quán))1.

信息資源搜集保藏1、圖像截屏、圖像快速上傳、保存

2、文章摘錄3、群組討論4、自建欄目,組織信息5、QQ群組對接2.

虛擬工作組(群組)3.

數(shù)字標本館標本館:

26家標本記錄:

5,382,935

標本照片:

2,867,661

張標本管理模塊功能體系?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論