物种分类数据库帮助

在生物研究体系中,物种分类是一项重要的原则。普通世系的遗传和同源性,以及决定功能的序列和结构的保守性都是与生物进化史有关的主导思想(有关分类方法的详细介绍见附录1.生物分类法)。因此,物种分类数据库是SDSPB所有数据库之间的重要连接。

  • Taxa:代表整个物种树中的一个节点,该节点可以是物种,也可以是比物种更高级的分类单元如门、纲、目、科、属等。
  • 物种树:整个物种数据库中的taxa相互联系,构成一个树状结构,称为物种树。
  • Rank:Rank表明一个taxa的分类级别。如Rank为目(order)的taxa比rank为科(family)的taxa级别要高等等,完整的rank列表请参考附录。
  • 子树:一个taxa的子树为该taxa在物种树中的子节点构成的树,该taxa为自身子树的根节点。
  • Lineage:一个taxa的世系链,或者通俗的说该taxa的祖先。从根节点开始至任意节点的路径,被称为该任意节点的世系。

数据查询

在首页上点击“基础数据资源”按钮,选择“物种分类数据库”进入物种分类数据库主页,点击左侧边栏的 “高级检索”可进入数据查询页面,如下图所示:

物种分类数据库提供了限定词,以用于对数据的更精确查询,能够使用的限定词包括以下5种:Taxonomy ID、All Names、Scientific Name、Common Name及Rank。
除了提供限定词查询外,物种分类数据库在主页的下文还提供了一些数据示例,用户可以直接点击相应的链接,从而进行快速查看。

限定词说明

物种分类数据库中包含的限定词说明请见下表:

限定词 描述
Taxonomy ID 物种在分类数据库中的ID
All Names 学名、俗名以及一些其它的名字
Scientific Name 学名
Common Name 通俗名
Rank 分类节点的等级,如界、门、科等

数据显示说明

Info格式说明


序号,学名Scientific name
分类流水号Taxonomy ID
别名synonym
分类等级Rank
世系Lineage
遗传密码Genetic code
线粒体遗传密码Mitochondrial genetic code

XML格式说明


<TaxaSet>为根标签
<Taxon>
<TaxId>为Taxonomy ID
<ScientificName>学名
<OtherNames>包括synonym;in-part;blast name;genbank common name;equivalent name;includes;misspelling;common name;misnomer;genbank synonym;anamorph;genbank anamorph;teleomorph;acronym;genbank acronym
<ParentTaxId>父节点
<Rank>分类等级
<GeneticCode>遗传密码标签
<GCId>遗传密码id
<GCName>遗传密码表名
<MitoGeneticCode>线粒体密码标签
<MGCId>线粒体密码id
<MGCName>线粒体密码表名
<Lineage>世系以分号分割每个taxa
<LineageEX>各世系的额外信息
<TaxId>Taxonomy ID
<ScientificName>学名
<Rank>等级

详细结果说明


在物种分类数据库中查询到的结果中有如下几项:
最上面的是所查询到的物种名,可以是某一个物种的名称,也可以是某一个物种的特定分类等级的名称。
Taxonomy ID:物种在分类数据库中的ID。
Rank:分类节点的等级。
Genetic code:遗传密码。
Mitochondrial genetic code:线粒体遗传密码。
Other names:其他名字,比如在GenBank中的名字,通俗名等。
Lineage(full):世系关系。显示查询数据的世系关系,可点击世系关系中的任一节点,从而进入该节点的分类信息显示页面。
Links:提供了与查询数据有关的数据库链接。
SubTree Information:查询数据的子树分布情况,可点击进入相应的子树节点。

Common Tree



Common Tree是一个用来构建世系树的工具,用户可以输入物种的名字或者物种在分类数据库中的ID,然后选择一定的格式来显示它们之间的关系。可以选择的显示格式有:“text tree”、“phylip tree”和“tax id list”。选择了一定的格式之后,点击“下载”按钮下载选择格式的世系树。
示例:

  1. 在“输入物种名或id号”右边的文本框中输入一个物种名或者它的id,如“human”或者它在分类数据库中的id“9606”。
  2. 点击“增加”按钮,可以看到“选择物种”中已经多了人类“homo sapiens”这个选项。
  3. 继续输入要比对的物种,如“mouse”,并点击“增加”按钮将它们添加到“选择物种”中。
  4. 输入完要比对的物种后,在“选择物种”中选中要构建世系树的物种,然后在输出格式下拉列表中选择“text tree”、“phylip tree”和“tax id list”中的一个,点击“下载”得到指定格式的世系树。
    图中,高亮的分类名称是是使用者输入的,其它显示出来的分类是为了更好地显示高亮分类之间的相互关系。物种树中的加号表示此分类在显示的时候被折叠了,点击加号可以查看它的所有世系。底下的“选择物种”框体可以移除列表中的分类。

数据下载流程

物种分类数据库提供了FTP下载,点击物种分类数据库主页面左侧的“数据下载”即可进入下载目录进行数据的下载。


常用生物


拟南芥(Arabidopsis thaliana) 智人(Homo sapiens)
牛(Bos taurus) 小家鼠(Mus musculus)
秀丽隐杆线虫(Caenorhabditis elegans) 肺炎枝原体(Mycoplasma pneumoniae)
斑马鱼(Danio rerio) 稻(Oryza sativa)
盘基网柄菌(Dictyostelium discoideum) 疟原虫(Plasmodium falciparum)
果蝇(Drosophila melanogaster) 酿酒酵母(Saccharomyces cerevisiae)
大肠杆菌(Escherichia coli) 有爪蟾蜍(Xenopus laevis)
丙型肝炎病毒(Hepatitis C virus) 玉米(Zea mays)

附录

生物分类法

生物分类法,又称科学分类法,是生物学用来对生物的物种进行归类的办法。现代生物分类法源于林奈的系统,他根据物种共有的生理特征进行了分类。在林奈之后,根据达尔文关于共同祖先的原则,此系统被逐渐改进。近年来,分子系统学应用了生物信息学方法分析基因组DNA,正在大幅改动很多原有的分类。生物分类法属于分类学以及生物系统学。

1.现代发展

尽管林奈当时对生物进行分类只是为了方便鉴别,现在人们已经广泛赞同分类应反映出达尔文关于共同祖先的原则。

随着1960年代支序分类(英文cladistics)或称分支学说(英文cladism)的出现,一个分类单元被定位在演化树的某个位置。如果一个分类单元包括且仅包括某一个共同祖先的所有后代,称其为单系群(英文monophyly);相对应的,若该单元包括其共同祖先,但未包括其所有后代,则称之为并系群(英文paraphyly);若该分类不包括其最近共同祖先,则称之为复系群(英文polyphyly)。根据分支学说,一个自然分类应该是单系群而非并系或复系。

目前正在计划一种新的命名法,称做PhyloCode,用来处理演化支(英文clade)而非分类单元(拉丁文taxon,复数taxa)。现在仍不清楚,这种新的命名法能否和其它的命名法则并存。

比较新的分类法中,域或称总界是最高的单元。三域系统最初被创立于1990年,此后逐渐被学界承认。目前,大多数学家已经接受了此系统,但仍有一些学者遵循五界系统。三域系统的基本特征是将原本在细菌界(或称原核生物界(Monera))中的古细菌和真细菌独立成细菌域(Bacteria)和古菌域(Archaea)。还有一些学者将古细菌列为第六个界但不接受三域系统。

2.早期分类系统

最早已知的对生命形式的分类系统由希腊哲学家亚里士多德所建立。他将动物根据运动方式(空中,陆上或水中)分类。1172年塞维利亚的法官伊本•路世德(ibn Rushd,即阿维罗伊Averroes)将亚里士多德的《论灵魂》(拉丁文de Anima)翻译成阿拉伯文并删节。其原始注解已佚,但由斯考特(Michael Scot)翻译的拉丁文版本仍流传。

在中国,明代李时珍(约1518–1593)在药典《本草纲目》中,将生物药材分为草部、谷部、菜部、果部、木部、虫部、鳞部、介部、禽部、兽部和人部。瑞士教授康拉德•冯•盖斯纳(Conrad von Gesner, 1516–1565)将当时已知的生物进行了分析性的归纳。

新大陆的发现为欧洲带来了很多新奇的动物种类的描述和标本。在16世纪晚期和17世纪早期,人们开始对动物进行了详细描述,先是人们熟悉的种类,随后逐渐扩展,直到形成了基于解剖学基础的足够大的知识体系。这些解剖学知识主要来源于医学解剖学家,随后昆虫学家和最初的显微镜学者将分类的范围进一步扩大。

林奈氏分类法

卡尔•林奈(Carolus Linnaeus, 1707–1778)的巨著《自然系统》(拉丁文Systema Naturae)在其一生中被改编过12次(1735年第一版)。在此书中,自然界被划分为三个界:矿物、植物和动物。林奈用了四个分类等级:纲、目、属和种。

林奈所建立了用于命名所有物种的学名的方法,并沿用至今。在林奈之前,命名一个物种需要很长的包括许多单词的名称,其中包括了对物种的描述,并且这些名称不固定。林奈将物种名称统一成两个字母的拉丁文名称,即学名,由此分开了命名法和分类法。这种生物命名的方法称作双名法,具体命名办法和书写规则参见双名法条目。

目前,命名法由命名法规(Nomenclature Codes)所管理。命名包括了不同等级的分类单元的名称。

尽管在汉语中,各物种及分类单元有对应的汉语名称,但在学术上为了方便交流和避免一物多名或一名多物的问题发生,所有国家仍通用拉丁语的命名法,物种的学名也专指双名法的名称。拉丁语的好处在于,它基本已经是一种“死”的语言,不再用作口语,因此相对稳定

3.举例

常用的五种生物(果蝇、人、豌豆、酿酒酵母和大肠杆菌)的名称和分类如下:

中文 英文 拉丁文(单数, 复数) 果蝇 豌豆 酿酒酵母 大肠杆菌
域;总界 domain;superkingdom   真核域:Eukarya 真核域:Eukarya 真核域:Eukarya 真核域:Eukarya 细菌域:Bacteria
kingdom regnum, regna 动物界:Animalia 动物界:Animalia 植物界:Plantae 真菌界:Fungi  
division;phylum divisio, divisiones;phylum, phyla 节肢动物门:Arthropoda 脊索动物门:Chordata 种子植物门:Spermatophyta 子囊菌门:Ascomycota 变形菌门:Proteobacteria
亚门 subdivision;subphylum subdivisio, subdivisiones;subphylum, subphyla 六足亚门:Hexapoda 脊椎动物亚门:Vertebrata 被子植物亚门:Angiospermae    
class classis, classes 昆虫纲:Insecta 哺乳纲:Mammalia 双子叶植物纲:Dicotyledoneae 酵母纲:Saccharomycetes γ-变形菌纲:Gammaproteobacteria
亚纲 subclass subclassis, subclasses 新翅亚纲:Neoptera 真兽亚纲:Eutheria 蔷薇亚纲:Rosidae    
order ordo, ordines 双翅目:Diptera 灵长目:Primates 豆目:Fabales 酵母目:Saccharomycetales 肠杆菌目:Enterobacteriales
亚目 suborder subordo, subordines 短角亚目:Brachycera 简鼻亚目:Haplorrhini      
family familia, familiae 果蝇科:Drosophilidae 人科:Hominidae 豆科:Fabaceae 酵母科:Saccharomycetaceae 肠杆菌科:Enterobacteriaceae
亚科 subfamily subfamilia, subfamiliae 果蝇亚科:Drosophilinae 人亚科:Homininae 蝶形花亚科:Faboideae    
genus genus, genera 果蝇属:Drosophila 人属:Homo 豌豆属:Pisum 酵母属:Saccharomyces 埃希氏菌属:Escherichia
species species, species 黑腹果蝇:D. melanogaster 智人:H. sapiens 豌豆:P. sativum 酿酒酵母:S. cerevisiae 大肠杆菌:E. coli

注:

  • 表中很多分类尚有分歧,除细菌参照伯杰氏手册的分类大纲外,其余按照传统分类,未有统一标准,谨作参考。
  • 植物学和微生物学家用系统方法对较高级的分类单元命名,即用拉丁文中模式属(英文type genus)属名的词干加上标准的词尾来命名这个单元(见下表)。例如,蔷薇科的“科长”(即模式属)是蔷薇属(Rosa),其词干为“Ros-”,则蔷薇科的拉丁名即为“Ros-”加上植物的科的后缀“-aceae”成为“Rosaceae”。中文的大多数分类单元也是类似用法,但:
  • 中文所用为高级单元的取名的属可能和拉丁文不同,如牻牛儿苗科(Geraniaceae)的中文名来源于牻牛儿苗属(Erodium),但其拉丁名来源于老鹳草属(Geranium)。
  • 拉丁名变更后中文名不一定变更。如唇形科拉丁名原根据形态命名为Labiatae,现根据标准改为Lamiaceae,取名源自野芝麻属(Lamium),中文也不必将唇形科改译作“野芝麻科”。
  • 动物学家通常只将类似命名法命名至科(包括总科)这一级,以上则多用描述法。
  • 为了更细致的分类,学者们在门、纲、目、科、属、种之外加了很多附属级别。最常用的是“亚-”(sub-),在正常级别之下,如“亚纲”、“亚科 ”等等。在正常级别之上则为“总-”(super-),如“总目”。比“亚”更小的还有“下-”,或译作“次-”(infra-)。但下目仍然要比总科 大。此外,对于植物,在科和属之间还有“族”(拉tribus, tribi,英tribe),属之下还有“节”(拉sectio, sectiones,英section),再往下还能有“系”(拉、英series, series)。比较完整的种之上的分类单元的次序为(尽管目前大概没有能把这些等级都用全的分类系统):
    域(总界) - 界 - 门 - 亚门 - 总纲 - 纲 - 亚纲 - 下纲 - 总目 - 目 - 亚目 - 下目 - 总科 - 科 - 亚科 - 族 - 亚族 - 属 - 亚属 - 节 - 亚节 - 系 - 亚系 - 种
  • 在种之下,动植物还能分成“亚种”(subspecies,简写subsp.)和“变种”(拉varietas, varietates,英variety,简写var.),植物还能加上栽培种名。比如现代智人的学名为Homo sapiens subsp. sapiens,或者也可以直接省掉亚种简写直接写成Homo sapiens sapiens。一种豌豆的变种的栽培种可写成Pisum sativum var. macrocarpon 'Snowbird'。对于细菌和古菌,在种之下则用“株”(英strain),如一株可以引起食物中毒的大肠杆菌菌株Escherichia coli O157:H7。注意只有属之下的单位(包括亚种、变种)名用斜体,而属级之上的单位、级别缩写、栽培种名和菌株名用正体。
  • 病毒与朊毒体(Prion)尚未有明确的分类。

4.分类名称后缀

在属以上级别的分类单元的拉丁文名称通常由模式属的词干加上一个标准的后缀所构成。后缀的选择取决于分类单元传统上所在的大类别,如下表所示:

分类单元 植物 藻类 真菌 原核生物 动物
-phyta -phyta -mycota    
亚门 -phytina -phytina -mycotina    
-opsida -phyceae -mycetes    
亚纲 -idae -phycidae -mycetidae    
总目 -anae  
-ales  
亚目 -ineae  
下目 -aria  
总科 -acea -oidea
-aceae -idae
亚科 -oideae -inae
-eae -ini
亚族 -inae -ina

注意:

  • 拉丁文的词干可能并不能从主格的词直接推断出来,比如Homo(人属)的词根为homin-,而非hom-,因此人科不是Homidae而是Hominidae。
  • 对于动物,标准的词尾只上推到总目(《国际动物命名法规》(ICZN)中的27.2)。
  • 对于原核生物,标准词尾上推到目(目前总目等级没有应用),词尾同植物、藻类、真菌。

Taxonomy Rank值

该值顺序自大向小。

1 superkingdom 超界 2 kingdom
3 subkingdom 亚界 4 superphylum 超门
5 phylum 6 subphylum 亚门
7 superclass 总纲 8 class
9 subclass 亚纲 10 infraclass 小纲,下纲
11 superorder 总目 12 order
13 suborder 亚目 14 infraorder 下目
15 parvorder 小目 16 superfamily 总科
17 family 18 subfamily 亚科
19 tribe 20 subtribe 亚族
21 genus 22 subgenus 亚属
23 species 24 subspecies 亚种
25 species group 种群 26 species subgroup 亚种群
27 forma 变型 28 varietas 变种

物种分类数据库使用演示

点击查看 - 物种分类数据库使用演示视频