高级查询

在SDSPB的首页上点击“基础数据资源”按钮,选择“EST数据库”进入EST数据库主页。在EST数据库主页的左侧栏点击“高级检索”,进入如下图的高级检索页面:

EST数据库提供了限定词查询,以缩小查询的范围。可以使用的限定查询词有ID、Name、CAC、DNA Type、Clone ID、Entry Date、Library Name、Tax ID、Organism、Submitter Name等10种。

10种限定词之间可以使用“AND”和“OR”相连接,其中“AND”表示查询的结果中必须包含它所连接的两个关键词,“OR”表示查询的结果中至少包含它所连接的关键词中的一个。

除了使用以上的10种限定词进行查询外,用户还可以指定序列的最后修改日期,即在“限定年份”中指定某一年或者某几年。

限定词说明

EST数据库中相关的限定词说明如下:

限定词 描述
ID EST序列的入库时的流水号
Name EST序列的名称
CAC 数据在SDSPB中的AC号
DNA Type DNA的类型
Clone ID 克隆号
Entry Date 数据创建日期
Library Name 文库名称
Tax ID 物种分类号
Organism 物种名称
Submitter Name 提交者姓名

显示格式说明

EST数据库的查询结果显示有三种格式:“Summary”、“FASTA”和“Full”。其中Summary为默认的查询结果显示方式。

"Summary" 格式

Summary格式显示查询序列的摘要性信息,由两行信息组成:

第一行显示信息为EST序列的CAC号和序列的类型。

第二行显示信息分别为:EST序列的名字、EST序列的来源物种、EST来源DNA的类型以及克隆ID。

"FASTA" 格式

EST序列的FASTA格式第一行显示为EST序列的CAC号,第二行以“〉”开头,后跟EST序列的CAC号、序列的名字、文库的名字、序列来源物种、序列来源DNA类型、克隆ID以及其它描述信息。第三行为EST序列的详细序列数据。

"Full" 格式

Full格式显示了一个EST序列的详细信息,主要有序列的标识信息、克隆信息、文库信息、序列提交者信息等,常见的字段信息如下:

字段 意义
IDENTIFIERS EST序列的相关标识信息
ID EST序列提交时产生的流水号
EST name EST序列的名字
CAC EST序列在B中的唯一标识号
DBNAME 交叉引用的数据库名称
DBXREF 交叉引用的数据库编号
CLONE INFO 有关克隆的信息
Clone id 克隆号
DNA type EST来源DNA的类型
PRIMERS 有关引物的信息
PolyA tail 有无PolyA尾巴
SEQUENCE EST序列
Entry created EST序列录入时间
COMMENTS 对EST序列的评论
LIBRATY 有关文库的信息
Lib name 文库的名字
Organism 制作文库用的生物物种
Vector 载体类型
R. Site 1 载体的限制性酶切位点1
Description 描述文库的准备方法,载体等
Name 提交者姓名
Lab 提交者实验室名字
Institution 提交者所在机构
Address 提交者地址
Tel 电话
Fax 传真
E-mail 电子邮件
CITATIONS 有关引用的信息
Title 引用EST的文章标题
Authors 引用EST的文章作者
Year 创作的年份

数据下载流程

SDPSB的EST数据库提供如下两种数据下载方式:

1)下载打包的EST数据

点击EST数据库页面的左侧栏中的“数据下载”,你可以FTP下载我们发布的所有EST数据。

2)下载查询到的核酸序列数据

在查询结果的页面,选择“Summary”、“FASTA”和“Full”三种格式中的一种,然后点击“下载”按钮,即可下载你所查询到的结果中你选中的EST序列数据,如果空选,则下载查询结果中当前页面的全部核酸序列数据。

数据提交

如果您有数据向我们提交,请参见:数据提交