Trace帮助

高级查询

在首页上点击“基础数据资源”按钮,选择“Trace数据库”进入Trace数据库主页,如下图所示:


限定词说明

Trace数据库能够利用限定词来进行更精的确查找,支持的限定词包括如下几种:

限定词 描述
Trace Id 在SDSPB的流水号
Center name 测序中心的名字
Source type DNA的来源。G = Genomic DNA;N = Non Genomic DNA;VIRAL RNA = Viral RNA; SYNTHETIC = Synthetic DNA
Species Code 物种代号
Trace name Trace的名字,在一个测序中心里Trace的名字是唯一的,不过在不同测序中心之间名字可以相同,它在Trace Archive里由TRACE_NAME 和 CENTER_NAME。
Chemistry type 在测序中所使用的化学类型,有两种可供选择:Primer和 Terminator,其中p=primer,t=terminator。
Create data 数据创立日期
Tax ID 物种分类号
Organism 来源的物种名称

显示格式说明

SDSPB的Trace数据库查询结果显示有如下三种显示格式:FASTA、Quality、Info,Trace格式仅提供下载。

FASTA显示格式

FASTA显示格式是系统默认的显示格式。

FASTA格式第一行为注释信息行,“>gnl”开头,后跟Trace的ID和名字。第二行为具体的序列数据。

Quality显示格式

Quality格式显示有关序列质量的数据,其第一行为标识符“>gnl”,后跟Trace的ID。第二行开始为详细的序列质量数据。

Info显示格式

Info格式显示了测序的描述性信息,常见的信息有如下几种:

描述字段 意义
Id Trace的在SDSPB的流水号
trace_name Trace的名字
center_name 测序中心的名称
species_code 对Trace来源物种的描述
trace_type_code 获取Trace所采用的测序策略
submission_type 提交数据的类型,可以是如下:NEW、UPDATE、UPDATEINFO、WITHDRAW。
source_type DNA的来源
taxid Trace来源物种的分类号
chemistry_type 在测序中所使用的化学类型
insert_size 期望的插入大小
plat_id 由提交者所定义的plat ID,用于标识测序模板的存储位置。
program_id 创建Trace文档所使用的程序
svector_code 测序中心所定义的测序载体的代码
template_id 提交者所定义的测序模板的标识符
trace_end 读取的模板末端的定义。可以是以下值:
F: FORWARD
R: REVERSE
N: UNKNOWN
trace_format Trace文档的格式,可以是以下值:
SFF:Standard Flowgram Format.
SCF:A standard file format for data from DNA sequencing instruments.
ZTR:The ZTR format is used for storing analogue chromatogram data from DNA sequencing instruments.
ABI:A ABI-trace file is a binary file including the trace data and the sequence.
well_id 测序中心所定义的测序反应标识符,和plate_id一起用来标识测序反应的存储位置。

数据下载流程

SDSPB的Trace数据库提供如下两种数据下载方式:

1)下载打包的Trace数据

我们提供了Trace数据的FTP下载,点击Trace数据库页面的左侧栏中的“数据下载”,你就可以通过FTP来登录我们的下载中心,然后选择你需要的数据来进行下载。

2)下载查询到的Trace序列数据

在查询结果的页面,选择 “FASTA”、“Quality”、“Info”和“Trace”四种格式中的一种,然后点击“下载”按钮,即可下载你所查询到的结果中你选中的蛋白质序列数据,如果你没有选中,则下载当前显示页面上的全部数据。

数据提交

Trace数据库的提交请参见:数据提交页面