核酸数据提交
我们接受CoreNucleotide,contig和supercontig数据。请照步骤提交数据并按照核酸数据提交说明处理要提交的数据文件,生成指定格式后将subdesc.bch文件和指定格式的要提交的数据文件一同上传给我们。上传地址:ftp://upload:lsbi@lifecenter.sgst.cn:2121/CoreNucleotide/批次号/ 用户名为:upload 密码为:lsbi
提交步骤
- 请先确认您已是数据共享平台网站注册的用户,否则请先注册。
- 登陆数据共享平台后,点击左侧菜单的mydata,选择已有项目或创建新项目。
- 选择已有批次或创建新批次。在创建批次时,选择要提交的数据类型为“普通核酸”。
- 在点击批次下的submit data按钮后,进入提交页面。
- 选择离线提交(batch submission) ,下载标识文件(subdesc.bch)。
- 按照指定格式处理生成数据文件,连同标识文件一起,通过ftp上传至服务器。
提交的文件
包括以下文件:
subdesc.bch 标识文件
sequences.gb genbank格式的序列文件 (必须有的,上传时可根据需要将该文件用tar和gzip压缩,压缩后文件名为sequences.gb.tar.gz)
trace-seq.txt trace与contig sequences的拼接关系 (可有可无的,上传时可根据需要将该文件用tar和gzip压缩,压缩后文件名为race-seq.txt.tar.gz)
1) subdesc.bch文件为从生物信息科学数据共享平台下载下来的标识文件,请不要更改。
2) sequences.gb为序列文件,格式为genbank格式,有关的Genbank格式说明,请参看NCBI的相关说明。sequences.gb文件中必须包括且仅包括sequence和contig两个字段中的一个。 sequence字段提供该条记录的核酸序列。contig字段在该序列为其他核酸序列拼接形成时使用,描述该记录的拼接信息:形式为: 其中序列编号为生物信息科学数据共享平台已经公布的序列accession号或该文件中其它sequence的locus ID。
3) trace-seq.txt是描述trace数据和contig sequences之间拼接关系的文件,提交该类数据文件时请先确认你已经上传了这些trace数据并且这些数据都已经被我们接受了. 该文件为文本文件,格式为:每行由 trace_id号(NDBC的编号),trace开始的位置,trace结束的位置,trace的方向,contig_id号,contig 开始的位置组成,数据之间由tab键隔开。
