下载提交帮助 核酸数据提交用户说明

核酸数据提交

我们接受CoreNucleotide,contig和supercontig数据。请照步骤提交数据并按照核酸数据提交说明处理要提交的数据文件,生成指定格式后将subdesc.bch文件和指定格式的要提交的数据文件一同上传给我们。上传地址:ftp://upload:lsbi@lifecenter.sgst.cn:2121/CoreNucleotide/批次号/ 用户名为:upload 密码为:lsbi

快速提交(subdesc.bch)将自动为你新建项目和批次,批次号可在标识文件中获得。

提交步骤

  • 请先确认您已是数据共享平台网站注册的用户,否则请先注册。
  • 登陆数据共享平台后,点击左侧菜单的mydata,选择已有项目或创建新项目。
  • 选择已有批次或创建新批次。在创建批次时,选择要提交的数据类型为“普通核酸”。
  • 在点击批次下的submit data按钮后,进入提交页面。
  • 选择离线提交(batch submission) ,下载标识文件(subdesc.bch)。
  • 按照指定格式处理生成数据文件,连同标识文件一起,通过ftp上传至服务器。

提交的文件

包括以下文件:

subdesc.bch 标识文件

sequences.gb genbank格式的序列文件 (必须有的,上传时可根据需要将该文件用tar和gzip压缩,压缩后文件名为sequences.gb.tar.gz)

trace-seq.txt trace与contig sequences的拼接关系 (可有可无的,上传时可根据需要将该文件用tar和gzip压缩,压缩后文件名为race-seq.txt.tar.gz)

1) subdesc.bch文件为从生物信息科学数据共享平台下载下来的标识文件,请不要更改。

2) sequences.gb为序列文件,格式为genbank格式,有关的Genbank格式说明,请参看NCBI的相关说明。sequences.gb文件中必须包括且仅包括sequence和contig两个字段中的一个。 sequence字段提供该条记录的核酸序列。contig字段在该序列为其他核酸序列拼接形成时使用,描述该记录的拼接信息:形式为: 其中序列编号为生物信息科学数据共享平台已经公布的序列accession号或该文件中其它sequence的locus ID。

3) trace-seq.txt是描述trace数据和contig sequences之间拼接关系的文件,提交该类数据文件时请先确认你已经上传了这些trace数据并且这些数据都已经被我们接受了. 该文件为文本文件,格式为:每行由 trace_id号(NDBC的编号),trace开始的位置,trace结束的位置,trace的方向,contig_id号,contig 开始的位置组成,数据之间由tab键隔开。