FASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式。
它们都是以ASCII编码的。现在几乎是高通量测序的标准格式。NCBI Short Read Archive也是这格式,多了一些描述性词汇而已。格式示例如下:
@SEQ_ID
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65
第一行@后面是描述性文字;
第二行是原始的数据;
第三行是描述性的+号;
最后一行是对第二行相应位置的质量评估。
详细的如Illumina软件格式,NCBI Short Read Archive格式,质量评价标准,ASCII详细编码等请看这里。
本文由 Bin 创作