真菌基因组de novo测序
真菌全基因组从头测序(Fungi Whole Genome de novo Sequencing),是指对基因组序列未知或无近缘物种基因组信息的某个物种,构建不同插入片段的基因组DNA文库并对文库进行序列测定,然后利用生物信息学方法进行拼接、组装和注释,从而获得该真菌的全基因组序列图谱。
产品参数
产 品 | 文库插入片段大小(bp) | 测序平台及测序模式 | 测序深度 | 交付指标 | 项目周期 |
框架图A | 400 ~ 500 | Illumina MiSeq,PE251 | ~100 × | 无基因预测和注释 | 30 个自然日 |
框架图B | 400 ~ 500 | Illumina HiSeq,PE150 | ~100 × | 无基因预测和注释 | 35 个自然日 |
框架图C | 400 ~ 500 | Illumina MiSeq,PE251 | ~100 × | 含基因预测和注释 | 40 个自然日 |
框架图D | 400 ~ 500 | Illumina HiSeq,PE150 | ~100 × | 含基因预测和注释 | 45 个自然日 |
完成图 | 400 ~ 500 | Illumina MiSeq,PE251 | ~100 × | 简单真菌1 Contig N50 ≥ 500 kb 复杂真菌2 Contig N50 ≥ 300 kb | 60 个自然日 |
20,000 | PacBio | ~100 × |
1、简单真菌:35% ≤ G+C% ≤ 65% 且杂合度 ≤ 0.5%且基因组 ≤ 40 Mb;
2、复杂真菌:G+C% > 65% 或 G+C% > 35%或杂合度 > 0.5%或基因组 > 40 Mb;
Contig N50:将组装得到的 Contig 按序列长度从长到短排序并依次累加,当累加长度正好达到序列总长度 50% 时,更后一条序列的长度。
技术线路
信息分析内容
序 号 | 分析项目 | 类 别 | 分 析 | 备 注 |
1 | 下机数据统计 | A |
|
|
2 | 数据质控 | A |
|
|
3 | 高质量数据获取 | A |
|
|
4 | Survey 分析 | A |
|
|
5 | 基因组拼装 | A |
|
|
6 | 基因组拼装效果评价 | A |
|
|
7 | 基因组拼装完整性与连续性评估 | A |
|
|
8 | 重复序列分析 | A |
|
|
9 | 非编码 RNA 预测 | A |
|
|
10 | 蛋白编码基因预测 | A |
|
|
11 | 碳水化合物活性酶(CAZy)分析 | A |
|
|
12 | 细胞色素 P450 家族分析 | A |
|
|
13 | 蛋白编码基因的序列比对 | A |
|
|
14 | 蛋白编码基因的 GO 注释 | A |
|
|
15 | 蛋白编码基因的 eggNOG 注释 | A |
|
|
16 | 蛋白编码基因的 KEGG 注释 | A |
|
|
17 | 蛋白编码基因的 Swiss-Prot 注释 | A |
|
|
18 | 蛋白编码基因的结构域分析 | A |
|
|
19 | 序列比对分析 | A |
|
|
20 | SNP 分析 | A |
|
|
21 | InDel 分析 | A |
|
|
22 | 基因家族分析 | B |
| 基因组数量 ≥ 2 |
23 | Venn 绘制 | B |
| 基因组数量 ≥ 2 |
24 | 单拷贝基因的蛋白序列一致性分析 | B |
| 基因组数量 ≥ 3 |
25 | 基因家族扩张和收缩分析 | B |
| 基因组数量 ≥ 3 |
26 | dNdS 分析 | B |
| 基因组数量 ≥ 2 |
27 | 基于全基因组单拷贝基因的进化树重构 | B |
| 基因组数量 ≥ 3 |
28 | 分歧时间估算 | B |
| 基因组数量 ≥ 3 |
29 | 基因组数据上传 | B |
|
|
30 | 基因组圈图绘制 | A |
|
|
A:标准信息分析; B:高级信息分析。
分析结果展示