背景 #
-
烟草(Nicotiana tabacum)是一种异源四倍体杂交种,由林烟草(Nicotiana sylvestris)和拟绒毛烟草(Nicotiana tomentosiformis)杂交而成. 烟草的不同品种差异非常大,远超祖先种,按照农业用途划分为:烤烟(flue-cured,卷烟)晒烟(sun-cured,烟斗)白肋烟(burley,混合烟)雪茄烟(cigar)东方烟(oriental)
-
多倍化的最常见命运是fractionation和二倍化,可能涉及的机制包括homoeologous1染色体交换、转做元件的重新激活、DNA甲基化
结果与讨论 #
Genome evolution highlighted by chromosome-scale assemblies #
作者分别对栽培种(ZY300)及两种祖先种进行了高质量的染色体级基因组组装:
Nicotiana tabacum L.var ZY300 | Nicotiana sylvestris | Nicotiana tomentosiformis | |
---|---|---|---|
Number of chromosomes | 24 | 12 | 12 |
Size of genome | 4174803700 | 2379017988 | 2244010975 |
GC content (%) | 39.01 | 39.21 | 39.18 |
Number of contigs | 2070 | 18 | 20 |
Contig NG50 (bp) | 27168399 | 190035529 | 170533715 |
Number of scaffolds | 1448 | 15 | 15 |
Scaffolds NG50 (bp) | 169642138 | 192385001 | 189532187 |
Gap number | 57.505 | 3 | 5 |
Gap size (bp) | 3423090 | 300 | 500 |
Hi-C anchoring rate (%) | 97.03 | 99.97 | 99.98 |
… | … | … |
Number | Average gene length (bp) | Average CDS length per gene (bp) | Average exon number per gene | Average exon length (bp) | Average intron length (bp) | |
---|---|---|---|---|---|---|
Nicotiana tabacum L. var ZY300 | 80433 | 4142.953 | 1089.597 | 4.481 | 1285.125 | 820.9767 |
Nicotiana sylvestris | 40290 | 4360.859 | 1088.196 | 4.314 | 1531.958 | 616.7752 |
Nicotiana tomentosiformis | 37862 | 4068.097 | 1151.372 | 4.262 | 1313.867 | 657.3184 |
此外,他们还注释了基因结构和重复序列。LTR类转座子(特别是Gypsy)在T亚基因组中更为丰富,尤其集中于2、17和19号染色体。
![]() |
![]() |
![]() |
共线性分析和LTR分析发现:
- 四倍体中存在大量>1Mb的结构变异,包括1420个倒位、539个重复及725个缺失。
- T亚基因组相较S亚基因组表现出更频繁的遗传变化。
- 仅有7.56%的LTR插入事件发生在多倍化之后,说明多倍化不必然激活大量LTR。
Subgenome expression divergence and epigenetic modification #
![]() |
![]() |
- 仅小部分基因在亚基因组与祖先种之间存在显著表达差异。
- 多倍体中,表达上调的基因往往甲基化水平较低。
- 存在66对同源基因在不同亚基因组中表达方向相反。
- S/T偏好表达基因富集的功能不同。
Genetic diversity of a global collection of 5,196 lines #
通过对全球5196份材料中的2582份进行GBS测序,作者获得了9.5万个SNP标记,覆盖了约98%的基因组区域。
![]() |
![]() |
- PCA将晒烟和烤烟区分明显
- PCA第二主成分与纬度相关
- 白肋烟(“White Burley”的突变品种,该品种具有叶绿素缺失的表型,由YB1和YB2两个隐性等位基因控制,)起源明确,聚集于北美谱系
- IBS值在0.75-0.88之间,说明整体育种基因库较窄
- 虽然栽培烟草表型差异显著,但遗传分化指数显示其遗传分化仍然有限
Subgenome divergence and regulation of complex traits #
通过对43个性状进行GWAS,筛选出39个性状的178个显著关联标记:
- LD(连锁不平衡)衰减很慢,500bk内关联依然很高,难以确定具体的基因,但还是在八个关联峰附近找到了先前已报道的QTLs,同时构建了遗传图谱
- 大多数QTL只存在于单一亚基因组
- T亚基因组对大多数抗病性状的贡献更大
- HEB区域(同源表达偏倚区域)虽然SNP比例低,却对某些性状(如白粉病抗性)影响巨大
Arf9 is associated with leaf width variation #
作者构建近等基因系定位叶片形态关键基因
- 将候选基因定位到134 kb区间,该区间包含一个基因和2个snp标记
- 在XHJ品种中敲除该基因后,叶宽增加了6cm
- 致因突变定位于第8外显子的Ala258→Pro258变化
Signatures of positive selection and polygenic selection #
研究发现:
- 多数性状变化是通过多个微效QTL积累实现
- 这些位点尚未在群体中固定
- 暗示育种仍具提升空间,同时也强调了polygenic adaptation在作物演化中的重要作用
一些小概念的补充 #
- 常见遗传群体
类型 | 全称 | 特点 | 用途 |
---|---|---|---|
BC | Backcross(回交群体) | F1与亲本之一回交得到,如F1 × P1 | 遗传图谱构建,单基因定位 |
NIL | Near-Isogenic Line(近等基因系) | 与亲本基因组高度一致,仅差一个或几个基因片段 | 精准定位,功能验证 |
RIL | Recombinant Inbred Line(重组自交系) | F2之后连续自交(多代),达到高度纯合 | QTL定位,群体结构分析 |
DH | Double Haploid(双单倍体) | 通过花药培养等方法诱导获得纯合个体 | 快速获得纯合材料 |
- 状态同源 / 血缘同源 IBS / IBD
- 血缘同源(Identity By Descent,IBD),子代中共有的等位基因来源于同一祖先。
- 状态同源(identical by state ,IBS),两个个体拥有相同的等位基因(不一定来源以同一祖先)。
- IBD可以让我们了解两个体间的亲缘关系,虽然无法直接测得,但可以根据IBS以及等位基因频率的分布来推定。
- 群体分化遗传指数
FST (Fixation index)是衡量群体间遗传分化程度的指标,广泛应用于群体遗传学研究。
- 范围:0(无分化) ~ 1(完全分化)
- 公式: $$ F_{ST} = \frac{H_T - H_S}{H_T} $$
- HT:总群体的期望杂合度
- HS:亚群体的平均期望杂合度
-
Homologous genes resulting from allopolyploidy are commonly referred to as ‘homoeologs’, ↩︎