Skip to main content
文献阅读: 烟草基因组
  1. Blog/

文献阅读: 烟草基因组

· loading · loading · ·
文献阅读 文献阅读 基因组学
Table of Contents

论文链接: Zan, Y.et al.The genome and GeneBank genomics of allotetraploid Nicotiana tabacum provide insights into genome evolution and complex trait regulation.Nat Genet 1–11 (2025) doi:10.1038/s41588-025-02126-0.

背景
#

  • 烟草(Nicotiana tabacum)是一种异源四倍体杂交种,由林烟草(Nicotiana sylvestris)和拟绒毛烟草(Nicotiana tomentosiformis)杂交而成. 烟草的不同品种差异非常大,远超祖先种,按照农业用途划分为:烤烟(flue-cured,卷烟)晒烟(sun-cured,烟斗)白肋烟(burley,混合烟)雪茄烟(cigar)东方烟(oriental)

  • 多倍化的最常见命运是fractionation和二倍化,可能涉及的机制包括homoeologous1染色体交换、转做元件的重新激活、DNA甲基化

结果与讨论
#

Genome evolution highlighted by chromosome-scale assemblies
#

作者分别对栽培种(ZY300)及两种祖先种进行了高质量的染色体级基因组组装:

Nicotiana tabacum L.var ZY300 Nicotiana sylvestris Nicotiana tomentosiformis
Number of chromosomes 24 12 12
Size of genome 4174803700 2379017988 2244010975
GC content (%) 39.01 39.21 39.18
Number of contigs 2070 18 20
Contig NG50 (bp) 27168399 190035529 170533715
Number of scaffolds 1448 15 15
Scaffolds NG50 (bp) 169642138 192385001 189532187
Gap number 57.505 3 5
Gap size (bp) 3423090 300 500
Hi-C anchoring rate (%) 97.03 99.97 99.98
Number Average gene length (bp) Average CDS length per gene (bp) Average exon number per gene Average exon length (bp) Average intron length (bp)
Nicotiana tabacum L. var ZY300 80433 4142.953 1089.597 4.481 1285.125 820.9767
Nicotiana sylvestris 40290 4360.859 1088.196 4.314 1531.958 616.7752
Nicotiana tomentosiformis 37862 4068.097 1151.372 4.262 1313.867 657.3184

此外,他们还注释了基因结构和重复序列。LTR类转座子(特别是Gypsy)在T亚基因组中更为丰富,尤其集中于2、17和19号染色体。

通过ChIP-seq和quarTeT预测了着丝粒区域,两个方法结果高度一致,支持其准确性。

共线性分析和LTR分析发现:

  • 四倍体中存在大量>1Mb的结构变异,包括1420个倒位、539个重复及725个缺失。
  • T亚基因组相较S亚基因组表现出更频繁的遗传变化。
  • 仅有7.56%的LTR插入事件发生在多倍化之后,说明多倍化不必然激活大量LTR。

Subgenome expression divergence and epigenetic modification
#

  • 仅小部分基因在亚基因组与祖先种之间存在显著表达差异。
  • 多倍体中,表达上调的基因往往甲基化水平较低。
  • 存在66对同源基因在不同亚基因组中表达方向相反。
  • S/T偏好表达基因富集的功能不同。

Genetic diversity of a global collection of 5,196 lines
#

通过对全球5196份材料中的2582份进行GBS测序,作者获得了9.5万个SNP标记,覆盖了约98%的基因组区域。

  • PCA将晒烟和烤烟区分明显
  • PCA第二主成分与纬度相关
  • 白肋烟(“White Burley”的突变品种,该品种具有叶绿素缺失的表型,由YB1和YB2两个隐性等位基因控制,)起源明确,聚集于北美谱系
  • IBS值在0.75-0.88之间,说明整体育种基因库较窄
  • 虽然栽培烟草表型差异显著,但遗传分化指数显示其遗传分化仍然有限

Subgenome divergence and regulation of complex traits
#

通过对43个性状进行GWAS,筛选出39个性状的178个显著关联标记:

  • LD(连锁不平衡)衰减很慢,500bk内关联依然很高,难以确定具体的基因,但还是在八个关联峰附近找到了先前已报道的QTLs,同时构建了遗传图谱
  • 大多数QTL只存在于单一亚基因组
  • T亚基因组对大多数抗病性状的贡献更大
  • HEB区域(同源表达偏倚区域)虽然SNP比例低,却对某些性状(如白粉病抗性)影响巨大

Arf9 is associated with leaf width variation
#

作者构建近等基因系定位叶片形态关键基因

  • 将候选基因定位到134 kb区间,该区间包含一个基因和2个snp标记
  • 在XHJ品种中敲除该基因后,叶宽增加了6cm
  • 致因突变定位于第8外显子的Ala258→Pro258变化

Signatures of positive selection and polygenic selection
#

研究发现:

  • 多数性状变化是通过多个微效QTL积累实现
  • 这些位点尚未在群体中固定
  • 暗示育种仍具提升空间,同时也强调了polygenic adaptation在作物演化中的重要作用

一些小概念的补充
#

  • 常见遗传群体
类型 全称 特点 用途
BC Backcross(回交群体) F1与亲本之一回交得到,如F1 × P1 遗传图谱构建,单基因定位
NIL Near-Isogenic Line(近等基因系) 与亲本基因组高度一致,仅差一个或几个基因片段 精准定位,功能验证
RIL Recombinant Inbred Line(重组自交系) F2之后连续自交(多代),达到高度纯合 QTL定位,群体结构分析
DH Double Haploid(双单倍体) 通过花药培养等方法诱导获得纯合个体 快速获得纯合材料

https://www.omicsclass.com/article/814

  • 状态同源 / 血缘同源 IBS / IBD
    • 血缘同源(Identity By Descent,IBD),子代中共有的等位基因来源于同一祖先。
    • 状态同源(identical by state ,IBS),两个个体拥有相同的等位基因(不一定来源以同一祖先)。
    • IBD可以让我们了解两个体间的亲缘关系,虽然无法直接测得,但可以根据IBS以及等位基因频率的分布来推定。

https://gwaslab.org/2020/04/11/%E7%8A%B6%E6%80%81%E5%90%8C%E6%BA%90-%E8%A1%80%E7%BC%98%E5%90%8C%E6%BA%90-ibs-ibd-%E6%A6%82%E5%BF%B5%E4%B8%8E%E8%AE%A1%E7%AE%97%EF%BC%88plink%EF%BC%89/

  • 群体分化遗传指数

FST (Fixation index)是衡量群体间遗传分化程度的指标,广泛应用于群体遗传学研究。

  • 范围:0(无分化) ~ 1(完全分化)
  • 公式: $$ F_{ST} = \frac{H_T - H_S}{H_T} $$
  • HT:总群体的期望杂合度
  • HS:亚群体的平均期望杂合度

https://gwaslab.org/2021/04/25/fst/


  1. Homologous genes resulting from allopolyploidy are commonly referred to as ‘homoeologs’, ↩︎