节点文献
芸薹属作物C基因组变异及启示
【机构】 中国农业科学院油料作物研究所;
【摘要】 【研究背景】芸薹属作物中有多种含有C基因组的作物类型,如蔬用的二倍体种甘蓝、花椰菜、青花菜、芥蓝、苤蓝、抱子甘蓝和羽衣甘蓝(CC),油用的异源四倍体种甘蓝型油菜(AACC)和埃芥(BBCC),因此,研究含C基因组作物的进化具有重要意义。虽然上述二倍体和四倍体栽培种中已有多个先后完成全基因组测序,为研究C基因组进化奠定了很好的基础,但由于缺乏二倍体野生种—野生甘蓝的基因组信息,无法从基因组角度深入研究含C基因组芸薹属作物的驯化过程。现分布于欧洲地中海和大西洋沿岸的野生甘蓝是目前唯一明确大量分布的芸薹属植物野生种,因此,解析野生甘蓝基因组,并通过与已有的栽培甘蓝进行比较基因组和泛基因组分析,有助于揭示含C基因组栽培种的起源与驯化过程,以及与形态、抗性等关键性状演变的关系。【材料与方法】本研究采用三代测序结合Hi-c技术从头组装了一个野生甘蓝的高质量基因组同时对野生甘蓝开展了重测序分析。并与已有的6个栽培甘蓝、甘蓝型油菜和埃芥进行了比较基因组、泛基因组分析和群体进化分析,研究了含C基因组芸薹属作物的驯化过程中基因组结构和重要基因的变异。【结果与分析】野生甘蓝基因组大小为630.7 Mb,其中Contig N50达到2.3 Mb,Scaffold N50为64.5 Mb,进一步注释出62,059个基因,45.29%的重复序列。相较于栽培甘蓝基因组,野生甘蓝基因组最大,注释基因最多。BUSCO和CEGMA评估均达到96%以上,LAI(LTR Assembly Index)指数为15.86,达到参考基因组级别(10≤LAI≤20)。泛基因组分析鉴定29,744个核心基因集,23,306个非必需基因集和1,896个私有基因集,野生甘蓝私有基因显著富集在脂肪酸合成,脂质合成和响应外界刺激上。另外,以野生甘蓝为参考基因组,鉴定到栽培甘蓝相较于野生甘蓝存在大量的遗传变异,其中SNP数量4.09×10~6-4.79×10~6,In Del(<100bp)数量为9.24×10~5-15.8×10~5,SV的数量5.56×10~4-6.38×10~4。Copy number variation(CNV)分析发现栽培种相较于野生种大约有2.97×10~4-3.34×10~4个Copy Number Conserved (CNC)的基因,大约有3.5×10~3-4.8×10~3个Copy Number Deceased (CND)的基因,另外有0.8×10~3-1.7×10~3个Copy Number Inceased(CNI)的基因,CND的基因数目远远大于CNI,这表明野生种到栽培种进化过程中有大量基因的拷贝数减少了,这解释了野生甘蓝基因组包含有更多的注释基因。研究发现了与栽培种重要形态和抗性性状形成的关键基因,如在CND基因中发现一个Repressor of gibberellin (RGA)基因,该基因编码DELLA蛋白,是赤霉素的响应基因,参与植物营养生长与开花调控。该基因在野生甘蓝基因组中有3个拷贝,而在其他6个栽培种中只有2个拷贝,BolRGA基因多拷贝引起的计量效应可能是野生种和栽培种营养生长各异、开花迟或早的关键。【结论】本研究组装了高质量野生甘蓝基因组,通过与与其他栽培基因组比较分析,揭示了C基因组在栽培种形成中的变异规律,为野生种优异基因的发掘与创新利用提供了重要指导。
- 【会议录名称】 第二十届中国作物学会学术年会论文摘要集
- 【会议名称】第二十届中国作物学会学术年会
- 【会议时间】2023-11-01
- 【会议地点】中国湖南长沙
- 【分类号】S635
- 【主办单位】中国作物学会