Please wait a minute...
欢迎访问作物学报,今天是
图/表 详细信息
基于NCII遗传交配设计的籼稻抽穗期全基因组关联分析
徐凯, 郑兴飞, 张红燕, 胡中立, 宁子岚, 李兰芝
作物学报    2023, 49 (1): 86-96.   DOI: 10.3724/SP.J.1006.2023.12079
摘要   (690 HTML28 PDF(pc) (5448KB)(232)  

抽穗期受光温资源和基因网络的共同调控, 影响作物产量和品种的地域适应性, 通过关联分析鉴定与抽穗期性状相关的显著位点和基因, 对解析抽穗期的遗传基础具有重要意义。本研究按照双因素交叉式遗传设计(North Carolina design II, NCII)将115份籼稻品种作为父本, 5份不育系作为母本, 进行测交, 得到了575个F1代的测交群体。对亲本和F1代抽穗期的表型值、亲本品种群体的一般配合力、F1代群体的特殊配合力和超亲优势值进行全基因组关联分析, (1) 共定位到104个关联位点, 分布在12条染色体上。其中, 第4条染色体上检测到的显著位点最多, 为16个。在亲本的抽穗期表型、一般配合力、F1代的抽穗期表型、特殊配合力、超亲优势值5个数据集中分别检测到6、5、15、57和21个。对这5个数据集中的显著关联位点进行表型变异分析, 发现在亲本抽穗期表型、一般配合力、F1代抽穗期表型、特殊配合力和超亲优势值这5个数据集中的显著关联位点对表型变异的总贡献率(phenotypic variation explained, PVE)分别为79.57%、10.51%、33.35%、56.42%和54.86%。其中, 25个位点在多个数据集中被检测到, 可能为抽穗期相关的热点区域。(2) 通过关联分析得到的显著位点与日本晴参考基因组注释信息比对, 共检测到5个已克隆抽穗期基因, 其中3个基因与显著关联位点的基因组距离小于200 kb, 对这3个基因中的单倍型组合与单个基因的优异单倍型进行比较发现, 亲本品种群体中单倍型组合SDG724 (Hap.A)_Hd17 (Hap. E)_Ghd7 (Hap. A)的对应的水稻单株籽粒产量较高, 抽穗期较长, 该组合中各基因的单倍型对应于单个克隆基因的优异单倍型, 表明优异单倍型的聚合的常规稻, 具有更高的产量和更长的抽穗期。测交子代未见此情形, 测交子代群体中SDG724 (Hap. I)_Hd17 (Hap. K)_Ghd7 (Hap. I)的单倍型组合形式的水稻有适中的抽穗期和较高的产量, 说明测交子代的抽穗期遗传机制较父本(常规水稻品种)复杂。全基因组关联分析和单倍型分析相结合, 能利用到多个SNP提供的连锁不平衡信息, 提高了基因检测效率, 对培育高产的水稻品种具有重要的指导意义。


数据集
Data set
基因
Gene name
优异单倍型
Superior haplotype
抽穗期
Heading days (d)
产量
Yield (g)
V SDG724 Hap. A 93.07±7.06 29.68±11.05
Hd17 Hap. E 93.51±6.41 30.18±10.11
Ghd7 Hap. A 93.96±6.26 30.15±9.05
TC SDG724 Hap. I 93.00±6.68 42.73±13.54
Hd17 Hap. P 93.49±6.44 43.38±13.49
Ghd7 Hap. H 90.09±7.21 43.81±12.86
View table in article
表1 各基因中优异单倍型对应表型
正文中引用本图/表的段落

抽穗期受光温资源和基因网络的共同调控, 影响作物产量和品种的地域适应性, 通过关联分析鉴定与抽穗期性状相关的显著位点和基因, 对解析抽穗期的遗传基础具有重要意义。本研究按照双因素交叉式遗传设计(North Carolina design II, NCII)将115份籼稻品种作为父本, 5份不育系作为母本, 进行测交, 得到了575个F1代的测交群体。对亲本和F1代抽穗期的表型值、亲本品种群体的一般配合力、F1代群体的特殊配合力和超亲优势值进行全基因组关联分析, (1) 共定位到104个关联位点, 分布在12条染色体上。其中, 第4条染色体上检测到的显著位点最多, 为16个。在亲本的抽穗期表型、一般配合力、F1代的抽穗期表型、特殊配合力、超亲优势值5个数据集中分别检测到6、5、15、57和21个。对这5个数据集中的显著关联位点进行表型变异分析, 发现在亲本抽穗期表型、一般配合力、F1代抽穗期表型、特殊配合力和超亲优势值这5个数据集中的显著关联位点对表型变异的总贡献率(phenotypic variation explained, PVE)分别为79.57%、10.51%、33.35%、56.42%和54.86%。其中, 25个位点在多个数据集中被检测到, 可能为抽穗期相关的热点区域。(2) 通过关联分析得到的显著位点与日本晴参考基因组注释信息比对, 共检测到5个已克隆抽穗期基因, 其中3个基因与显著关联位点的基因组距离小于200 kb, 对这3个基因中的单倍型组合与单个基因的优异单倍型进行比较发现, 亲本品种群体中单倍型组合SDG724 (Hap.A)_Hd17 (Hap. E)_Ghd7 (Hap. A)的对应的水稻单株籽粒产量较高, 抽穗期较长, 该组合中各基因的单倍型对应于单个克隆基因的优异单倍型, 表明优异单倍型的聚合的常规稻, 具有更高的产量和更长的抽穗期。测交子代未见此情形, 测交子代群体中SDG724 (Hap. I)_Hd17 (Hap. K)_Ghd7 (Hap. I)的单倍型组合形式的水稻有适中的抽穗期和较高的产量, 说明测交子代的抽穗期遗传机制较父本(常规水稻品种)复杂。全基因组关联分析和单倍型分析相结合, 能利用到多个SNP提供的连锁不平衡信息, 提高了基因检测效率, 对培育高产的水稻品种具有重要的指导意义。

抽穗期决定生殖周期的开始, 受环境条件的影响很大, 主要由光敏性、温度敏感性和植物生长持续时间决定。迄今为止, 文献中已针对该性状报道了数百个QTL (http://archive.gramene.org/qtl/)。例如, 已经确定了几种在长日照条件下控制开花的上游调控因子。其中, Nemoto等[2]发现, Ghd7Ehd1中的顺式调节区结合, 并且仅在非诱导性长日照条件下才抑制其表达。同时, Ghd7在控制水稻的产量、株高和抽穗期中起着至关重要的作用。在长日照条件下, Ghd7的增强表达会推迟抽穗并增加株高和穗的大小, 而功能减弱的自然突变体可使水稻在温带甚至更冷的地区种植。水稻作为植物遗传研究的模式植物与拟南芥具有许多同源基因。例如, Hd1是拟南芥中CONSTANS的直系同源基因, 在短日照下可促进抽穗期开花, 在长日照下可抑制Hd3a的表达从而延缓抽穗[3-4]。Hd3aRFT1是拟南芥中FT (flowering locust)的同源基因, 作为成花素基因促进抽穗和开花[5]。Hd3a在短日照条件下促进抽穗, 而RFT1在长日照条件下充当开花活化因子以诱导水稻抽穗[6]。Hd17是拟南芥早花基因Ef3的一个同源基因[7]。Hd17能降低Ghd7的表达, 上调Ehd1的表达, 同时通过下调OsGI表达来降低Hd1的表达, 因而能在长日照条件下诱导水稻抽穗开花[8?-10]。
水稻试验材料120份, 包含115份籼稻品种, 4个两系不育系和1个三系不育系(详见附表1)。根据NCII遗传交配设计, 于2012年在湖北鄂州将115份籼稻品种作为父本, 5份不育系作为母本, 进行杂交, 获得575份F1代杂交种。并于2013年5月将120份亲本和575份F1杂交子代种植在湖北省农业科学院水稻基地, 每行种植10株, 种植密度16.7 cm × 26.7 cm, 田间试验按随机区组设计, 依照常规大田生产的基本方法进行。
水稻抽穗期天数定义为: 自播种后, 小区中超过50%株系的花序首次出现在旗叶鞘上方的天数减去播种日期即为该株系的抽穗期(heading date, HD)。我们将数据集分成5类: V、GCA、TC、SCA和BPH (better parent heterosis)[17]。其中, V代表亲本抽穗期的表型值; GCA代表一般配合力, 计算公式为$\mathrm{GCA}_{i}=\bar{y}_{..}-\bar{y}_{..}, \bar{y}_{i.} $表示亲本i产生的所有F1代的表型平均值, $ \bar{y}_{..}$表示所有F1代的表型平均值; TC代表F1代测交群体抽穗期的表型值; SCA代表特殊配合力, 计算公式为$\mathrm{SCA}_{i j}=y_{i j}-E(y_{i j}) $, SCAij为亲本i与亲本j的特殊配合力效应, yij为亲本i与亲本j杂交组合的均值, E(yij)为该组合的期望值, 具体计算公式为$E\left(y_{i j}\right)=\bar{y}_{..}+\mathrm{GCA}_{i}+\mathrm{GCA}_{j} $; BPH代表F1代的超亲优势值, 计算公式为$\mathrm{BPH}_{i j}=y_{i j}-V_{i} $, Vi表示第i个父本的表型值。同时, 检测亲本和测交子代中各株系的单株产量(grain yield per plant, YD)。
接着, 用IMPUTE[21]软件对SNP的缺失位点进行填补。亲本群体中基因分型数据分析结果表明, 绝大部分位点均是纯合状态(即AA、TT、CC、GG), 为了减少子代测序所耗费的时间和成本, 再根据亲本SNP基因型推算出测交群体F1代的SNP基因型, 最后将所有的SNP信息转换成Hapmap格式, 以便用于后续的GWAS分析。
对GWAS结果中检测到的显著关联位点附近200 kb的已克隆基因, 利用高质量的基因分型数据对克隆基因编码区序列上的SNP位点构建单倍型分析, 并比较V与其TC中不同单倍型对应品种的抽穗期表型和产量的均值差异。SNP在基因中的距离通过NCBI提供的BLAST序列比对工具确定。为防止表型中个别极值干扰单倍型分析结果的可靠程度, 选择单倍型对应的亲本水稻品种和F1代杂交稻株系数量所占比例超过对应群体数量的3.5%为有效株系。具体而言, 在115份亲本品种群体中, 单倍型对应株系数量超过5份; 575份F1杂交稻群体中, 单倍型对应株系数量超过20份, 则认为其单倍型对应水稻抽穗期和产量的表型值有效。忽略克隆基因中对应水稻品种或株系数量少于选择标准的单倍型。
对抽穗期V和TC数据作表型分析, 从图1中可以看出, 水稻抽穗期在V和TC之间近乎相同, 大都分布在80~100 d之间, 变异幅度为20 d; 我们按照箱线图中异常值的计算方式, 判断出水稻抽穗期的异常值为抽穗期天数小于70 d或大于114 d。对这些异常值结合抽穗期的表型与对应品种的单株籽粒产量进行比对校验及通过一些文献查询核实, 筛选掉异常值后进行后续分析, 以保证结果有较高的可靠性。
通过检查显著关联位点是否位于基因上下游各200 kb区域作为候选基因的选择标准, 最终在V、GCA、TC、SCA和BPH中分别定位到26、16、60、228和84个候选基因, 这些基因均为已克隆基因。其中, 在V中定位到的克隆基因SDG724, 据文献报道, 该基因通过调控MADS50RFT1位点的H3K36me2/3甲基化水平, 影响“MADS50/MADS51- Ehd1-Hd3a/RFT1”途径, 促进水稻开花[30]。在SCA中定位到2个克隆基因Hd17Ghd7, 它们都是水稻光周期开花途径中的1个组成部分。值得注意的是, 在GCA和BPH数据集中, 同时在1号染色体上的1个显著关联位点中的SNP位点Chr.1_33603983, 该位点附近200 kb鉴定到了3个克隆基因(LC1、OsPME1OsERF3)。其中, LC1编码1个生长素氨基合成酶OsGH3-1, 在水稻各组织中均有表达, 作用是催化过量的IAA与多种氨基酸结合来维持生长素的体内平衡。通过调控生长素的体内平衡, LC1改变叶夹角处的细胞伸长来调控叶夹角[31]。OsPME1仅在花粉发育后期表达, mRNA水平在甘露醇处理后上调, 在热、冷、干旱、水淹和水杨酸处理后下调, 盐处理没有影响; mRNA水平在镉和锌处理下调, 汞和铜处理则没有变化; 不同浓度生长素处理后表达上调, GA3处理后下调, 100 μmol L-1高浓度的脱落酸处理后表达上调[32]。ERF3调控冠状根发育, 在生长素和细胞分裂素应答基因的表达中发挥作用。ERF3能直接与细胞分裂素应答基因RR2结合, 正向调控RR2表达, 控制冠状根的起始; 而在冠状根伸长过程中, ERF3WOX11互作, 可能抑制RR2[33]。
根据基因SDG724编码区序列中的SNP位点, 构建单倍型。在V和TC中分别找到了8种和9种单倍型(表1、附表4和附表5)。抽穗期为Ghd7基因编码区序列中的SNP位点构建单倍型, 分别在V和TC中检测到3种、6种单倍型(表1和附表6)。Hd17编码区序列中的SNP位点构建单倍型, 在V和TC中分别找到了6种和11种单倍型(表1和附表7)。亲本中, 这3个基因对应单倍型株系大于5的最优单倍型, 产量均值约为30 g, 抽穗期约为93 d。我们发现, SDG724、Ghd7Hd17基因亲本单倍型对应的测交子代抽穗期与母本差异小(均值差异小于1 d), 但产量显著高于父本。
由表2可知, 在亲本品种群体中, 不同基因中单倍型的组合对应水稻抽穗期和产量的表型分布范围分别为86.71~94. 3 d和22.52~32.15 g。其中, SDG724 (Hap.A)_Hd17 (Hap.E)_Ghd7 (Hap.A)的单倍型组合对应的水稻单株籽粒产量可达31.97 g, 抽穗期为94.3 d, 该组合中各基因的单倍型(表2)对应于单个克隆基因的的优异单倍型(表1)。结果表明优异单倍型的聚合的亲本具有更高的产量和更长的抽穗期。
GWAS能够有效挖掘和检测水稻品种在不同环境中同一性状的表现差异背后的遗传因素。本文以亲本品种群体和F1代575份籼稻杂交群体为材料, 利用Blink模型分别对V、GCA、TC、SCA和BPH 5个数据集进行GWAS分析, 共定位到104个显著与性状关联位点, 并通过关联分析得到的显著关联位点与日本晴参考基因组注释信息比对筛选得到3个已克隆基因。这些定位的显著位点与已克隆基因将为解析水稻抽穗期的遗传基础提供一定的参考信息。本研究中的25个显著位点在多个(2~3个)数据集中被定位到, 显著位点间的基因组距离小于200 kb, 其中, TC和SCA中分别检测到1个显著位点位于Ghd7附近, BPH、SCA和TC中分别检测到1个位点位于Ghd2/DTH2附近, 这些位点一方面证明了本研究中GWAS结果的准确性, 另一方面这些位点可能为影响抽穗期的热点区域, 在抽穗期的分子选择育种中应提高关注。
附表和附图 请见网络版: 1) 本刊网站 http://zwxb.chinacrops.org/; 2) 中国知网 http://www.cnki.net/; 3) 万方数据 http://c.wanfangdata.com.cn/Periodical-zuowxb.aspx
本文的其它图/表