陆地棉的遗传基础狭窄, 阻碍了棉花的遗传改良进程。为有效拓宽陆地棉的遗传基础, 本试验利用野生种黄褐棉(AD4)为供体亲本, 以综合性状优良的B0011品系为受体亲本(国审棉华杂棉H318的亲本之一), 构建了含71个株系的导入系BC5S5群体。基于SLAF-seq的基因分型和多年多点田间试验的综合分析表明, 该导入系在产量和纤维性状方面具有很大的变异, 共检测到48个QTL, 其中包含19个产量和29个纤维构成因素相关的QTL。在At亚组检测到9个性状的32个QTL, 在Dt亚组为16个。进一步对QTL加性效应方向分析显示, 其中有30个QTL的加性效应为正, 18个QTL的加性效应为负。本研究结果为利用黄褐棉重要农艺性状有利等位基因改良陆地棉产量和品质奠定了基础。
The genetic basis of upland cotton is narrow, which hinders the progress of genetic improvement of cotton. To effectively broaden the genetic basis of upland cotton, we developed BC5S5chromosome segment substitution lines (CSSLs) population consisting of 71 CSSLs, which was derived from the Gossypium mustelinum, the wild cotton (AD4) as the donor, and B0011, one parent of national authorized cotton variety Huazamian H318 with good comprehensive characters of upland cotton line (AD1) as the receptor. A comprehensive analysis was conducted via the SLAF-seq genotyping and phenotyping under multiple environments. This population showed a wide range of variation in yield components and fiber quality, and a total of 48 QTLs were detected including 19 for yield components and 29 for fiber quality. Among the QTLs for nine traits, 32 and 16 were on the At and Dt sub-genomes, respectively. Further analysis revealed that 30 QTLs showed positive additive effects, and 18 QTLs showed negative additive effects. The results of this study lay a foundation for the genetic improvement of upland cotton using the elite alleles of important agronomic traits from G. mustelinum.
异源四倍体棉花有5个种, 栽培种主要有陆地棉和海岛棉, 其余3个为野生种[1], 其中陆地棉的产量占世界棉花产量的95%以上[2]。然而, 陆地棉的遗传多样性低, 且遗传基础狭窄, 这成为陆地棉改良的主要限制因素[3]。因此, 利用野生棉资源对拓宽陆地棉的遗传多样性具有重要的潜在育种价值。
棉花的产量和纤维品质性状是复杂的数量性状, 受多基因控制[4]。它们的表型受基因与环境共同调控, 且它们之间往往存在显著负相关[5]。通常, QTL定位是基于F2/F2:3、BC1、DH、RIL等分离群体[6, 7]; 然而, 这些群体的遗传背景比较复杂, 加之数量性状本身的复杂性, 且QTL定位还易受非目标QTL的干扰, 严重制约了对目标性状的精细解析。导入系是QTL精细定位和复杂农艺性状解析的理想材料, 能克服种间杂交分离群体对基因渐渗的影响。导入系是通过杂交、回交、分子标记辅助选择等方法构建的能够覆盖整个作物基因组的一系列近等基因系, 其整个遗传背景只含有供体亲本的一个或几个染色体片段, 其它部分则与轮回亲本完全相同, 能够消除遗传背景的噪音, 预测到那些在F2或者RIL等初级群体中被掩盖的QTL[8]。目前, 在不同的作物中都已经进行了深入的研究, 例如番茄[9]、玉米[10]、水稻[11, 12]、大豆[13]、大麦[14]、油菜[6, 15]、棉花[4, 16, 17, 18, 19, 20, 21]等。
目前, 棉花导入系的构建主要利用海岛棉和陆地棉的种间杂交[4, 16, 17, 18, 19, 20, 21]。Wang等[16]构建了以陆地棉标准系TM-1为背景的海岛棉海7124的导入系。朱亚娟等[17]利用陆地棉标准系TM-1为背景的海岛棉海7124的导入系的2个家系IL-15-5和IL-15-5-1构建了F2和F2:3分离群体, 定位了衣分和籽指等与产量相关的QTL。王鹏等[18]同样利用陆地棉标准系TM-1为背景的海岛棉海7124的导入系检测到与光合色素相关的QTL, 解析了光合色素含量的遗传基础。付央等[19]用陆地棉标准系TM-1为背景的海岛棉3-79的家系Sub18为供体亲本, 以TM-1为受体亲本, 培育了海岛棉3-79第18染色体片段导入系, 并利用这个特定的染色体片段导入系检测了12个产量与纤维品质性状相关的QTLs。最近, 王云鹏等[4]创制了以陆地棉中棉所8号为背景的海岛棉Piam 90-53的导入系。黎波涛等[20]以早熟陆地棉中棉所36为受体亲本, 海岛棉海1为供体亲本构建导入系群体, 筛选82个株系, 采用株系间随机成对杂交组配F1, 并在多个环境下分析发现, 导入系及F1的变异丰富, 部分亲本与 F1的皮棉产量与纤维品质在多个环境下得到同步提高。Si等[21]构建了一个以海岛棉Xinhai 25为背景, 导入陆地棉TM-1片段的导入系群体, 为我们提供了新的参考。
然而, 除海岛棉外, 利用棉花其他的野生资源相对较少。黄褐棉在3个异源四倍体野生棉中, 其亲缘关系距离陆地棉最远[1], 因此, 最有可能存在新的有利基因位点用于陆地棉的改良。肖松华等[22]研究显示, 黄褐棉渐渗陆地棉株系不仅对棉花黄萎病达到抗性水平, 而且在棉花纤维品质方面也存在着丰富的遗传变异。汪保华等[23]研究表明, 3个黄褐棉与陆地棉构建的近等基因系的纤维强度与细度表现十分突出。
为利用野生棉种质资源拓宽陆地棉遗传多样性, 本研究以综合性状优良的B0011品系为受体亲本, 以野生种黄褐棉为供体亲本, 构建以陆地棉为背景, 含有黄褐棉不同片段长度的导入系群体, 进行棉花产量和纤维品质相关性状的QTL定位, 希望通过黄褐棉与陆地棉之间的基因渐渗转移, 拓宽陆地棉的遗传基础, 为以后的棉花品种遗传改良奠定基础。
轮回亲本B0011是华中农业大学选育的常规棉花品系, 其综合性状好, 是华杂棉H318的亲本之一[24]。供体亲本黄褐棉, 具有纤维品质优良, 抗黄萎病和抗虫等特性[22, 25]。以B0011为母本与G. mustelinum杂交产生F1, 以B0011为轮回亲本回交5次, 通过单籽传法, 获得71个BC5株系; 用获得的株系通过单籽传法连续自交5代, 最后得到含有71个株系的BC5S5导入系群体。
选取幼嫩的叶片, 用液氮速冻, 存于-70℃冰箱备用。然后, 用Plant Genomic DNA Kit (TIANGEN Biotech, Beijing, China)试剂盒提取基因组DNA, 并用NanoDrop 2000C Spectrophotometer (Thermo Scientific, USA)和琼脂糖凝胶电泳检测, 以保证满足建库要求。之后, 进行SLAF-seq的建库、测序、标签分析以及SNP鉴定[26, 27]。亲本测序深度20× 以上, 子代测序深度5× 以上。
2015年在湖北省黄冈市(E1)和荆州市(E2)及2016年在湖北省荆州市(E3)和鄂州市(被洪水毁坏)种植71个导入系家系。种植地点分别为湖北省黄冈市农业科学院试验田和长江大学试验田。每年每点2次重复, 并且按照随机区组种植。单行小区每行长5.0 m, 宽0.8 m, 种植10株。人工摘取每个家系中部20朵棉花进行产量和纤维品质的考种[28]。产量性状包括单铃籽棉重(SCW)、单铃皮棉重(LW)、衣分(LP); 纤维品质性状包括: 纤维长度(FL)、整齐度(FU)、马克隆值(MIC)、伸长率(FE)、比强度(FS)、短纤维率(SF)。
用SPSS 17.0 (SPSS, Chicago, Illinois, America)软件分析群体平均数等特征数据。基于一个线性模型[29], 用最佳无偏向性预测(The best linear unbiased prediction, BLUP, http://www.eXtension.org/pages/61006)评估每个株系在这3个环境中的表型值。以Wang等[30]的遗传图谱为参照, 将标记序列用BLASTN的方法比对到参考基因组[31], 阈值为E≤ 1e-5, 选取最佳匹配且与遗传图谱顺序一致的标记。之后, 将在2个标记之间大于等于3个SNP的片段定义为导入片段, 并分析其在各染色体及基因组的分布情况。
由于本研究群体是非标准单片段导入系, 故不能用以往的t检验来定位QTL。然而, Wang等[32, 33]提出了一种可以检测多片段导入系QTL方法。它是基于逐步回归的极大似然估计算法(RSTEP-LRT), 采用逐步回归分析选择对目标性状最重要的片段或标记, 然后通过似然比检验来计算每个染色体片段或标记的LOD值。对于理想的导入系而言, 它在统计学上与标准的t检验是等效的。利用QTL IciMapping 4.1 (http://www.isbreeding.net/)软件[32]检测产量和纤维品质相关的加性效应QTL。根据QTL IciMapping 4.1[33]软件, 对SNP进行基因分型, 将与受体亲本B0011相同的基因型记为“ 0” , 与供体亲本黄褐棉相同的基因型记为“ 2” , 进行QTL定位。以LOD≥ 3为阈值判断其是否存在加性效应的QTL。参照McCouch等[34]的规则命名QTL。参考Wang等[35]的染色体示意图(着丝粒区域)。
根据偏度绝对值小于1, 认为该性状群体符合正态分布。从表1可知, 除了SCW和LW在E1, LW和LP在E2, FU在E3外, 其他所有性状均呈现连续分布, 群体符合正态分布, 并且, 各性状在不同的环境中均表现出差异。由图1可知, 产量和纤维性状在多个环境中的BLUP值均表现为相对连续的正态分布, 并且分离变异较大。
方差分析(表2)表明, 除纤维整齐度(FU)与短纤维率(SF)的基因× 环境的互作效应没有达到显著水平外, 其他性状都受到基因型、环境效应以及基因× 环境的互作效应的强烈影响, 其F值都达到了极显著水平, 对性状的影响为环境效应> 基因型> 基因× 环境的互作效应, 显示性状的差异主要是由不同年份和不同种植环境造成的。
从图2可知, 单铃籽棉与单铃皮棉呈正相关。单铃皮棉与衣分、马克隆值、伸长率呈正相关, 与纤维长度、比强度呈负相关。衣分与马克隆值、伸长率呈正相关, 与纤维长度、比强度呈负相关。马克隆值与比强度呈正相关; 与纤维长度呈负相关。纤维长度与纤维整齐度、比强度呈正相关, 与短纤维率、伸长率呈负相关。纤维整齐度与比强度呈正相关, 与短纤维率呈负相关。纤维比强度与短纤维率呈负相关。
通过SLAF-seq测序, 在BH导入系群体中总共发现了2839个SNP, 不均匀地分布在各个染色体上, 染色体A13上含有的SNP最多, 为393个, 而染色体D03最少, 仅有19个(图3)。对于各株系而言, 也呈现不均匀分布, 其中BH2系含有的SNP最多, 为646个; 而BH65系仅有96个(图4)。对BH群体的71个株系的基因型分型发现, 在At亚组的A02、A06、A09、A12和A13染色体上及Dt亚组的D04、D06、D12和D13染色体上, 不同的家系间存在相同的导入片段, 尤其在A13和D06染色体最多(图5)。
通过将测序的SNP标记与遗传图谱比较分析, 发现在本群体中导入片段的总长度为2030.0 cM, 其中A亚组和D亚组分别为1093.7 cM和936.5 cM, 导入片段所占的比率分别是40.0%和32.7%。A11染色体的导入片段的长度最短, 为31.6 cM, 而A06染色体的导入片段长度最长, 为137.8 cM。导入片段在基因组的覆盖率从A11的11.9%到A13的99.9%。其中在A02、A06、A10、A12、A13、D07和D10染色体上的导入片段覆盖率大于50%, 而A11, D05和D09染色体的导入片段覆盖率小于20%, 整个基因组的导入片段的平均覆盖率为36.3% (表3)。
用QTL IciMapping 4.1软件总共检测到48个QTL, 分布在除A04、A11、D01、D06和D13以外的21条染色体上, 在A08染色体上检测到的QTL最多, 均为6个; 其次是在A05、A09、D05为5个, 而在A03、A06、D02、D03、D04、D07、D08、D09、D11和D12染色体上检测到的QTL最少, 均为1个, 这其中包含19个与产量和29个与纤维品质相关的QTL (表4、表5和图6)。没有检测到纤维长度(FL) QTL。在A05染色体上的22.06 Mb位点同时检测到分别与单铃籽棉(qSCW-A05-1-E2)和单铃皮棉(qLW-A05-1-E2)相关的2个QTL, 在35.08 Mb位点也同时检测到分别与单铃籽棉(qSCW-A05-2-E2)和单铃皮棉(qLW-A05-2-E2)相关的2个QTL (图6-A)。
2.4.1 产量相关性状QTL 对单铃籽棉重(SCW)来说, 共检测到3个QTL, 分布在2条染色体上(A01, A05), 解释表型变异11.70%~31.00%, LOD值为3.06~5.63, 加性效应值为-0.46~1.45 (表4、图6-A和图7-A); 而对单铃皮棉重(LW), 检测到4个位点, 主要分布在3条染色体上(A05、A09和D06), 解释表型变异13.85%~29.10%, LOD值为3.21~5.00, 加性效应值为-0.30~0.53 (表4、图6-A和图7-A); 对衣分(LP), 则检测到12个QTL, 主要分布在10条染色体上(A01、A05、A06、A08、A09、A10、A13、D03、D04和D06), 解释表型变异6.70%~28.04%, LOD值为3.05~7.66, 加性效应值为-3.33~3.29 (表4、图6-A和图7-A)。
2.4.2 纤维品质相关性状QTL 检测到5个纤维整齐度(FU) QTL, 分布在4条染色体上(A08、A09、A12、D02), 解释表型变异7.20%~27.46%, LOD值4.34~12.30, 加性效应值为-0.33~1.19 (表5、图6和图7-B)。检测到3个马克隆值(MIC) QTL, 分布在3条染色体上(A08、A10、D06), 解释表型变异14.57%~20.18%, LOD值3.22~4.61, 加性效应值为0.26~0.35 (表5、图6和图7-B)。检测到2个纤维伸长率(FE) QTL, 分布在2条染色体上(A10、A13), 解释表型变异13.93%~19.84%, LOD值3.43~4.68, 加性效应值为-0.84~ -0.51 (表5、图6-A和图7-B)。检测到14个纤维比强度(FS) QTL, 分布在11条染色体上(A02、A03、A07、A09、A13、D06、D07、D09、D10、D11和D12), 解释表型变异3.76%~21.65%, LOD值3.14~10.82, 加性效应值为-3.48~4.23 (表5、图6和图7-B)。检测到5个短纤维率(SF) QTL, 分布在4条染色体上(A07、A08、A12、D08), 解释表型变异13.70%~22.33%, LOD值3.12~4.78, 加性效应值为-0.66~2.90 (表5、图6和图7-B)。
关于棉花农艺性状、品质性状、抗性性状的QTL定位已经有许多研究, 但是, 在育种中很少能够被用来进行品种的遗传改良。一个重要的原因是几乎所有的QTL都是在早期的分离群体被检测到, 使有利QTL的导入变得复杂[6]。而导入系则为QTL定位提供了一个很好的平台。目前, 在棉花中已经构建了一些导入系群体被用于QTL分析[4, 16, 17, 18, 19, 20, 21]。然而, 这些研究都是基于海岛棉和陆地棉构建导入系群体。对于野生棉, 尤其是黄褐棉的研究利用的报道较少。
黄褐棉原产于巴西, 在5个四倍体棉种中亲缘关系距陆地棉最远, 且具有纤维品质优良, 综合抗性好等特点[1, 22, 25], 因此, 引入黄褐棉优质的抗病基因将会对陆地棉的遗传改良产生极为重要的现实意义。这将会有助于提高陆地棉纤维品质及黄萎病的抗性, 从而提高陆地棉的产量及其综合特性。
通过对导入系BH群体进行SLAF-seq[26], 并过滤掉不在染色体上的SNP, 得到2839个SNPs, 发现SNPs在染色体和家系间均呈现不均匀的分布。通过对BH群体导入片段分析可以看出, 在A13和D06染色体上不同家系间大都导入了相同的片段, 这可能与其对环境的综合适应能力有关。此外, 在分析BC5家系的供体亲本基因型占全基因组的比例中发现, 最大的为3.47%, 最小的为0, 平均为0.51%, 明显低于理论比例值3.13%。与王鹏等[36]的研究相比略低, 可能是我们以遗传图谱为参照时仅选取最佳匹配且与遗传图谱顺序一致的标记, 致使图谱上标记数目减少, 而SNP再与这些最佳的标记相比即导致渗入比率偏低。
本研究对黄褐棉和陆地棉染色体片段导入系群体的3个产量和6个纤维品质性状进行了遗传分析。通过对各性状多个环境的BLUP值分析来看, 各性状均为相对连续的正态分布, 且分离变异程度较大。进一步通过对各性状多个环境的方差分析发现, 除了纤维整齐度和短纤维率没有显著地受到基因型与环境互作影响外, 其他所有性状都受到基因型, 环境, 基因型与环境互作三者极显著的影响。环境的影响效应大于环境与基因型的互作, 说明环境的差异是导致表型变异的主要来源, 也进一步说明环境效应在QTL定位中起着极其重要的作用。通过QTL定位我们发现, 在相同位点检测到与不同性状相关的QTL, 这可能是导致QTL聚集与连锁累赘的原因[28]。
已有研究显示[5, 7, 37, 38], 相对于At亚组, QTL多在Dt亚组富集。然而, 通过对本研究检测到的QTL分析发现, 与产量性状相关的QTL, 在At亚组分布的数目比Dt亚组上多, 在At亚组上A05染色体上QTL数目较多, 在Dt亚组上D06染色体上的QTL数目最多; 而与纤维性状相关的QTL, 在At亚组上分布的数量多于Dt亚组, 在At亚组上A08染色体上QTL数目较多, 在Dt亚组上D10染色体上的QTL数目较多。最近, Si等[20]对海岛棉为背景导入系定位的39个QTL分析发现, 在At亚组上比Dt亚组具有更多QTL。说明不同的群体, 不同的标记方法, 不同的背景可能导致QTL在2个亚组间的分布不同。通过分别与Si等[20]和Wang等[30]的定位的QTL比较发现, 在A10染色体都定位到关于纤维伸长率的QTL, 然而其物理位置不同。Si等[20]定位的QTL为qFS-A10-1 (NAU5323, 97.86 Mb), Wang等[30]定位的QTL为qELO-10-1 (JESPR6-BNL1161, 67.02~75.68 Mb), 我们定位的QTL为qFE-A10 (88.40 Mb), 说明A10染色体这段区间对纤维的伸长率有很大的贡献。而在A09上qLW-A09 (20.12 Mb)和qLP-A09 (19.69 Mb)与Zhang等[39]定位铃重, 衣分相关QTL的位置(Gh27, 20.23 Mb)很近。对QTL加性效应方向分析发现, 在产量性状方面, 有11个QTL的加性效应方向为正, 有8个QTL的加性效应方向为负; 在纤维性状方面, 有19个QTL的加性效应方向为正, 有10个QTL的加性效应方向为负, 这表明, 黄褐棉不同的导入片段产生的效应不同。进一步利用“ CSIL+F2” 方法, 将更容易精细定位和克隆[17, 40]这些含有具体性状特征的QTL。
构建了含有71家系的以陆地棉为背景的黄褐棉染色体片段导入系群体, 克服了黄褐棉与陆地棉种间杂交不育, 连锁累赘等问题, 实现了将黄褐棉的优异基因引入到陆地棉的育种目标。本研究定位的产量和纤维性状相关的48个QTL将为棉花的育种提供重要的基础材料。
The authors have declared that no competing interests exist.
作者已声明无竞争性利益关系。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
|