开发
开发
第一作者联系方式: E-mail: qiaoly1988@126.com
NBS (nucleotide binding site)类基因是植物界中最重要的一类抗病基因。用信息学方法从普通小麦( Triticum aestivum L.)全基因组中分离出2406条含有NBS结构的完整蛋白序列, 每条包含48~2272个氨基酸残基。根据NBS结构域两端是否连接CC或LRR结构域, 将TaNBS分为N、CN、NL和CNL 4类。对TaNBS所在scaffold序列的SSR位点进行诊断, 从1203条scaffold序列上发现2177个SSR位点, 以二碱基重复位点最多, 占73.5%。针对小麦2AL染色体上的51个SSR位点开发标记, 缺体-四体和双端体验证结果表明, 有39个标记(76.5%)为2AL特异标记, 其中24个特异标记在抗白粉病材料Khapli (2AL上携带 Pm4a)和感病材料Chancellor间存在多态性。利用近等基因系Khapli/8*Cc筛选出3个可能与 Pm4a连锁的NBS-SSR标记, 分别是Sxaas_2AL22、Sxaas_2AL39和Sxaas_2AL46。本研究开发的与抗病序列紧密连锁的特异SSR标记可用于2AL染色体上抗病新基因的检测以及已有抗病基因的候选序列筛选。
Nucleotide binding site (NBS)-encoding genes are the most important resistance genes ( R genes) in plant kingdom. In this study, 2406 full-length NBS protein sequences, of which single protein varies from 48 aa to 2272 aa, were identified from wheat ( Triticum aestivum L.) genome using bioinformatic method. These TaNBSs were divided into four categories, including N, CN, NL, and CNL, according to whether the NBS domains connect CC or LRR domains at both ends. Diagnosis results showed that 1203 of all the scaffolds with TaNBS contained 2177 simple sequence repeats (SSR) loci, 73.5% of which were dinucleotide repeat sites. Based on the NBS-SSR loci on chromosome 2AL in wheat, we developed 51 molecular markers, and 39 of them (76.5%) were confirmed as chromosome specific markers using Chinese Spring nulli-tetrasomic and ditelosomic lines. Furthermore, 24 2AL-specific NBS-SSR markers showed polymorphism between resistant material Khapli carried Pm4a on chromosome 2AL and susceptible material Chancellor. Finally, three 2AL-specific NBS-SSR markers, Sxaas_2AL22, Sxaas_2AL39, and Sxaas_2AL46, were probably linked to Pm4a gene based on genetic linkage test using Pm4a-NILs (Khapli/8*Cc). These chromosome specific 2AL-NBS-SSR markers can be used to locate novel R genes or screen the candidate sequences for known R genes on chromosome 2AL.
小麦是世界的主要口粮作物之一, 是世界第二大粮食作物。近40年来, 由于白粉病、锈病等病害的大面积流行, 小麦生产不断遭到严重威胁。以白粉病为例, 由于小麦种植密度加大、水肥条件改善和品种抗源单一等原因, 小麦白粉病从我国西南和东南沿海局部地区迅速蔓延至全国所有麦区, 发病面积从1980年的100万公顷扩展到2015年的570万公顷(http://cb.natesc.gov.cn/)。1990年和1991年全国白粉病大爆发分别造成当年1.44亿千克和0.77亿千克小麦产量的损失[1]。抗病品种是有效控制小麦主要病害的最经济和有效的方法[2], 也是小麦育种的重要目标。但是, 随着病原菌的变异和新类型不断产生, 原有抗病品种逐渐丧失抗性, 使小麦生产面临新的挑战。因此, 广泛挖掘抗病基因是一项持续而紧迫的工作, 是选育小麦抗病品种的重要前提。
分子标记选择技术极大地促进了抗病基因的鉴定, 尤其是简单重复序列(SSR)标记, 因其大量分布于基因岛和重组热点区域, 且变异常与临近基因的交换重组密切相关[3], 从而被广泛应用于小麦抗病基因的定位。目前, 正式命名并定位到小麦分子图谱上的抗病基因包括54个抗白粉病基因、74个抗条锈病基因、73个抗叶锈病基因和57个抗秆锈病基因, 其中有13个基因被成功克隆[4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]。在已克隆基因中, Pm3b[4]、Pm3c[5]、Pm3f[6]、Pm3g[5]、Yr10[7]、Lr1[8]、Lr10[9]、Lr21[10]、Sr33[11]、Sr35[12]10个基因均为NBS类抗病基因。NBS基因是植物界最重要、家族成员最多的一类抗病基因, 其编码的NBS结构域包含Kinase1、Kinase2、Kinase3、HD残基等保守基序[15], 可通过结合ATP或GTP来直接或间接引导宿主细胞产生识别病原体效应, 并参与抗病信号的传导过程[16]。在单子叶植物中, 一些NBS结构域的N端有时连接有一个与蛋白互作有关的CC (coiled-coil)结构, 而C端通常连接有一个与病原菌识别相关的LRR (leucine-rich repeat)结构域[17]。
史静东等[18]曾利用巢式PCR技术获得4个小麦NBS类抗病基因片段, 并通过群体检测, 证实其中一个片段与Yr26共分离。随着小麦测序草图的公布, 在全基因组范围内对小麦NBS基因家族的研究成为可能。Bouktila等[19]利用普通小麦品种中国春的454测序数据[20], 分离了包含NBS结构的小麦序列, 然而这些序列在染色体上的具体位置尚不得知。本研究利用基于染色体臂分离测序技术的小麦基因组数据[21], 从全基因组范围内分离了小麦NBS序列, 诊断了序列邻近的SSR位点, 并在2AL染色体上针对NBS-SSR位点开发分子标记, 筛选出染色体臂特异标记, 同时利用小麦抗、感材料, 对新开发的标记进行了多态性分析和抗病基因连锁性检测。本研究结果丰富了小麦抗病基因的分子标记, 可用于抗病基因的标记辅助检测以及候选序列筛选。
小麦品种Khapli (2AL染色体上携带Pm4a)由中国农业科学院作物科学研究所贾继增研究员惠赠, Pm4a的近等基因系Khapli/8* Cc及其轮回亲本Chancellor (Cc)由中国农业科学院植物保护研究所周益林研究员惠赠。用于分子标记检测的中国春缺体-四体材料和双端体材料由美国农业部种质研究中心惠赠。
从URGI数据库(http://wheat-urgi.versailles.inra. fr/)下载小麦全基因组数据建立BLAST蛋白数据库和核酸数据库。从Pfam数据库(http://pfam.sanger.ac. uk/)中下载NBS家族(Pfam登录号为PF00931)的隐马尔可夫模型文件, 用HMM 3.0软件检索本地蛋白数据库得到目标氨基酸序列, 设置E≤ 1e-5。
利用SMART服务器(http://smart.embl-hei-delberg. de/)对检索结果进行NBS蛋白保守结构域的检查, 参数为默认值。筛选得到的序列递交NCBI的CDD数据库(http://www.ncbi.nlm.nih.gov/Structure/cdd), 进一步分析与NBS关联的CC、LRR等其他结构域的特征。
用DNAstar软件中的Editseq工具获得TaNBS蛋白的长度信息。用Clustal X软件进行蛋白序列多重比对, 参数为默认值, 用Jalview输出比对结果。
利用小麦NBS蛋白序列编号在本地核酸数据库中提取相应的CDS序列和基因组(scaffold)序列。将scaffold序列返回本地核酸数据库检索, 获得其在小麦基因组中的位置信息, 从而将TaNBS排列到染色体上。
利用SSRhurnter软件查找TaNBS所在scaffold序列的SSR位点。设定每重复单元碱基数为2~5, 重复次数≥ 5。利用Primer5软件对SSR位点设计引物, 由生工生物工程(上海)有限公司合成(表1)。
![]() | 表1 24对多态性的小麦2AL染色体特异标记 Table 1 Twenty-four polymorphic markers specific to wheat chromosome 2AL |
采用SDS法提取基因组总DNA。PCR总体系为15 μ L, 含1.5 μ L 10× buffer (TaKaRa)、0.2 mmol L-1 dNTP、1 U Taq酶(TaKaRa)、0.25 μ mol L-1引物和100 ng模板DNA。反应扩增程序为94℃变性5 min; 94℃变性45 s, 58℃复性45 s, 72℃延伸 1 min, 36个循环; 72℃延伸10 min。扩增产物经8%非变性聚丙烯酰胺凝胶(Acr与Bis质量比为29∶ 1)电泳, 硝酸银染色后观察照相。
利用NBS隐马模型文件在小麦本地蛋白数据库检索, 并检测检索结果, 获得2406条含有NBS结构
的完整蛋白序列, 分布于小麦基因组21条染色体上, 以B基因组比率最高(37.4%), 其次是A基因组(34.3%), 而D基因组最低(28.3%); 从单个染色体看, 在4A染色体上分布最多, 达248条, 而在4D染色体上分布最少, 仅24条(图1)。
分离出的TaNBS序列长度差异较大, 最短的序列Ta1asLoc007418只有48个氨基酸残基, 最长的为Ta7blLoc002272, 有2272个氨基酸残基。根据是否包含CC和LRR结构域, 将2406个TaNBS序列分为4类, 分别是CC-NBS-LRR、NBS-LRR、CC-NBS和NBS, 其中只具有NBS结构的TaNBS最多, 有1209条, 占总数的50.2% (图2)。
从本地核酸数据库中提取TaNBS的CDS序列和基因组(scaffold)序列, 查找所在scaffold序列的SSR位点, 在其中的1203条scaffold序列上共检测到2177个SSR位点, A、B、D基因组分别占33%、40%和27% (图3-a)。其中二碱基重复位点最多, 占73.5%; 五碱基重复位点最少, 仅0.3% (图3-b)。
将位于2AL上的56个TaNBS蛋白序列多重比对的结果显示, 一些TaNBS序列与已克隆抗白粉病基因的NBS结构域有高度相似的基序(图4), 如用于结合ATP/GTP的磷酸结合环P-loop (GGV/LGKTT), 以及Kinase2 (VLDDVW)、Kinase3 (GSxxLA/VTTR)和末端HD残基。推测这些TaNBS蛋白也可能具有类似的抗病作用。
在小麦2AL染色体上56个TaNBS所在的基因组序列片段中, 共有25个scaffold存在NBS-SSR位点, 通过比对2AL基因组数据获得的位置信息, 将这25个scaffold在2AL染色体臂上线性排列(表2)。在这些基因组片段中共检测到52个SSR位点, 除了位于Sca1697100起始端口的重复位点(TG)5以外, 对其余51个SSR位点的侧翼序列分别设计引物, 依次命名为Sxaas_2AL01~Sxaas_2AL51。
![]() | 表2 小麦2AL染色体上52个NBS-SSR位点 Table 2 Fifty-two NBS-SSR loci on chromosome 2AL of wheat |
对51个2AL-NBS-SSR标记进行特异性筛选, 有39个标记在缺体-四体N2BT2A、N2BT2D、N2DT2A、N2DT2B和中国春中均扩增出目标带, 而在N2AT2B、N2AT2D和双端体Dt2AS中没有目标带, 表明这些NBS-SSR标记为2A染色体长臂特异标记。
利用抗病品种Khapli及其Pm4a-NIL群体、感病轮回亲本Chancellor, 对39个2AL-NBS-SSR特异标记检测发现, 24个标记(表1)在Khapli和Chancellor中的扩增产物存在差异, 表明这些特异
标记在抗、感材料间具有较好的多态性, 其中Sxaas_2AL22、Sxaas_2AL39和Sxaas_2AL46在Pm4a-NILs中的扩增条带与Khapli中的一致, 表明这3个标记很可能与Pm4a连锁(图5)。
NBS类基因在苔藓植物、石松植物、裸子植物和被子植物中均有相关研究报道[17], 是植物中数量最多的抗病基因家族。而小麦作为世界上最重要、种植最广的农作物, 常年遭受白粉菌、条锈菌、叶锈菌、秆锈菌及赤霉菌等病原菌的侵染, 深入研究小麦NBS类基因对于减少小麦产量损失显得尤为重要。
本研究从小麦基因组中分离出2406个完整
TaNBS序列, 数目远高于粳稻的653个[22]、籼稻的553个[22]、大豆的319个[23]、高粱的211个[24]以及玉米的109个[25]。我们还分别从乌拉尔图小麦和粗山羊草的基因组中分离出681条和946条NBS序列(结果未列出), 由此初步推测, 普通小麦TaNBS家族是由其3个亚基因组供体物种的NBS家族通过两次多倍体化事件整合而来。此外, 在TaNBS中还存在多个NBS基因位于一个scaffold上的现象, 仅2AL染色体上就有8个这样的基因簇(部分见表2), 推断TaNBS家族可能还经历了串联重复事件, 最终造成小麦基因组中NBS庞大的成员数目。然而同一同源群中各染色体上的NBS数目并不相近, 如4A染色体上有248个TaNBS基因, 而4B和4D上分别只具有40个和24个, 这可能由于六倍体小麦基因组复制而造成大量基因的功能冗余, 因此冗余的部分TaNBS基因将会变成假基因或者逐渐丢失, 最终形成各基因组间基因数目的不同现象。
TaNBS蛋白包含NBS的4个特征基序, 根据两端是否连接CC或LRR结构域, 可将其分为N、CN、NL和CNL四类, 已克隆的10个小麦NBS类抗病基因均为CNL结构[4, 5, 6, 7, 8, 9, 10, 11, 12]。一些TaNBS还包含其他类型的结构域, 如Ta1blLoc007763、Ta2bsLoc001037和Ta3alLoc007069等包含STK (serine/threonine kinase)结构; Ta2bsLoc003709和Ta2bsLoc014737等包含ABC (ATP-binding cassette)转运蛋白结构; Ta2alLoc020734、Ta2dlLoc021209和Ta6bsLoc009346等包含Jacalin结构; Ta2alLoc012596、Ta2blLoc002392、Ta5dlLoc013799和Ta5dlLoc017355等包含锌指结构。其中STK结构域和ABC转运结构域分别是Pm21和Lr34的功能域[13, 14], Jacalin结构域和锌指结构域也被证实与小麦抗病性有关[26, 27]。这些结构域通常与NBS结构域互相作用, 共同抵抗病原菌的入侵。类似研究已有报道, 如拟南芥中RRS1蛋白的NBS域C端连接一个WRKY结构域, 该WRKY结构域在拟南芥对青枯菌的响应通路中起抑制作用, 与NBS结构域一起形成独特的抗病机制[28]。因此下一步有必要对这些包含其他类型结构域的TaNBS深入研究。
广泛发掘、鉴定抗病基因是小麦抗病育种的基础, 在抗病基因定位过程中应用最广的分子标记是SSR标记。然而普通小麦包含A、B、D 3个基因组和高比例的重复序列(80%) [21], 常规SSR标记在小麦染色体间存在多位点现象, 很可能造成定位结果的偏差。本研究以小麦2A染色体长臂为例, 对TaNBS基因所在scaffold上的51个SSR位点设计引物, 通过缺体四体和双端体材料筛选, 有39个(76.5%) SSR标记具有染色体特异性, 且具有良好的多态性。目前我们正在用作图群体将这些NBS-SSR特异标记定位到小麦遗传图谱, 而小麦2AL上存在抗白粉病基因Pm4a[29]、Pm4b[30]、Pm4c[31]、Pm4d[32]、Pm50[33], 抗条锈病基因Yr1[34]、Yr32[35], 抗叶锈病基因Lr38[36]和抗秆锈病基因Sr21[37]等多个抗病基因位点, 其中Sr21所在区段更是与短柄草和水稻染色体上的NBS基因簇同源[37], 因此2AL-NBS-SSR特异标记的开发对上述基因的精细定位以至克隆有重要的参考价值。另外本研究从小麦全基因组中共诊断出2177个NBS-SSR位点, 通过特异性筛选和群体遗传定位, 预计可开发出1000余对位置明确、染色体特异的NBS-SSR标记, 这将显著减少小麦抗病基因定位过程中存在的误差。
目前, 在小麦中被正式命名的各类抗病基因将近300个左右, 其中只有少数几个被用于生产, 大部分抗病基因在未用于育种之前就有可能因病原菌变异而面临失去抗性的危险。真正利用分子标记辅助选择(marker-assisted selection, MAS)育出的小麦抗病品种鲜有报道, 一个很重要原因就是分子标记与目标基因距离较远, 造成MAS过程中分子标记与目标基因重组, 导致标记跟踪信息丢失。虽然基于小麦基因组测序数据已开发出高密度、高精度的SNP芯片, 但费用较高, 暂时不适合用于育种过程中的大群体筛选。本研究从提高常规分子标记的精准度入手, 开发的每个SSR标记均与小麦NBS序列位于同一条scaffold序列上, 当某个TaNBS被确定与抗病性相关时, 其最近的NBS-SSR标记与之紧密连锁, 几乎不发生重组, 可以作为共分离标记使用, 将提高育种过程中MAS的效率。
从普通小麦基因组中分离出分布于各染色体的2406条含有NBS结构的完整蛋白序列, 按结构分为N、CN、NL和CNL共4类, 每条序列包含48~2272个氨基酸残基。在TaNBS所在基因组序列中的1203条scaffold序列上诊断出2177个SSR位点, 其中二碱基重复位点占73.5%。针对小麦2AL染色体上的51个NBS-SSR位点开发标记, 筛选出39个2AL染色体特异标记, 包括24个在抗白粉病材料Khapli和感病材料Chancellor间存在多态性, 其中Sxaas_ 2AL22、Sxaas_2AL39和Sxaas_2AL46可能与Pm4a连锁。
致谢: 北京安贞医院/北京市心肺血管疾病研究所李小燕博士在信息学分析中给予了宝贵指导, 谨致谢忱。
The authors have declared that no competing interests exist.
作者已声明无竞争性利益关系。The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|