* 通讯作者(Corresponding author): 王化俊, E-mail:whuajun@yahoo.com
第一作者联系方式: E-mail:xlaiyong@163.com (赖勇); yxmeng1@163.com (孟亚雄) ** 同等贡献(Contributed equally to this work)
为了合理评价引进种质资源, 为大麦基因发掘及育种组合配置提供依据, 选用分布于全基因组的64个SSR标记, 对221份大麦材料进行了基因型分析。共检测到192个等位变异, 变幅为2~7个; 基因频率变异范围为0.0090~ 0.9729, 平均0.3333; 全部位点的基因多样性变化范围在0.0528~0.7807, 平均0.4813; 多态性信息含量(PIC)变异范围在0.0514~0.7464, 平均0.4113。供试材料间遗传相似系数变幅为0.4844~0.9792, 平均0.7023。221份材料被划分成两大群7个亚群, 国内地方品种与1份北京品种为一大群, 国内育种品种与所有国外引进品种为另一大群。遗传结构分析与聚类结果基本一致, 两大类群间的遗传距离为0.3358, 且第二大群多样性比第一大群丰富。2016个SSR位点成对组合中, 不论共线性组合还是非共线性组合, 都存在一定程度的连锁不平衡(LD)。
The objective of this study was to provide a suitable evaluation for introduced germplasm resources and useful information for associate analysis and parental combinations in barley (
亲本遗传基础狭窄是制约育种的主要问题之 一[ 1], 引进新的种质资源是解决这一问题的有效手段。分析引进种质资源的遗传多样性、发掘其中的有利基因, 对于种质创新和新品种选育具有重要意义。分子标记技术为种质资源的遗传多样性研究及有利基因发掘提供了便利。简单序列重复(simple sequence repeat, SSR)具有多态性高、数量丰富、重复性好、呈共显性、且广泛分布于基因组等优点[ 2, 3, 4, 5], 被广泛应用于大麦遗传多样性[ 6, 7, 8]和基因发掘研究[ 9, 10, 11]。通过遗传连锁分析发掘基因及鉴定基因功能需要花费大量的时间和精力构建作图群体, 而关联分析以自然群体为研究对象, 不用构建作图群体, 可以检测出大量的等位变异。基于连锁不平衡的关联分析可以将表型性状的多样性与基因或位点的多态性结合起来, 确定不同种质资源所携带的等位基因及其对目标性状的贡献[ 12, 13, 14]。目前, 关联分析已广泛用于小麦[ 15]、玉米[ 16]、水稻[ 17]等作物的基因发掘。在大麦上, 已对栽培品种、地方品种以及野生资源进行了关联分析[ 8, 18, 19], 发掘出许多有利等位基因。西藏地区为大麦起源中心之一, 拥有丰富的种质资源, 特别是一些野生材料具有丰富的遗传变异, 从中发掘有利基因对于大麦育种具有重要意义。但是野生 材料未经驯化, 含有许多不利基因, 许多农艺性状表现较差, 在育种中难以利用。而该地区的许多地方品种来自一些野生材料长期的人工驯化, 遗传变异同样丰富, 农艺性状较野生材料更加优良, 更适合用于新品种的选育。因此本研究拟对本课题搜集的我国西藏、青海地区的地方品种、国内其他省份品种和一些国外品种进行遗传分析, 为今后发掘有利基因和标记辅助育种提供依据。
以221份大麦品种(由甘肃省作物遗传改良与种质创新重点实验室和甘肃省干旱生境作物学重点实验室麦类种质创新课题组提供)构成自然群体, 包括74份西藏地方品种、16份青海地方品种、25份其他省份栽培品种、47份美国栽培品种、19份丹麦栽培品种、12份匈牙利栽培品种、15份德国栽培品种以及13份其他国外引进栽培品种(表1)。从每份材料取15粒饱满完整的种子置培养皿中, 于室内避光萌发。10 d后采黄化苗, -80℃保存备用。
采用CTAB法[ 20]提取基因组DNA。选用64个分布于大麦1H~7H染色体的SSR标记(表2)进行多态性扫描。扩增程序为94℃预变性5 min; 94℃变性40 s, 64~55℃(touch-down PCR)退火40 s, 72℃下延伸50 s, 10个循环; 94℃变性40 s, 55℃退火40 s, 72℃延伸50 s, 30个循环; 72℃延伸5 min。扩增产物经8.0%非变性聚丙烯酰胺凝胶电泳分离, 银染 显示。
以二进制和基因型记录SSR分析结果, 同一位点上具有相同迁移率的条带记为1, 无带记为0; 以数字1、2、3等代表不同基因型。以Powermarker 3.25软件分析等位基因数、基因频率、基因多样性依据多态性信息量(polymorphism information content, PIC)。
PIC = 1-
式中, pij表示位点 i的第 j个等位变异出现的频率。以NTsys 2.10e软件计算遗传相似系数, 采用DARwin 5.0软件基于遗传距离的邻位相连(neighbor-joining, NJ)构建聚类图。参照Maccaferri等[ 21]的方法处理频率小于0.01的稀有等位基因。以Structure 2.3.1软件分析群体遗传结构, 估计最佳群体组群数 K, 其取值范围为1~20, 将MCMC(Markov Chain Monte Carlo)开始时的不作数迭代(length of burn-in period)设为10 000次, 再将不作数迭代后的MCMC设为100 000次, 重复5次, 计算Q参数。若 K值持续增大, 参照Evanno等[ 22]的方法计算Δ K确定 K值。以Popgene 32软件分析多样性指数。使用TASSEL 2.1软件计算共线、非共线SSR位点组合间的LD水平及支持概率, 绘制LD配对检测矩阵图。
以64个SSR标记从221份材料中共检出192个等位变异, 平均每个标记3.0个, 标记Bmac32检测到的等位变异最多, 为7个; MGB325等31个标记仅检测到2个等位变异。基因频率变异范围为0.0090~0.9729, 平均值为0.3333。GBM1274位点的B等位基因频率最高(0.9729), 同时稀有等位基因有4个。基因多样性变化范围为0.0528~0.7807, 平均0.4813, 其中GBM1274位点最低, Bmag173位点最高。PIC变异范围为0.0514~0.7464, 平均为0.4113, PIC最高的标记是Bmag173, 最小的是GBM1274 (表2)。
通过遗传相似系数(GS)分析, 发现美国品种M14与M15亲缘关系最近(GS=0.9792), 其次是ZDM6552与ZDM6553、M45与M47 (GS=0.9740); ZDM6114与青永4026 (墨西哥品种)的亲缘关系最远(GS=0.4844), 其次是ZDM6474与宝丹(GS=0.5000)。221份材料在聚类图中明显被分成两大类群、7个亚群(图1)。
第一大类群包括国内西藏和青海的地方品种及1份北京品种(08京358), 又可分为A、B两个亚类, 其中A亚类全部为西藏品种, 但还有26份西藏品种与16份青海品种被聚到B亚类中。08京358与国内西藏、青海地方品种划分到同一大类, 但是之间差异较大, 分隔较远。
第二大类群主要为国外引进品种, 也包括部分国内除西藏和青海以外地区育成的品种, 又分成5个亚类。其中, C亚类主要为匈牙利和德国品种, 以及部
分美国(5份)、丹麦(3份)、波兰(2份)、瑞典(2份)、澳大利亚(2份)、阿富汗(1份)、叙利亚(1份)和加拿大(1份)品种, 2份中国西藏地方品种也在该亚群中; D亚类主要为美国品种和丹麦品种, 还包括1份匈牙利品种、3份中国甘肃品种和1份中国陕西品种; E亚类包括1份叙利亚品种、1份日本品种、1份墨西哥品种和4份国内育成品种; F亚类包括10份国内育成品种和1份日本品种; G亚类包括3份中国黑龙江品种和3份中国北京品种。
将221份材料分为2个亚群(图2, 当 K=2时Δ K最大), 第1亚群(POP1)有89份材料, 主要包括88份国内地方品种和1份北京品种; 第2亚群(POP2)有132份材料, 包括2份国内地方品种、其他省份育成栽培品种以及所有的国外引进品种。这与聚类分析结果一致, 说明这221份材料的群体结构较简单, 可以有效降低群体结构对关联分析的影响。记录各个材料的对应群体概率Q值, 为后期关联分析提供相应协变量数据。
POP1和POP2的遗传距离为0.3258, 群体内基因多样性指数分别为0.3626和0.4254, Shannon多样性指数分别为0.6221和0.7119 (表3), 说明POP2的资源多样性较POP1丰富, 可能与POP2的材料数量多、来源广泛有关。
不同位点等位基因之间的连锁不平衡是关联分析的基础。通过64个SSR标记分析, 在2016个SSR位点成对组合中, 不论共线性组合还是非共线性组合, 都存在一定程度的LD。 D′统计概率( P<0.01)支持的LD成对位点830个, 占全部位点组合的41.2%, D′平均值为0.4, 整体LD水平较高。LD成对位点的 D′值范围主要集中在0.2~0.4和0.4~0.6间(表4), 较高水平的LD位点( D′ > 0.5)主要分布在2H、4H、6H和7H连锁群上。说明这4条染色体面临的选择压力要大于其他3条染色体。进一步分析共线性位点组合的LD状况, 发现2H、3H和6H连锁群上的LD成对位点分别有18、16和25个明显多于其他几个连锁群, 且较高水平的LD成对位点( D′>0.5)集中在2H、6H连锁群群上, 分别有8个和10个。
根据聚类和群体遗传结构分析结果, 将221份材料分成地方品种和栽培品种两大类群, 分别进行连锁不平衡分析。从地方品种检测出183个LD成对位点( P<0.01), D′平均值为0.5; 栽培品种中检测出LD成对位点332个, D′平均值为0.4。说明地方品种的LD水平要低于育成栽培品种, 且受到的选择压力小于栽培种。从图4可以看出, 地方品种较高水平的LD位点( D′> 0.5)在7个连锁群上均存在, 而栽培品种主要分布在2H、4H、6H和7H连锁群上。说明在现代育种过程中, 许多目标性状所对应的基因多集中于这4条染色体。
丰富的种质资源是取得育种突破性进展的基础, 利用分子标记可以对不同种质进行合理的评价, 对后期育种工作中的组合配置具有指导意义。有研究表明, 我国大麦遗传基础明显比国外品种狭窄, 但是野生资源遗传变异丰富[ 23, 24, 25, 26], 因此需要引进不同国家和地区的材料改良大麦品种。本研究选用115份来自国内不同地区的地方品种和栽培品种, 以及96份来源于12个国家的品种, SSR标记分析表明, 平均基因多样性为0.3333, 平均遗传相似系数为0.7023, 整体遗传多样性不够丰富, 主要是因为这些材料大部分为栽培品种, 经过人工选择后, 保留的遗传变异较少。聚类分析将供试材料分成两大类, 地方品种为一类, 栽培品种为一类, 说明地方品种与栽培品种的遗传差异较大。本研究发现栽培品种遗传变异较地方品种丰富, 可能与地方品种样本量较小有关。某些标记在地方品种中检测出较丰富的等位基因, 例如标记Bmac32, 在地方品种中检出7个等位基因, 而在栽培品种中只有3个; 因此, 如果增加地方品种的样本量, 可能会提高整体的遗传多样性。Maroof等[ 27]利用4对SSR引物检测104份栽培大麦和103份来自以色列不同生态区的二棱野生大麦, 其中2个标记分别检测到28个和37个等位变异; Struss等[ 28]用15对SSR引物研究由野生大麦、地方品种和选育品种组成的163份大麦品种的遗传多样性, 共检测到130个等位基因, 单个标记检测到的最多等位变异数为15。说明从丰富遗传基础角度考虑, 仍然需要引进一些野生资源, 从中挖掘更多的有利基因为育种服务。
Hansen等[ 29]利用AFLP标记对野生甜菜生长习性首次进行植物全基因组关联分析, Thornsberry等[ 30]首次运用基于候选基因检测方法对玉米中 Dwarf8基因的9个多态性位点与玉米开花时间相关联的研究, 此后陆续有很多利用关联分析方法的报道。对大麦的研究表明, LD衰减距离在10~20 cM[ 31, 32], 说明大麦的LD水平较高, 有利于进行全基因组关联分析, 发掘种质资源中的有利基因。Katherine等[ 19]报道, 栽培大麦的LD水平最高, 地方品种次之, 野生资源LD水平最低。本研究利用覆盖全基因组的64个SSR标记, 检测出供试材料的LD水平较高, 在2016个SSR位点成对组合中, 不论同一连锁群的共线性组合还是不同连锁群间的非共线性组合, 都存在一定程度的LD, D′统计概率( P<0.01)支持的LD成对位点占41.2%, D′平均值为0.4, 可能的原因是221份材料中栽培品种较多, 并且没有野生资源。人工选择会增加LD水平[ 11]。对于一组自然群体, 如果经过某些目标性状的集中选择, 该性状对应的染色体LD水平会相应提高。目前, GrainGenes2.0网站(http://wheat.pw.usda.gov/GG2/index.shtml)公布了大量的大麦各性状相关QTL, 其中株高、穗型、产量等农艺性状的相关QTL多集中于2H、3H、4H、5H和6H染色体, 而一些抗性及品质性状的相关QTL多集中于1H、2H、5H和7H染色体。本研究中较高水平的LD成对位点( D′ > 0.5)主要分布在2H、4H、6H和7H连锁群上, 以及与其组合的位点。说明这4条染色体面临的选择压力大于其他3条染色体, 这些材料多经历了较多农艺性状的选择。进一步分析共线性位点组合的LD状况, 发现2H、3H和6H连锁群上的LD成对位点分别有18、16和25个明显多于其他几个连锁群(1H有11个、4H有12个、5H有7个、7H有13个), 且较高水平的LD成对位点( D′> 0.5)集中在2H、6H连锁群上, 分别有8个和10个。
用64个多态性SSR标记将221份大麦品种分成地方品种与栽培品种两大类, 其遗传距离为0.3258, 栽培品种的多样性较地方品种丰富。国内育成品种与国外品种有较近的亲缘关系, 群体遗传结构相对简单。共线性或非共线行位点组合均有一定程度的LD, 并且整体LD水平较高, 有利于关联分析和发掘有利基因。栽培品种的LD水平高于地方品种, 尤其在2H、4H、6H和7H染色体上。