* 通讯作者(Corresponding authors): 胡国华, E-mail:hugh757@vip.163.com, Tel: 0451-55199475; 陈庆山, E-mail:qshchen@126.com, Tel: 0451-55191945
**同等贡献(Contributed equally to this work)
高丝氨酸激酶(HSK)是天冬氨酸代谢途径中的重要酶, 控制赖氨酸、甲硫氨酸、苏氨酸和异亮氨酸的生物合成。本研究从大豆Williams 82中克隆了大豆
Homoserine kinase (HSK), the forth enzyme in the aspartate pathway, plays a key role in the biosynthesis for lysine, methionine, threonine, and isoleucine in higher plants. A
氮是作物生长发育必需的大量元素之一, 对作物最终产量的贡献为40%~50%。高丝氨酸的合成和积累, 是植物中氮素转换的重要形式[1]。同样, 基本氨基酸作为重要的含氮化合物, 是植物体内蛋白质合成的重要原料[2]。天冬氨酸代谢途径是植物氨基酸合成的重要途径, 这个途径生成的赖氨酸、苏氨酸、甲硫氨酸和异亮氨酸都是人类和动物必需的氨基酸。植物中的天冬氨酸代谢途径可以分为2个分支, 一条分支是赖氨酸的生物合成, 另一条分支又可分为2个亚类, 一是苏氨酸和异亮氨酸的生物合成, 二是甲硫氨酸的生物合成[3,4]。高丝氨酸激酶(HSK)是天冬氨酸代谢途径中的第4个酶, 催化l-高丝氨酸磷酸化生成O-磷酰-l-高丝氨酸(OPH)。进而通过苏氨酸合成酶(TS)和胱硫醚-γ-合成酶(CGS), 分别生成苏氨酸, 异亮氨酸和甲硫氨酸[5]。而在微生物中, OPH只用于苏氨酸和异亮氨酸的合成, 并不参与合成甲硫氨酸[6,7]。
HSK属于GHMP激酶超家族。这个家族的成员参与细菌与真核生物中许多关键生物代谢途径[8], 并且均具非常保守的ATP结合结构域Pro-Xaa3-Gly- Ser-Ser-Ala-Ala。由于HSK在植物中的表达量很低, 妨碍了对其功能的深入研究, 但这并不影响学者们对其潜在的调控甲硫氨酸和苏氨酸合成的猜想[9]。在一些植物中, HSK 基因已经被克隆和分析。除在豌豆中发现2个HSK同源体外[10], 其他植物中均只含一个HSK。大麦幼苗中的HSK于1976年最早被详细研究报道[11]。从小麦芽中分离纯化, 获得内源HSK, 对其三级结构的研究发现, 它是2个亚基形成的二聚体[12]。HSK在植物中的调控作用是多样的。在多数双子叶植物中, HSK可被Thr、Met、Val、Ile和SAM变构抑制, 而在单子叶植物中却不受抑制。如小麦的 HSK 基因, 不受外源氨基酸的调控[12]; 拟南芥的HSK蛋白对这些氨基酸也不敏感[13]。相反, 豌豆和小萝卜中 HSK 基因的表达, 却受这些氨基酸的抑制[10,14]; 在大豆中, 过量的甲硫氨酸, 能够抑制HSK蛋白的活性[15]。
HSK蛋白被定位于豌豆的叶绿体, 包含可溶部分和类囊体膜结合元件[16,17]。对拟南芥HSK的亚细胞定位预测结果也证明, 它含叶绿体定位序列, 可编码一段成熟的叶绿体定位导肽[13]。
本研究从大豆中克隆了编码高丝氨酸激酶的 GmHSK 基因, 进而应用qRT-PCR方法分析了它在大豆全生育期和不同组织中的表达模式。这不仅对 GmHSK 基因在大豆生长过程中的作用有了较深入的了解, 更为大豆品质育种提供了理论依据。
大田种植大豆Williams 82。根据大豆生育期的划分[18], 经28℃光照8 h和25℃黑暗16 h培养后, 分别取子叶、根、茎、叶、花、荚(0.5~1.0 cm)、荚皮和籽粒, 立即以液氮冷冻, -80℃保存备用。设置3次重复。
根据拟南芥HSK (GenBank登录号为AAD33097)蛋白序列, 应用本地化的Blast软件, 在大豆EST数据库中, 筛选出匹配较好的EST序列, 利用DNAMAN (Lynnon Biosoft, Canada)软件进行EST序列拼接, 得到 GmHSK 的序列。根据预测基因的CDS序列, 用Primer Premier 5.0 (PREMIER Biosoft, USA)设计引物(表1)。以叶片总RNA制备的cDNA作为模板, 进行RT-PCR扩增, 回收目的基因产物与pGEM-T Easy载体连接, 转化大肠杆菌DH5α, 挑取阳性克隆, 送生工生物工程(上海)股份有限公司测序。
将各样品在液氮中研磨后, 利用TRIzol试剂(Life Technologies, USA)提取总RNA, 经DNase I处理去除DNA污染, 1.5%琼脂糖凝胶电泳检测总RNA的完整性, BioMate 5分光光度计(Thermo Fisher Scientific, USA)测定总RNA的质量和浓度。取5 μg总RNA进行反转录, 应用Invitrogen反转录试剂盒合成第一链cDNA, -20℃保存备用。
通过绘制标准曲线和溶解曲线, 确定 GmHSK 和 GmActin 基因(内参基因)引物的扩增效率和特异性。采用QuantiFast SYBR Green PCR试剂盒(QIAGEN, USA)提供的三步法PCR反应, 在Rotor-Gene Q Real-time PCR仪上(QIAGEN, USA)进行实验。15 μL的qRT-PCR体系含2×QuantiFast SYBR Green PCR Master Mix 7.5 μL, 10 μmol L-1上下游引物各1.5 μL, cDNA模板1 μL, RNase-free H2O 3.5 μL。PCR扩增标准程序为95℃预变性5 min; 95℃变性10 s, 56℃复性20 s, 72℃延伸20 s, 40个循环。每个样品3次重复。以 GmActin11 基因(GenBank登录号为BW652479)作为内参基因, 参照2-ΔΔCT算法计算各基因表达量[19]。通过Rotor-Gene Q Series (QIAGEN, USA)软件和Microsoft Excel分析处理实验结果。
利用http://www.phytozome.com/对基因进行结构与定位分析。利用DNASTAR Lasergene 8.0 MegAlign (DNASTAR, USA)对基因及其同源序列进行联配分析。通过MEGA4软件[20]构建系统进化树, 采用Neighbor-Joining (NJ)算法, Bootstrap设定为1000。利用NCBI的Protein Conservation Domain程序, 分析GmHSK蛋白的保守结构域。利用SOPMA (http:// npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/ npsa_sopma.html)分析蛋白质的二级结构。利用Phyre (http://www.sbg.bio.ic.ac.uk/phyre/)的预测蛋白质三级结构。利用PSORT (http://psort.hgc.jp/form.html)预测蛋白的亚细胞定位。
根据拟南芥HSK蛋白序列, 应用本地化的Blast软件, 在大豆EST数据库中, 筛选出4条匹配较好且能覆盖拟南芥 HSK 基因全长的EST序列(CF808568、BE329811、BF069552和BM178051)。利用DNAMAN拼接获得一条1190 bp连续的cDNA片段, 其中包含一个完整的开放阅读框。测序结果显示, GmHSK 基因(GenBank登录号为FJ594404)全长1083 bp, 编码360个氨基酸, 分子量为37.64 kD, 等电点为5.02。利用http://www.phytozome.com/网站提供的Blast程序比对发现, 该基因没有内含子, 并且在大豆基因组中只有一个同源体, 定位于第14染色体。
SOPMA预测的GmHSK蛋白质二级结构显示, 36.39%为α螺旋结构, 16.94%为β折叠结构, 6.67%为β转角结构, 40.00%为不规则卷曲结构。三级结构预测结果显示, GmHSK蛋白质含有215个氢键, 15个α螺旋结构, 13个β折叠结构和29个转角结构。多序列联配结果表明(图1), 植物中的高丝氨酸激酶比较保守, 均具有GHMP激酶超家族保守的ATP结合结构域(GmHSK, P137-A147)。另外, H184和R-283也是重要的高丝氨酸结合位点[21]。系统进化关系分析的聚类结果表明, 植物的高丝氨酸激酶被分为单子叶植物(玉米、高粱、水稻、二穗短柄草、青稞)和双子叶植物(大豆、蒺藜苜蓿、拟南芥、葡萄、毛果杨、蓖麻)两类(图2)。PSORT在线预测结果表明, GmHSK蛋白定位于叶绿体(确信度0.95)。
图3所示, GmHSK 在大豆营养生长初期各器官的表达量是增加的, 中期达到最大, 之后逐渐减少。在营养生长开始的VE~V1期, GmHSK 在子叶中的表达呈上升趋势, 在V1期达到最高(图3-A~C)。在大豆根中, 除V5期外(图3-F), GmHSK 在各时期均保持较高的表达水平。这表明 GmHSK 在根中的持续大量表达, 对大豆营养生长具有重要的作用。而在大豆茎和叶中, GmHSK 基因的表达没有明显的变化。
与营养生长期类似, GmHSK 基因的表达水平在生殖生长初期逐渐增加, 中期达到最大值。大豆茎和叶中的表达高峰, 分别出现于R7 (图4-G)和R4 (图4-D)期。而在花中的表达水平很低, 但从R1~R4期, 表达水平缓慢升高(图4-A~D)。从R4期开始, 基因在豆荚中的表达水平开始逐渐升高, 直至R7期达到最高(图4-D~G)。而籽粒中的表达水平, 在R5期达到峰值后, 逐渐下降(图4-E~H)。
HSK 基因最早在大肠杆菌中被克隆分离, 随后对其功能进行了较为详细的研究。大肠杆菌的HSK只参与Thr和Ile的生物合成, 而在植物中, HSK同时参与Met的合成反应。因此, 植物的HSK在进化过程中, 扩大了催化底物和最终产物的范围, 可能参与了多种氨基酸的生物合成[13]。大豆作为提供食用油和蛋白质的重要经济作物[22], 其HSK基因的功能和表达模式却未见报道。
为研究 GmHSK 基因在大豆氨基酸合成中的作用, 通过同源克隆的方法, 在大豆中首次克隆了 GmHSK 基因, 并且在大豆基因组中只发现了1个 HSK 基因。而在大多数维管植物中, 许多氨基酸生物合成酶是以基因家族的形式出现的, 常含2个或多个成员。另外, 在拟南芥的HSK突变体 dmr1 中, Thr、Met和Ile的生物合成并没有减少, 并且在植物体内积累了大量的高丝氨酸[23]。这说明植物中单拷贝的 HSK 基因, 在天冬氨酸代谢途径中具有关键作用, 也可能同时存在着同源性较低, 但具类似功能的基因调控着相似的氨基酸合成途径。
通过多序列联配分析, 发现GmHSK蛋白与拟南芥HSK蛋白具较高同源性, 并同属于GHMP激酶家族。推测GmHSK可能同AtHSK具相似功能。系统进化分析, 可将植物的HSK蛋白分为单子叶植物和双子叶植物两类。结合序列联配的信息, 某些特定的氨基酸也许可以作为单子叶植物和双子叶植物进化的分类依据。
PSORT预测的亚细胞定位结果表明, GmHSK蛋白定位于叶绿体, 与HSK在豌豆叶片中的定位结果相同[16,17]。在豌豆韧皮部组织浸出液中, 高丝氨酸是豌豆植株向籽粒转运物质中的主要成分之一[24]。然而, 在大豆的多数生育期中, GmHSK 基因在根中的相对表达水平高于其他组织和器官。这表明, 在大豆根中, GmHSK可能大量存在于其他细胞器中, 并调控高丝氨酸的积累和转运。
根据大豆15个生育期中, 68个样品的qRT-PCR分析结果, 证明 GmHSK 基因在大豆植株的子叶、根、茎、叶、花、荚、荚皮和籽粒中均表达, 但其mRNA的转录水平在各个时期并不相同, 推测 GmHSK 基因可能与不同生育期的物质合成相关。从 GmHSK 基因在大豆根、茎、叶中的表达趋势(图3和图4)可以看出, 在营养生长开始的VE~V1期和生殖生长开始的R1期, 该基因的表达呈低谷, 而在营养生长中期和生殖生长末期达到表达高峰。说明 GmHSK 基因与大豆的营养生长和后期的物质积累密切相关。开花与结荚是大豆进入生殖生长的标志, 也是物质积累的开始, 随着时间的增长, 物质积累也随之增加。 GmHSK 基因在花与荚中的表达, 随着生殖生长时间的延长而增加, 并且在荚中的表达量是花中的2~3倍。说明在大豆完成授粉, 开始籽粒发育的过程中, GmHSK 基因大量表达, 可能参与调控物质的合成与积累。R5期为植株的鼓粒期, 籽粒迅速膨大, 所需的营养物质最多, 新陈代谢旺盛, 此时 GmHSK 基因在籽粒中的表达量达到最大。R6期为主茎上第4节的荚中包含充满整个腔的绿色籽粒, 叶片将迅速泛黄, 位于最下面的3~6片复叶脱落, 籽粒即将成熟。此时 GmHSK 基因在荚皮中的表达量最大, 植株营养器官中的有机物, 以可溶的低分子化合物状态(如糖类、氨基酸等)运往籽粒, 并逐渐转化为高分子化合物(如淀粉、蛋白质和脂类等)积累起来。R7和R8期, 物质积累基本完成, 该基因表达量也急剧下降。这些结果表明, GmHSK 基因不仅是大豆旺盛的营养生长所必需的, 也在物质积累过程中起着重要的调控作用。
有研究表明, 病原物可以特异识别宿主的高丝氨酸, 并降低宿主中高丝氨酸的含量, 同时诱导致病基因的表达[25]。此外, 拟南芥 dmr1 突变体中含有高浓度的高丝氨酸, 并可抵抗霜霉病的侵染[23]。这些研究结果, 为评估转 HSK 基因作物的抗病性提供了理论依据。因此, GmHSK 基因的克隆和分析, 为大豆品质育种和抗病育种提供了有益的候选基因。
克隆了大豆 GmHSK 基因, 该基因ORF长1083 bp, 编码360个氨基酸, 分子量为37.64 kD, 等电点为5.02。 GmHSK 基因与拟南芥的 HSK 基因具相似编码产物, 均具GHMP激酶超家族保守的ATP结合结构域。植物中的HSK蛋白被分为两类, GmHSK与苜蓿中的HSK蛋白同源性最高, 并与拟南芥、蓖麻等双子叶植物的HSK蛋白同处一个进化枝。 GmHSK 基因在大豆全生育期的8个组织和器官中均表达, 但在各个时期的表达水平不同。推测 GmHSK 基因可能与不同生育期的物质合成相关, 调控营养生长阶段和后期的物质积累。