二穗短柄草钙依赖型蛋白激酶 BdCDPK4基因的克隆及其编码蛋白质的生物信息学分析
韦淑亚1, 赵旭东2, 王会平1, 杨广笑2, 何光源2
1.武汉职业技术学院 生物工程学院 应用生物技术研究所,湖北 武汉 430074
2. 科技部国际科技合作基地(基因工程),分子生物物理学教育部重点实验室,华中科技大学 生命科学与技术学院,湖北 武汉 430074

作者简介:韦淑亚(1979—),女,湖北武汉人,博士,主要从事生物化学与分子生物学研究。E-mail:weishuya1011@126.com

摘要

二穗短柄草( Brachypodium distachyon L.)因与小麦、大麦等有很高的同源性,作为新型禾本科模式生物吸引了越来越多的研究者。试验采用基因克隆技术分离了二穗短柄草 BdCDPK4基因的编码区序列,并采用生物信息学方法分析了该基因及其编码的蛋白质的序列特征、结构和功能。结果表明,分离了 BdCDPK4基因 1 851 bp 的 cDNA 序列(GenBank 登录号为 XM_003559516),编码区长度为 1 752 bp,编码 583 个氨基酸,分子量为 64.78 ku,等电点为9.12,含有N端可变区、蛋白激酶区、自抑制区、EF手型结构、类似钙调素等结构域。亚细胞定位预测位于叶绿体和液泡上。进化树分析结果显示,该蛋白与小麦TaCDPK19 蛋白的同源性最近。根据各物种间 CDPKs 蛋白的高同源性,结合小麦 TaCDPK19基因被高盐和小麦白粉病菌 Blumeria graministritici (Bgt)诱导,推测 BdCDPK4基因也可能参与逆境胁迫下的信号传导途径,在抗逆等生物学过程中发挥重要功能。

关键词: CDPKs; BdCDPK4; 多序列比对; 生物信息学分析
中图分类号:Q949.71+4.2 文献标志码:A 文章编号:1004-1524(2017)02-0345-08 doi: 10.3969/j.issn.1004-1524.2017.02.23
Cloning and encoding protein bioinformatics analysis of BdCDPK4 from Brachypodium distachyon
WEI Shuya1, ZHAO Xudong2, WANG Huiping1, YANG Guangxiao2, HE Guangyuan2
1. Institute of Applied Bio-technology, College of Biological Engineering, Wuhan Polytechnic, Wuhan 430074, China
2. The Genetic Engineering International Cooperation Base of Ministry of Science and Technology, Key Laboratory of Molecular Biophysics of Chinese Ministry of Education, College of Life Science and Technology, Huazhong University of Science & Technology, Wuhan 430074, China;
Abstract

Brachypodium distachyon, the genome of which shares high homology with wheat and barley, has been used as the new model species of Gramineae. In order to clarify the structure and function of Brachypodium distachyon CDPKs gene, the coding region sequence (CDS) of BdCDPK4 gene of Brachypodium distachyon was isolated, and its character, structure and function were analyzed by bioinformatics methods. The results showed that 1 851 bp cDNA (GenBank ID: XM_003559516) of coding sequence of BdCDPK4 gene included the complete 1 752 bp CDS, coded 583 amino acids, and located on chloroplast and vacuole. The molecular weight and isoelectric point of BdCDPK4 protein were 64.78 ku and 9.12, respectively. BdCDPK4 protein contained several domains including N-variable domain, kinase domain, autoinhibitory domain, EF-hands and CaM-like domain. Phylogenetic analysis results suggested that BdCDPK4 protein had high homology with wheat TaCDPK19. TaCDPK19 were induced by high salt and white powder Blumeria graministritici(Bgt). BdCDPK4 protein may participate in the regulation of signal transduction pathways under stresses according to the homologies of protein domain among all species. Taken together, our data could establish a good foundation for studying the biological functions of BdCDPK4 gene.

Keyword: CDPKs; BdCDPK4; multiple sequence alignment; bioinformatics analysis

1982年CDPK第一次在豌豆(Pisum sativum L.)中被发现[1]; 1987年CDPK首次在大豆(Glycine max L.)中得到纯化和鉴定[2], 从此CDPK受到越来越多的研究者的关注。目前许多植物如杨树(Populus tremula L.)、水稻(Oryza sativa L.)、拟南芥(Arabidopsis thaliana L.)等的CDPKs成员已经被鉴定并分类。拟南芥34个CDPKs成员分为4个亚类, 分布在5条染色体上[3]; 目前水稻中已有31个CDPKs被鉴定[4, 5]; 杨树中32个CDPKs被鉴定分布在除Ⅹ Ⅲ 、Ⅹ Ⅶ 、Ⅹ Ⅷ 号以外的染色体上[6]。在禾本科植物中, 二穗短柄草基因组最小, 仅为272 Mb, 染色体基数为5条。目前二穂短柄草的基因测序已经完成, 结果表明, 二穂短柄草从小麦属中形成, 二穂短柄草与小麦两者基因组相似度在95%以上, 并且感染小麦的各种细菌均能感染二穂短柄草, 因此, 二穂短柄草可以作为研究小麦、水稻等作物的新型单子叶模式植物。

当受到高盐、高温、寒冷等非生物胁迫时, 植物体内CDPKs也会特异性表达, 以此调节非生物胁迫响应过程。研究发现, 玉米(Zea mays L.)中ZmCDPK1和ZmCDPK1a可以激活与高盐和干旱相关的启动子响应胁迫, ZmCDPK1激酶区缺陷型突变体不再响应干旱等胁迫[7]。水稻OsCDPK7过表达可以增强水稻对高盐、低温及干旱的耐受能力[8, 9]。水稻OsCDPK9过表达可以增强水稻对干旱的耐受能力[10]。CDPKs参与多个ABA依赖型信号通路, 拟南芥AtCDPK4和AtCDPK11参与磷酸化AREB/ABF转录因子的过程, 启动相关基因表达, 从而抵抗高盐和干旱胁迫[11]。由此可见, CDPKs在植物抵抗非生物胁迫的信号通路中有着极为重要的调节作用。尽管CDPKs在拟南芥、水稻和玉米等植物中已经得到系统的研究, 但在新型的禾本科二穗短柄草里有关CDPKs的研究报道还很少。本研究旨在通过二穂短柄草BdCDPK4基因的克隆, 应用蛋白在线分析软件对所克隆的二穗短柄草BdCDPK4基因所编码蛋白进行生物信息学分析, 对其结构和功能进行预测[12, 13], 研究结果为进一步研究二穗短柄草BdCDPK4基因的结构、功能和表达机理奠定了基础, 对小麦和大麦等谷类作物的复杂基因组的功能研究也具有重要意义。

1 材料与方法
1.1 材料

二穗短柄草(B. distachyon)二倍体近交系Bd21种子由华中科技大学中英联合实验室保存、提供。

大肠埃希菌(E. coli) Top10 、琼脂糖凝胶DNA回收试剂盒及质粒小量提取试剂盒(均购自天根生化科技(北京)有限公司); pMD18-T simple vector、PrimeStar HS DNA Polymerase(购自大连TaKaRa公司); 植物总RNA提取试剂盒(购自北京庄盟国际生物基因科技有限公司)、2× Es Taq Master Mix(含染料)(购自北京康为世纪生物有限公司)、cDNA逆转录试剂盒(购自Fermentas公司), 其余试剂均为国产分析纯。

1.2 方法

1.2.1 总RNA的提取及cDNA的合成

选取生长状态良好的Bd21幼苗进行总RNA的提取, 采用植物提取RNA试剂盒, 液氮研磨, 提取二穗短柄草叶片的总RNA。经琼脂糖凝胶电泳和分光光度计检测, 将获得的完整和质量好的RNA用反转录试剂盒反转录成cDNA, 备用。

1.2.2 引物设计与目的基因的克隆

利用数据库NCBI(http://www.ncbi.nlm.nih.gov/BLAST/)得到了目的基因BdCDPK4的全长cDNA序列信息, 根据序列信息, 利用生物软件Primer Premier 5.0进行引物设计(在目的基因开放阅读框两端区域内设计基因特异性引物), 并由武汉擎科公司合成。PCR所用的引物序列:BdCDPK4(Forward: 5’ -GGCAAGGAACGTCGTCCCATACA- 3’ , Reverse: 5’ - CCAAGCATCGCACATTGACCAGTT -3’ )。基因克隆的PCR反应体系为2× GC Buffer 10.0 μ L, dNTPs mix 1.6 μ L, 上下游引物(10 μ mol· L-1)各1 μ L, Primer storase 0.2 μ L, CDNA模板0.5 μ L, ddH2O 5.7 μ L, 共20 μ L。PCR反应扩增程序:98 ℃预变性5 min; 98 ℃变性10 s, 60 ℃ 退火15 s, 72 ℃延伸2 min, 35个循环; 72℃延伸10 min。PCR产物用1.2% (m/V)琼脂糖凝胶检测。

1.2.3 BdCDPK4蛋白进化树分析

利用数据库NCBI(http://www.ncbi.nlm.nih.gov/BLAST/)进行BLAST分析, 使用生物软件DNAMAN对BdCDPK4与其他物种中同源性较高的CDPKs进行多序列比对分析。为了进一步研究BdCDPK4与其他物种CDPKs之间的进化关系, 使用MEGA5.0作进化树进行分析。

1.2.4 BdCDPK4蛋白序列生物信息学分析

利用生物软件和网上在线工具对BdCDPK4进行生物信息学分析, 主要包括理化性质、疏水性、二级结构、保守结构域、三级结构和亚细胞定位等方面的分析与预测。所使用的相关网站及软件如下:蛋白质理化性质分析(http://web.expasy.org/protparam/); Hphob. / Kyte & Doolittle法分析蛋白质疏水性(http://web.expasy.org/protscale/); 二级结构预测(http://bioinf.cs.ucl.ac.uk/psipred/; 版本PSIPRED v3.3); 保守结构域预测(http://plantsp.genomics.purdue.edu/index.html); 三级结构预测(http://swissmodel.expasy.org/)。用TargetP和 WoLFPSort 对 BdCDPK4基因所编码的蛋白质进行亚细胞定位分析。

2 结果与分析
2.1 二穗短柄草BdCDPK4基因的克隆

用分光光度计检测所提取生长状态良好的二穗短柄草Bd21幼苗的总 RNA, 选择吸光度比值(D260/D280)介于1.80~2.20的质量良好的总RNA, 逆转录合成cDNA, 以逆转录的cDNA 为模板, 用引物 BdCDPK4-F/R 扩增目的条带。经1.2%琼脂糖凝胶电泳检测, 电泳结果如图1所示, 与预测条带1 851 bp大小一致, 委托武汉擎科生物技术有限公司测序。测序结果表明, 所扩片段为 1 851 bp, 通过序列比对, 发现与 NCBI 中登录数据(XM_003559516)一致。

图1 BdCDPK4 PCR产物的琼脂糖凝胶电泳图Fig.1 The agrose gel electrophorosis of BdCDPK4 PCR products

2.2 BdCDPK4蛋白质序列结构及生物信息学分析

2.2.1 BdCDPK4基因的同源性分析

将小麦(Triticum aestivum L.)TaCDPK19、拟南芥AtCPK10、AtCPK30、玉米ZmCDPK30、水稻OsCPK9、杨树PtCDPK25、PtCDPK26、谷子(Setarua italica L.)SiCDPK30与BdCDPK4进行多序列比对, 结果如图2-A, 目的蛋白与同源蛋白完全相同的氨基酸序列区域用黑色标示, 目的蛋白与同源蛋白的氨基酸序列相似区域分别用深灰色和浅灰色标示。N端可变区、蛋白激酶区、自抑制区、EF手型结构、类似钙调素结构域分别用箭头和横线进行标示。使用MEGA5.0做进化树并进行分析, 如图2-B, 从进化树中可以看出, BdCDPK4与小麦TaCDPK19亲缘关系最近, 故将该基因命名为BdCDPK4。以上结果表明, 我们所获得BdCDPK4的确是二穗短柄草CDPK基因家族成员, 并且与禾谷类小麦CDPKs有较高的同源性。

图2 BdCDPK4(XP_003559564.1)多序列比对及进化树分析
A, BdCDPK4多序列比对; B, BdCDPK4进化树分析
Fig.2 Protein sequences alignment of BdCDPK4 and the phylogenetic tree analysis
A, Protein sequences alignment of BdCDPK4; B, Phylogenetic tree analysis of BdCDPK4
The accession numbers of these known proteins in GenBank are as follows: TaCDPK19 (ABY59015.1) from Triticum aestivum; AtCPK10 (NP_564066.2), AtCPK30 (NP_177612.2) from Arabidopsis thliana; OsCPK9 (NP_001050944.1) from Oryza sativa; PtCDPK25 (XP_002318616.1), PtCDPK26 (XP_002322129.1) from Populus tremula; SiCDPK30 (XP_004982142.1) from Setarua italica; ZmCDPK30 (XP_008644596.1) from Zea mays

2.2.2 BdCDPK4蛋白质理化性质及疏水性分析

采用网上在线工具(http://web.expasy.org/protparam/)对BdCDPK4目的基因编码的蛋白质进行在线分析后, 结果如下:BdCDPK4基因ORF为1 752 bp, 共编码583个氨基酸残基, 它含有丙氨酸残基(Ala)61个, 含量最高(10.5%); 色氨酸残基(Trp)5个, 含量最低(0.9%); 不含吡咯赖氨酸残基(Pyl)和硒半胱氨酸残基(Sec), BdCDPK4的氨基酸组成及百分比如表1

表1 BdCDPK4的氨基酸组成及百分比 Table 1 The amino acid composition and percentage of BdCDPK4

采用网上在线工具(http://web.expasy.org/protscale/)对BdCDPK4目的基因编码的蛋白质进行在线分析后, BdCDPK4蛋白质相对分子质量为64.78 ku, 分子式为C2855H4559N839O842S21, 总原子数为9 116, 理论等电点为9.12, 脂肪指数为77.50, 不稳定指数为37.86, 为稳定蛋白。按照Hphob. / Kyte & Doolittle法分析该蛋白的疏水性, 分析显示该蛋白质总平均亲水性系数为-0.467(正值为疏水蛋白, 负值为亲水蛋白), 因此为亲水蛋白, 蛋白质序列疏水性详细分析结果如图3。

图3 BdCDPK4亲水系数分析Fig.3 The hydrophilicity coefficient of BdCDPK4

2.2.3 BdCDPK4蛋白质二级结构分析

蛋白质二级结构主要包括:α -螺旋(α -helix)、β -折叠(β -strand)、β -转角(β -turn)、无规则卷曲(random coil), 其中α -螺旋、β -折叠较为常见。蛋白质二级结构的预测与分析有助于了解其空间结构。采用网上在线工具(http://bioinf.cs.ucl.ac.uk/psipred/)对BdCDPK4进行二级结构分析, 预测结果显示, 该蛋白激酶所含的二级结构类型中无规则卷曲及α -螺旋为主要组成部分, 结果如图4。

图4 BdCDPK4蛋白质的二级结构预测Fig.4 The predicted secondary structure of BdCDPK4

2.2.4 BdCDPK4的结构域分析

蛋白质结构域蕴含着遗传进化信息, 结构域预测可以深入了解蛋白质的特性, 也为蛋白质组学研究提供重要的信息。对于激酶蛋白, 结构域特性与功能密切相关。采用网上在线工具(http://plantsp.genomics.purdue.edu/index.html)对BdCDPK4蛋白质结构域进行预测, 结果表明, BdCDPK4蛋白激酶中包含4个EF-hands结构域、蛋白酪氨酸激酶结构域、脂多糖激酶家族、ATP结合区域、丝氨酸/苏氨酸蛋白激酶激活区、预测跨膜区等结构域, 各个结构域的分布情况及对应的蛋白质序列如图5。

图5 BdCDPK4蛋白质结构域预测分析Fig.5 Prediction domain analysis of BdCDPK4

2.2.5 BdCDPK4的三级结构预测

我们在X-ray衍射结构数据库中进行搜索, 没有该蛋白的真实测定结构, 因此采用网上在线工具(http://swissmodel.expasy.org/)同源建模, 预测BdCDPK4蛋白的三级结构, BdCDPK4以人CAMK4三级结构为模板, 成功建立的三级结构模型, 如图6所示, 该蛋白主要由 α -螺旋和无规则卷曲组成, 与二级结构预测结果基本一致。

图6 BdCDPK4蛋白质三级结构预测和BdCDPK4预测模型Fig.6 The predicted tertiary structures of BdCDPK4 and prediction model of BdCDPK4

2.2.6 BdCDPK4基因编码蛋白质亚细胞定位的预测

两种软件的预测结果表明, 该蛋白主要位于叶绿体和液泡上, 位于细胞核或作为细胞骨架的可能性较小。综合两种分析结果, 该基因编码的蛋白质可能主要在叶绿体或液泡中发挥作用。

3 讨论

利用NCBI数据库获得目的基因cDNA序列信息(XM_003559516), 将其命名为BdCDPK4, RT-PCR扩增后将目的基因构建至pMD18-T Simple载体上。通过BdCDPK4与小麦、水稻、杨树、拟南芥、谷子和玉米中同源性较高的CDPKs进行多序列比对及进化分析。多序列比对结果表明, 该蛋白具有CDPK家族特征如N端可变区、Ser/Thr蛋白激酶催化结构域、自抑制区、EF手型结构、类似钙调素结构域。进化树分析表明, BdCDPK4与小麦TaCDPK19亲缘关系最近。这些结果表明, 我们所克隆到的BdCDPK4是二穗短柄草CDPK基因家族的一个成员。前期研究表明, 小麦TaCDPK19基因可被高盐和小麦白粉病菌Blumeria graministritici (Bgt)所诱导[14], 推测BdCDPK4基因也可能参与逆境胁迫下的信号传导途径, 在抗逆等生物学过程中发挥重要功能。

通过对BdCDPK4基因所编码的蛋白质进行生物信息学分析, 可知该蛋白激酶相对分子量大小为 64.78 ku, 等电点为9.12, 编码583个氨基酸残基以及含量组成百分比, 该蛋白为亲水蛋白, 较为稳定; 二级结构预测中, α -螺旋及无规则卷曲是该蛋白激酶的主要组成部分; 结构域预测包含CDPK家族特征如N端可变结构域、蛋白质激酶催化区、自抑区和含有4个EF手型结构的类似钙调素区域。除此之外, 通过结构域预测还可以看到, 该蛋白质序列中可能存在的特有区域如推测目的蛋白所具有的跨膜区及定位信息; 在X-ray衍射结构数据库中没有发现该蛋白激酶的真实三级结构, 因此采用同源建模法以人CAMK4三级结构为模板, 成功建立了三级结构模型。拟南芥原生质体转化结果显示, ACPK1定位在细胞膜和叶绿体上[15]。用TargetP和 WoLFPSort两种软件预测BdCDPK4基因编码的蛋白质可能主要在叶绿体或液泡中发挥作用。蛋白质结构的预测与分析有助于了解BdCDPK4蛋白激酶的功能及其行使生物学功能的机制, 对下一步BdCDPK4激酶蛋白的功能研究有重要意义。

The authors have declared that no competing interests exist.

参考文献
[1] HETHERINGTON A, TREWAVAS A. Calcium-dependent protein kinase in pea shoot membranes[J]. FEBS Letters, 1982, 145(1): 67-71. [本文引用:1]
[2] HARMON A C, PUTNAM-EVANS C, CORMIER M J. A calcium-dependent but calmodulin-independent protein kinase from soybean[J]. Plant Physiology, 1987, 83(4): 830-837. [本文引用:1]
[3] CHENG S H, WILLMANN M R, CHEN H C, et al. Calcium signaling through protein kinases. The Arabidopsis calcium-dependent protein kinase gene family[J]. Plant Physiology, 2002, 129(2): 469-485. [本文引用:1]
[4] ASANO T, TANAKA N, YANG G, et al. Genome-wide identification of the rice calcium-dependent protein kinase and its closely related kinase gene families: comprehensive analysis of the CDPKs gene family in rice[J]. Plant and Cell Physiology, 2005, 46(2): 356-366. [本文引用:1]
[5] RAY S, AGARWAL P, ARORA R, et al. Expression analysis of calcium-dependent protein kinase gene family during reproductive development and abiotic stress conditions in rice (Oryza sativa L. ssp. indica)[J]. Molecular Genetics and Genomics, 2007, 278(5): 493-505. [本文引用:1]
[6] 张进, 李建波, 刘伯斌, . 杨树CDPK基因家族的表达分析及功能预测[J]. 林业科学研究, 2014, 27(5): 604-611.
ZHANG J, LI J B, LIU B B, et al. Expression and functional analysis of CDPK gene family in populus[J]. Forest Research, 2014, 27(5): 604-611. (in Chinese with English abstract) [本文引用:1]
[7] SHEEN J. Ca2+-dependent protein kinases and stress signal transduction in plants[J]. Science, 1996, 274(5294): 1900-1902. [本文引用:1]
[8] SAIJO Y, HATA S, KYOZUKA J, et al. Over-expression of a single Ca2+-dependent protein kinase confers both cold and salt/drought tolerance on rice plants[J]. Plant Journal, 2000, 23(3): 319-327. [本文引用:1]
[9] SAIJO Y, KINOSHITA N, ISHIYAMA K, et al. A Ca2+-dependent protein kinase that endows rice plants with cold-and salt-stress tolerance functions in vascular bundles[J]. Plant and Cell Physiology, 2001, 42(11): 1228-1233. [本文引用:1]
[10] WEI S, HU W, DENG X, et al. A rice calcium-dependent protein kinase OsCPK9 positively regulates drought stress tolerance and spikelet fertility[J]. BMC Plant Biology, 2014, 14(1): 133. [本文引用:1]
[11] ZHU S Y, YU X C, WANG X J, et al. Two calcium-dependent protein kinases, CPK4 and CPK11, regulate abscisic acid signal transduction in Arabidopsis[J]. Plant Cell, 2007, 19(10): 3019-3036. [本文引用:1]
[12] 杜利欣, 胡宗利, 张建苓, . 番茄 SlDP1 基因的克隆、生物信息学及表达特性分析[J]. 植物研究, 2014, 34(1): 68-74.
DU L X, HU Z L, ZHANG J L, et al. Cloning, bioinformatics and expression analysis of SlDP1 gene in tomato[J]. Bulletin of Botanical Research, 2014, 34(1): 68-74. (in Chinese with English abstract) [本文引用:1]
[13] 梁志强, 孔德真, 李辉玲, . 小拟南芥 HDG12 基因的克隆、生物信息学分析及植物表达载体的构建[J]. 江苏农业科学, 2015, 43(2): 33-37.
LIANG Z Q, KONG D Z, LI H L, et al. Cloning, bioinformatics and construction of plant expression vector of HDG12 in Arabidopsis pumila[J]. Jiangsu Agricultural Sciences, 2015, 43(2): 33-37. (in Chinese) [本文引用:1]
[14] LI A L, ZHU Y F, TAN X M, et al. Evolutionary and functional study of the CDPK gene family in wheat (Triticum aestivum L. )[J]. Plant Molecular Biology, 2008, 66(4): 429-443. [本文引用:1]
[15] YU X, LI M, GAO G, et al. Abscisic acid stimulates a calcium-dependent protein kinase in grape berry[J]. Plant Physiology, 2006, 140(2): 558-579. [本文引用:1]