作者简介:刘士力(1985—),男,湖北洪湖人,博士研究生,主要从事水生动物遗传育种研究。E-mail: liushili1212@126.com
采用保守引物进行PCR成功扩增了编码翘嘴鲌生长激素的基因,该基因全长5 966 bp,其中转录单元长1 648 bp,由5个外显子和4个内含子组成。5'端和3'端侧翼序列长度分别为2 282 bp和2 036 bp,分别包含 (AAT)8 和(TTC)5T(TAA)8的微卫星序列。上游区域包含TATA框,还有一些重要的转录因子结合位点,如Pit-1、Pit-1a、CREB、AP1、GR、HNF-3、HNF-3B等转录因子。翘嘴鲌的5个外显子长度分别为64、140、117、162 和255 bp。推测的阅读框为603 bp,编码由22个氨基酸的信号肽和178个氨基酸成熟肽组成的多肽。在这个多肽中发现了5个保守的半胱氨酸残基(Cys71、Cys135、 Cys173、Cys190和Cys198)和2个可能的N-糖基化位点(145th和197th)。翘嘴鲌GH氨基酸序列与团头鲂完全相同,与草鱼只有一个氨基酸残基的差异,构建的鱼类进化树符合基本分类地位。翘嘴鲌生长激素基因4个内含子长度分别为229、103、565 和103 bp。相对外显子来说,种间内含子变异较大,其中第三内含子变异最大。该结果为进一步研究翘嘴鲌 GH基因的表达、功能及其转录调控特征奠定了分子基础。
Using conserved primers and PCR, a gene encoding topmouth culter ( Culter alburnus Basilewsky) growth hormone ( CaGH) was amplified and sequenced. The gene spans 5 966 bp, including 2 282 bp of 5'- and 2 036 bp of 3'-flanking sequences and a 1.7-kb transcription unit comprised of five exons and five introns. (AAT)8 and (TTC)5T(TAA)8 microsatellite sequences were found in the 5'- and 3'-flanking regions, respectively. The upstream region contains TATA boxes, and binding sites of important transcription factors such as Pit-1, Pit-1a, CREB, AP1, GR, HNF-3, and HNF-3B. The five exons in Culter alburnus were 64 bp, 140 bp, 117 bp, 162 bp and 255 bp in length, respectively. The complete coding sequence was 603 bp and encodes a protein with a 22 amino acid signal peptide and a 178 amino acid mature peptide. Five conserved Cys residues (Cys71, Cys135, Cys173, Cys190, and Cys198) and two possible sites of N-glycosylation (residues 145 and 197) were detected in the GH polypeptide. The amino acid sequence of GH in Culter alburnus was identical to that in Megalobrama amblycephala, and only one amino acid residue differs from Ctenpharyngodon idellus. The phylogenetic relationships among the GH amino acid sequences in fish were in accord with traditional classification. The lengths of the four introns in Culter alburnus GH gene were 229 bp, 103 bp, 565 bp and 103 bp, respectively. The variation of the introns among species was greater than that of the exons, and the variation of the third intron is the highest. These results provided the molecular basis for study of function and transcriptional regulation of the GH gene in C.alburnus, as well as the temporal expression in different developmental stages and at various nutritional levels.
生长激素(growth hormone, GH)是由动物垂体前叶分泌的一种蛋白类激素, 是影响动物生长性状的主效基因[1], 不仅具有提高饲料转化率[2], 促进肌肉中的蛋白质合成[3], 加速鱼类骨骼纵向生长[4]的重要作用, 同时也参与了精子的发生和卵母细胞的成熟[5]。作为生产性能的候选基因, 已经有不少学者在猪、牛、鸡等物种上做过研究, 并发现了一些与重要经济性状相关的多态位点[6, 7, 8]。研究表明, GH基因编码氨基酸序列高度保守, 适合鱼类高层分支进化的研究[9, 10]。在GH基因启动子区域也存在cAMP应答元件(cAMP response element, CRE)和垂体特异性转录因子1 (pituitary-specific transcription factor-1, Pit-1)的结合位点。CRE含有回文序列TGACGTCA, 或者TGACG模体[11, 12, 13], 可以与活化后的CRE结合蛋白(CRE-binding protein, CREB)结合[14]。CREB主要对cAMP等信号发生应答反应, 通过自身磷酸化实现其调节转录功能。对于虹鳟(Oncorhynchus mykiss)[15]启动子的研究表明, 其含有TGACG模体。草鱼(Ctenopharyngodon idella)[16]中含有类似CRE的结构(TGACC), 与虹鳟有1个碱基的差异, 在莫桑比克罗非鱼(Oreochromis mossambicus)[17]中还没有明确的CRE, 但它们均由cAMP调节。这表明不同鱼类GH转录调控机制是有差别的, 具有较高的可变性。
Pit-1是垂体中一种重要的转录调控因子, 对于垂体GH、PRL 和TSH 的合成具有重要的调节作用。对于虹鳟[15]、金头鲷(Sparus aurata)[18]、草鱼[16]和莫桑比克罗非鱼[19]GH启动子中Pit-1结合位点的研究表明其在脊椎动物中是保守的, 其可能在生长激素转录中具有关键作用。莫桑比克罗非鱼中cAMP对于GH表达的调节是Pit-1依赖的, 当离GH基因最近的Pit-1结合位点碱基发生突变时失去作用[17]。微卫星和小卫星存在于数种鱼GH基因的启动子或内含子中, 包括尖吻鲈(Lates calcarifer)[20]、牙鲆(Paralichthys olivaceus)[21]和金头鲷(Sparus aurata)[22]等。正是这些序列重复数目和长度的不同导致GH基因出现了复杂的多态性。当串联重复序列位于基因的调控区域时, 他们可以直接影响其表达, 从而影响引起这些基因数量性状的变化[23]。此外, 二核苷酸重复序列可以形成另外的DNA结构, 如Z-DNA[24]被证明是与多个基因的转录活性有关。
翘嘴鲌(Culter alburnus Basilewsky)隶属于鲤科(Cyprinida)、鲌亚科(Culterinae)、鲌属(Culter), 是鲌亚科中体型最大的一种鱼类, 其肉白而细嫩, 味美而不腥, 具有重要的经济价值。翘嘴鲌又称翘嘴红鲌、白条鱼、大白鱼等, 广泛分布于中国各大水系[25]。此外, 翘嘴鲌是以活鱼为主食的凶猛肉食性鱼类, 对于维持淡水水域生态系统的稳定具有重要作用, 具有良好的生态价值。近年来, 翘嘴鲌养殖规模的不断扩大, 浙江省养殖面积已达到2 000 hm2以上。开展翘嘴鲌的育种具有重要的经济意义, 采用分子标记技术为辅助手段可以提高育种效率。已有一些翘嘴鲌微卫星引物已被开发[26, 27], 但对于明确的重要功能基因中的遗传标记的研究较少。本研究采用T-A克隆了翘嘴鲌GH基因全序列, 通过对其核苷酸序列的比较分析, 以期为翘嘴鲌人工选育奠定技术基础, 同时为鲌亚科鱼类起源及进化机制研究提供理论依据。
试验用翘嘴鲌采自浙江省淡水水产研究所综合实验基地, 剪取少量尾鳍, 用无水乙醇于-20 ℃保存备用。
主要试剂:PCR 反应试剂和pMD18-T 载体购自宝日医生物技术(北京)有限公司; 胶回收试剂盒、大肠埃希菌 (Escherichia coli) DH5α 、氨苄和异丙基硫代半乳糖苷购自天根生化科技(北京)有限公司; 用于DNA提取的试剂购自生工生物工程(上海)股份有限公司。
1.2.1 DNA 提取
采用苯酚-氯仿法提取样本DNA。用1%琼脂糖凝胶检测DNA完整性, 提取DNA原液于-20 ℃保存备用。
1.2.2 引物设计
利用本实验室获得翘嘴鲌转录组中GH的mRNA序列在GenBank中进行Blast比对, 结果表明与团头鲂(AF463498)和草鱼(X60419)的相似度较高, 根据其保守区域设计7对特异性引物(表1)。引物由生工生物工程(上海)股份有限公司合成。
1.2.3 PCR 反应体系
PCR反应体系为25 μ L: 10× Buffer (含Mg2+ ) 2.5 μ L, dNTPs (各2.5 mmol· L-1) 2.0 μ L, 模板DNA (50 ng· μ L-1 ) 1.0 μ L, 上游、下游引物( 10 μ mol · L-1) 各0.5 μ L, Taq聚合酶(5 U· μ L-1) 0.2 μ L, 灭菌超纯水补足体系。
PCR反应程序:94 ℃预变性5 min; 94 ℃变性30 s, 58 ℃退火30 s, 72 ℃延伸3 min, 共32个循环; 72 ℃延伸10 min; 4 ℃保存。
1.2.4 克隆及测序
PCR 产物送生工生物工程(上海)股份有限公司测序, 如序列中包含微卫星和Poly结构导致测序不完整, 克隆后再进行测序。
1.2.5 序列分析
利用软件ContigExpress将所获得的DNA片段和已知的mRNA序列拼接在一起; 利用在线软件Alibaba 2.1分析启动子区域顺式调控元件。GH基因的mRNA及编码的氨基酸序列按照刘士力等[28]的方法进行分析。内含子的相似度通过GenBank的Blast功能计算。微卫星和小卫星的查找分别通过SSRhunter 1.3和在线软件Repfind进行。
经PCR扩增产物的电泳条带清晰, 无杂带, 片段长度在800~2 000 bp, 与对应的目的序列十分接近, 据此可初步确定获得正确的目的片段。测序拼接获得全序列5 966 bp。其碱基组成为:A+T 占47. 26% , C+G 占52. 74%。
通过与GenBank中团头鲂(Megalobrama amblycephala)(登录号:AF463498)和草鱼GH 基因的CDS序列(登录号:AY157496)比对分析, 相似度在90%以上, 由此可以认为所获得的序列为翘嘴鲌GH基因序列。将该序列提交GenBank 数据库, 获得登录号KX925976。
分析表明, 该基因DNA序列中转录单元长1 648 bp, 无微卫星和小卫星序列; 5'端和3'端侧翼序列长度分别为2 282 bp和2 036 bp, 分别包含 (AAT)8 和(TTC)5T(TAA)8的微卫星序列。翘嘴鲌GH基因转录单元包含4个内含子、5个外显子。预测的内含子均以GT开始, 以AG 结束, 符合真核生物外显子与内含子之间的剪接规律。其中4个内含子大小分别为229、103、565和103 bp, 5个外显子长度分别为64、140、117、162和255 bp; mRNA序列全长为738 bp, 5'-非翻译区(5' UTR)为54 bp, 3'-非翻译区(3' UTR)为51 bp, 开放阅读框区(ORF)为633 bp, 编码由210个氨基酸残基组成的蛋白质多肽。
获得的GH启动子(图1), 转录起始位点A在翻译起始密码子ATG上游54 bp。以转录起始位点A为+1位, -28~-23为TATA-box, 此外还有2个TATA-box位于-147~-142和-310~-305。但在TATA盒附近没有发现典型的CAAT盒。翘嘴鲌GH基因5端序列与团头鲂、草鱼的相似度分别为94%和92%。Sun等[16]对于草鱼生长激素基因启动子的研究表明, 其基本活性是由启动子中-986至-742的序列维持, 而黄体生成素受体的激活响应序列位于-616至-572这一区域。通过将这一序列进行比对发现, 其核苷酸序列完全相同。
AliBaba 2.1分析GH启动子序列发现, GH启动子含有多个转录调控位点, 包括2个Pit-1、4个Pit-1a、2个CREB、5个AP1、8个GR、4个HNF-3、2个HNF-3B、1个SP1和1个MEF-2的结合位点。
将鲤科7种鱼类和鮰科斑点叉尾鮰(Ictalurus punctatus)的GH基因比较发现, 露斯塔野鲮(Labeo rohita)和斑点叉尾鮰由于第四外显子长度和表2中所列的鱼类不同, 导致了编码氨基酸长度的差异。表2中所列其他鲤科鱼类编码区序列长度均在603 bp左右, 编码210个氨基酸。
通过预测, 翘嘴鲌GH蛋白质相对分子质量为23.61 ku, 理论等电点(isoelectric point, pI)为5.96, 分子式C1038H1683N287O317S11。其中, 亮氨酸(Lue)含量最高为10.7%。带负电荷氨基酸残基(Asp+Glu) 66个, 带正电荷氨基酸残基(Arg+Lys) 57个。脂肪族氨基酸指数为88.45。经过蛋白质序列分析, 翘嘴鲌GH基因氨基酸预测无无跨膜结构。翘嘴鲌生长激素成熟肽序列中包含由22个氨基酸组成的信号肽。在Asn155和Asn207位置上存在2个糖基化位点(天冬酰胺-天冬氨酸-丝氨酸和天冬酰胺-半胱氨酸-苏氨酸)。
通过NCBI上的BLAST蛋白质相似性分析, 翘嘴鲌GH基因cDNA 序列与团头鲂编码的氨基酸序列完全相同, 而与草鱼编码的氨基酸序列只有一个氨基酸残基差异, 同源性分别为100%和99.5%。鲤科鱼类GH氨基酸序列高度同源; 翘嘴鲌和其他鲤科鱼类一样, 均具有5个的半胱氨酸残基(Cys71、Cys145、Cys183、Cys200、Cys208), 其中的4个半胱氨酸残基非常保守, 参与了二硫键(Cys71和Cys183, Cys200和Cys208)。它们对GH的正常折叠、维持空间结构以及发挥生理功能有重要的作用。
利用MEGA5. 0 等软件, 对本研究获得的翘嘴鲌GH 氨基酸序列及GenBank数据库中获得的团头鲂、草鱼等15种鱼类GH氨基酸序列, 构建NJ系统进化树(图3)。在NJ系统进化树中, 翘嘴鲌等鲤科鱼类聚集在一起, 然后与鮰科的斑点叉尾鮰聚成一支, 露斯塔野鲮是鲤科中与翘嘴鲌关系最远的鱼类。除鳗鲡 (Anguilla japonica)单独为一支外, 其他用作参考的鱼类聚成一支。该基因的系统进化关系与传统的物种进化地位基本一致。
相对于外显子, GH基因内含子存在相对较大的差异。虽然鲷科斑点叉尾鮰也包含4个内含子, 5个外显子。但其4个内含子均与翘嘴鲌没有显著的相似性, 而且其第二和第四内含子长度与翘嘴鲌相差悬殊。在目前已公布的序列中, 团头鲂与翘嘴鲌最为相似, 第一、二内含子的相似度分别为88%和95%; 第三、四内含子完全一致。第一内含子中主要差异在于存在2个缺失, 长度分别为15 bp和9 bp。团头鲂、草鱼、鲢(Hypophthalmichthys molitrix)这三种鱼和翘嘴鲌的内含子长度较为接近, 这三种鱼的4个内含子与翘嘴鲌的平均相似度分别为88%、87%、86%和92%。露斯塔野鲮, 是鲤科中与翘嘴鲌差异较大的鱼类, 其第三内含子的长度是翘嘴鲌的2.8倍左右, 但Blast覆盖度仅为12%。此外, 在鲤科的这几种鱼类的内含子中没有发现微卫星和小卫星。
生长激素基因是物种进化中相对保守的基因, 目前对鱼类GH基因序列研究发现, 一部分鱼类由5个外显子和4个内含子组成[29, 30, 31], 一部分鱼类包含6个外显子和5个内含子[22, 32, 33], 还有少部分鱼类由4个外显子和3个内含子组成[34, 35]。现有的GH基因数据表明, 鲤科中除了鳙鱼(Aristichthys nobilis)和唐鱼(Tanichthys albonubes)外, 其余鱼类均属于第一种。鳙鱼和唐鱼中第一外显子编码区长150 bp, 对应其他鲤科鱼类第一外显子编码区和第二外显子的长度之和。在对包含翘嘴鲌在内的由5个外显子和4个内含子组成的7 种鲤科鱼类的GH基因序列结构比较发现, 外显子长度基本相同, 内含子大小存在一定程度的差异, 露斯塔野鲮是鲤科中与翘嘴鲌差异较大的鱼类, 其第三内含子的长度是翘嘴鲌的2.8倍左右。鲤科这7种鱼类中除了亲缘关系较远的露斯塔野鲮[36]第四外显子略有差异外, 其余外显子的长度完全一致。对于8 科15种鱼类GH基因编码区序列进行对比分析, 鲤科鱼类的GH基因编码区序列同源性在89%~100%, 与其他不同科的鱼类序列同源性在65%~82%, 这表明同一科鱼类之间, 生长激素基因编码区序列具有相对较高的同源性, 不同科鱼类的生长激素基因序列的同源性明显下降。
GH基因的多态性主要集中在内含子中, 如Almuly等[37]发现金头鲷GH基因非编码区内存在小卫星和微卫星[18]的重复序列, 对于内含子1中小卫星saGHFIM的研究表明具有长内含子的片段会抑制GH基因表达的活性。鲁双庆等[32]在鳜属(Siniperca)三种鱼GH第二内含子中的相同位置均发现了“ AG” 微卫星序列。翘嘴鲌GH基因5'端序列也比较保守, 与团头鲂和草鱼的相似度分别为94%和92%。还有两个关键区域序列与草鱼完全一致[16]。虽然在翘嘴鲌内含子中未发现微卫星和小卫星。但在5端启动子中发现了(AAT)8微卫星序列。在同属鲤科的团头鲂中也发现了(AAT)11微卫星序列。在鲷科中也发现了类似的现象, 金头鲷[18]中与第二个Pit-1的结合位点相邻处存在(CA)n微卫星序列, 而且等位位点高达11个, 极有可能会调节启动子的活性, 影响GH基因的表达从而与生长性状关联。在同属鲷科的真鲷[38](Pagrus major)类似位置也发现了(CA)n微卫星序列, 但在对一个野生群体进行检测时未发现多态性。
翘嘴鲌与各物种在GH基因编码区核苷酸序列上的差异表明, 尽管翘嘴鲌与其他鱼类在GH基因核苷酸水平上具有一定的保守性, 但由于不同物种间起源、进化过程中的变化, 导致它们在DNA 水平上产生差异, 这为从分子水平上研究翘嘴鲌与其他鱼类物种间的起源及进化关系等提供了理论基础。虽然唐鱼只有4个外显子, 但在GH氨基酸序列构建的NJ 系统进化树中, 其仍然与鲤科鱼类聚集在一起。除了用于系统进化分析外, 完善的翘嘴鲌GH基因序列为启动子和内含子功能的进一步研究打下了基础。
The authors have declared that no competing interests exist.