生物信息学分析优选九篇

时间：2023-09-28 15:45:05

引言：易发表网凭借丰富的文秘实践，为您精心挑选了九篇生物信息学分析范例。如需获取更多原创内容，可随时联系我们的客服老师。

生物信息学分析

第1篇

>> 抗逆性转录因子NAC的生物信息学分析酵母转录因子结合位点保守性的生物信息学分析沙棘WRI1转录因子基因的生物信息学分析白桦五个MYB转录因子的生物信息学分析植物抗病WRKY转录因子生物信息学分析苹果TCP转录因子家族生物信息学分析黄瓜DVR基因的生物信息学分析黄芩葡萄糖醛酸水解酶基因的克隆、生物信息学分析及表达人ALK－1近端启动子的生物信息学分析 FZ6基因及其蛋白的生物信息学分析玉米谷胱甘肽过氧化物酶的生物信息学分析欧文氏杆菌铁代谢相关基因的生物信息学分析拟南芥和大白菜YABBY蛋白家族的生物信息学分析丹参SmNAC1基因的克隆和生物信息学分析小菜蛾p38MAPK基因的克隆与生物信息学分析棉铃虫类胰蛋白酶的生物信息学分析不结球白菜BcGAPDH的生物信息学分析水稻2个F―box基因的生物信息学分析小菜蛾PxALP1基因的克隆与生物信息学分析斑马鱼TATA结合蛋白的生物信息学分析常见问题解答当前所在位置：l）对蛋白质序列进行二级结构预测（Secondary structure prediction）。通过WoLF PSORT工具（http：//wolfpsort.seq.cbrc.jp/）基于其氨基酸序列预测蛋白质亚细胞定位点。

2 结果与分析

2.1 系统发生树

通过系统进化分析，葡萄NAC转录因子家族共分5个大类（图1），每大类也各有不同。第Ⅰ大类包含17个葡萄NAC基因，在6种发育相关的NAC基因中，除拟南芥NAC2[9]基因位于第Ⅵ大类外全部位于第Ⅰ大类，推断第Ⅰ大类NAC基因与葡萄的生长发育相关。非生物逆境胁迫相关NAC基因全部位于第Ⅲ大类，位于此类的葡萄NAC基因共有12个，其中VvNAC45与VvNAC56两个基因同源性相对较低。其余NAC基因位于第Ⅱ、Ⅳ、Ⅴ大类。其中第Ⅳ大类NAC基因数量最多。推测拟南芥NAC2基因位于第Ⅳ大类的原因可能是其序列特异性不强或参与逆境与发育两种生命活动。

2.2 基因结构分析及染色体定位

葡萄71个NAC基因在染色体上数量分布不均匀，其中第5、第9号染色体未找到NAC基因。位于第19号染色体上的NAC基因数量最多（19个）。非生物胁迫相关NAC基因散乱分布在1、4、6、7、8、12、18、19共8条染色体上，未表现出集中性，VvNAC3基因未能定位到染色体上。葡萄的NAC基因N端都具有NAC保守结构域。

2.3 一级结构及理化性质分析

磷酸化位点分析显示，葡萄非生物逆境胁迫相关NAC蛋白中丝氨酸磷酸化位点最多，酪氨酸磷酸化位点次之。通过ProtParam程序进行理化性质分析，结果显示非逆境胁迫相关NAC蛋白既有酸性氨基酸，又有碱性氨基酸。从蛋白质稳定性上看，VvNAC26，VvNAC 42，VvNAC45为稳定蛋白，其余均为不稳定蛋白（表1）。

2.4 二级结构分析及亚细胞定位

在线二级结构预测结果显示，非生物逆境胁迫NAC蛋白中随机卷曲的比例很高（58.59%～70.35%），它起着链接其他二级结构原件的作用。此外，主要的二级结构原件为α螺旋（14.07%～30.81%）和延伸链（9.89%～20.83%），主要位于α螺旋和随机卷曲之间。在线WOLF PSORT对蛋白亚细胞定位预测显示，非生物胁迫相关NAC蛋白全部定位于细胞核。

3 结论与讨论

对葡萄71种NAC蛋白进行了系统发生树构建，染色体定位、理化性质分析，二级结构预测及亚细胞定位等方面的分析。系统发生树显示，所有的非生物逆境胁迫相关NAC蛋白都聚为一类，这与其他NAC类蛋白的研究结果相符合[10-11]，也暗示在NAC家族成员中，胁迫相应NAC类转录因子之间具有密切联系。非生物胁迫相关NAC蛋白全部定位于细胞核。由此推断，具有相近生物学功能的NAC蛋白更可能定位于相同的亚细胞结构，这与其发挥特定生物学功能密切相关。非生物逆境胁迫类NAC蛋白既有其共同点也有不同点，这些分析与研究结果，有助于对葡萄NAC基因调控葡萄的生长与抗逆机制开展进一步研究。

参考文献：

[1] Haake V， Cook D， Riechmannjl， et al.Transcription factor CBF4 is a regulator of drought adaptation in Arabidopsis [J]. Plant Physiology，2002，130（2）：639.

[2] Abeh， Yamaguchi-shinozaki K， Urao T， et al. Role of Arabidopsis MYC and MYB homologs in drought and abscisic acid―regulated gene expression [J]. The Plant Cell Online， 1997，9（10）：1859.

[3] Nuruzzaman M， Manimekalai R， Sharoni A M， et al. Genome-wide analysis of NAC transcription factor family in rice[J]. Gene，2010， 465：30-44.

[4] Kazuo N， Hironori T， Junya M， et al. NAC transcription factors in plant abiotic stress responses[J]. Biochimica et Biophysica Acta， 2012， 1 819：97-103.

[5] Wang N， Zheng Y， Xin H P， et al. Comprehensive analysis of NAC domain transcription factor gene family in Vitis vinifera[J]. Plant Cell Rep，2013，32：61-75.

[6] Fujita M， Fujita Y， Maruyama K， et al. A dehydration―induced NAC protein.RD26，is involved in a novel ABA dependent tress―signaling pathway [J]. The Plant Journal， 2004， 39（6）：863-876.

[7] Tranlsp， Nakashima K. Isolation and functional analysis of Arabidopsis stress-inducible NAC transcription factors that bind to a drought-responsive cis-element in the early responsive to dehydration stress 1 promoter [J]. The Plant Cell Online， 2004，16（9）：2 481.

[8] Fang Y， You J， Xie K， et al. Systematic sequence analysis and identification of tissue-specific or stress-responsive genes of NAC transcription factor family in rice[J]. Molecular Genetics and Genomics，2008， 280（6）：547-563.

[9] He X J， Mu R L， Cao W H， et al. AtNAC2， a transcription factor downstream of ethylene and auxin signaling pathways， is involved in salt stress response and lateral root development[J]. The Plant Journal ，2005， 44： 903-916.

第2篇

>> 黄瓜DVR基因的生物信息学分析斜纹夜蛾核型多角体病毒Ⅱ基因组DNA同源重复区生物信息学分析人ALK－1近端启动子的生物信息学分析酵母转录因子结合位点保守性的生物信息学分析 FZ6基因及其蛋白的生物信息学分析黔北麻羊RERGL基因cDNA克隆与生物信息学分析不同物种GATA—2基因编码区生物信息学分析玉米谷胱甘肽过氧化物酶的生物信息学分析石榴等观赏植物DFR基因生物信息学分析欧文氏杆菌铁代谢相关基因的生物信息学分析拟南芥和大白菜YABBY蛋白家族的生物信息学分析丹参SmNAC1基因的克隆和生物信息学分析小菜蛾p38MAPK基因的克隆与生物信息学分析棉铃虫类胰蛋白酶的生物信息学分析植物抗病WRKY转录因子生物信息学分析葡萄NAC转录因子的生物信息学分析抗逆性转录因子NAC的生物信息学分析苹果TCP转录因子家族生物信息学分析黑麦草EST―SSR分子标记开发及生物信息学分析不结球白菜BcGAPDH的生物信息学分析常见问题解答当前所在位置：l）在线工具。病毒基因组结构图利用DNAStar Package中的SeqBuilder软件绘制。

⑤蛋白质跨膜结构和理化性质的预测及分析病毒蛋白质的跨膜结构利用TMpred （）在线工具预测。蛋白质理化性质利用ExPASy的ProtParam（http：///protparam/）在线工具进行分析。

2 结果与分析

2.1 采集样品DNA病毒全长克隆和聚类分析

①TYLCV病毒分子鉴定通过用TYLCV特异引物TYLCV-F/TYLCV-R对样品DNA进行PCR鉴定，结果显示，3个样品TYLCV-SXYL2、SXYL3和SXYL4都为带毒植株（图1），并克隆测序得到519 bp序列。以双生病毒DNA-B组分通用引物PCRc1/PBLv2040进行PCR扩增，未得到预期500～650 bp大小的条带，以双生病毒卫星DNA β鉴定通用引物Beta01/Beta02进行PCR反应，也未得到预期1 200～1 400 bp大小的条带。结果表明，陕西杨凌地区侵染番茄的TYLCV为不含DNA-B且不伴随卫星DNA β的单组分病毒，只含DNA-A。

②DNA-A全长的同源矩阵选择NCBI登录的国内外不同地区分离的19个TYLCV分离物（表2），用DNAMAN多序列比对后构建同源矩阵（表3）。发现杨凌区3个分离物TYLCV-SXYL2、SXYL3、SXYL4核苷酸序列全长之间相似度为99.3%～99.4%，且和TYLCV-IS相似度为97.7%～97.8%。杨凌区的3个病毒分离物与山东寿光分离物TYLCV-SDSG的相似度都为99.6%，与陕西泾阳的分离物TYLCV-SX8的相似度都为99.1%。

③基于DNA-A全长的系统进化树陕西杨凌3个TYLCV分离物同19个不同国家地区的TYLCV通过MEGA5.05软件中MUSCLE算法多序列比对后，用邻近相连（Neighbor-Joining）法构建系统进化树（图2）发现，杨凌分离物和山东寿光分离物TYLCV-SDSG、河北石家庄分离物TYLCV-SJZ1、陕西泾阳分离物TYLCV-SX8、安徽分离物TYLCV-AH1、北京分离物TYLCV-Beijing3、美国分离物TYLCV-USA及浙江分离物TYLCV-ZJ8在同一小支上，且与山东寿光分离物TYLCV-SDSG亲缘关系最近。上述分离物还与上海分离物TYLCV-SH2[9]、日本分离物TYLCV-Janpan、荷兰分离物TYLCV-Netherlands和以色列株系TYLCV-IS在同一大支上。意大利撒丁岛分离物TYLCSV和西班牙马加拉分离物TYLCMalV在同一支。广东分离物TYLCGV-G3和越南分离物TYLCVNV在同一支。新疆分离物TYLCV-XJ26-4和广西分离物中国番茄黄化曲叶病毒TYLCCNV为同一支。云南分离物TYLTHV-Y72和泰国分离物TYLCTHV在同一支。由此可知，我国番茄黄化曲叶病毒的分布和种类同样有较大的复杂性和多样性，而杨凌番茄黄化曲叶病毒分离物很可能由最早发现的TYLCV-IS发展而来，且与山东寿光分离物亲缘关系最近，基于杨凌地区与山东寿光种苗交易频繁的现状，推测很可能是因为感病幼苗交易带来了病毒传播与蔓延。

2.2 病毒DNA-A全长序列和基因组结构

设计背向引物PCR扩增并克隆得到病毒DNA-A全长。测序结果表明，TYLCV-SXYL2、SXYL3、SXYL4（GenBank登录号依次为KC138545、KC138544、KC138543）全长都为2 781 nt，共编码6个开放阅读框（图3），在病毒链上编码外壳蛋白和AV2蛋白，在互补链上编码复制相关蛋白、转录激活子、复制增强子和AC4蛋白。在AC1和AV2之间有313 nt的非编码区，也叫基因间隔区。

①基因间隔区基因间隔区（Intergenic Region，IR）位于1～147 nt和2 616～2 781 nt，共含313个核苷酸，有调控病毒复制和转录起始必须的元件，含有病毒复制和转录所必需的结构域以及茎环结构，茎环顶端有保守的九核苷酸TAATATT/AC序列。由于IR区相对于编码区选择压小，也是病毒变异最活跃的区域。通过对TYLCV-SXYL2、SXYL3、SXYL4 和 TYLCV-IS的IR区核苷酸序列比较（图4）发现，其特征序列中茎环顶端的九核苷酸TAATATT/AC（位于2 775～2 781 nt及1～2 nt）保守序列、TATA box和TATATA box，与TYLCV-IS一致，但CAAT box和5～8 nt短重复序列已表现出与TYLCV-IS有较大差异，其中短重复序列是Rep蛋白的结合位点。

②编码蛋白的结构和性质分析为进一步了解杨凌番茄黄化曲叶病毒分离物编码蛋白质氨基酸序列的变异特点和更好地进行蛋白质性质分析，将TYLCV-SXYL4与19个其他地区分离物及TYLCV-SXYL2、SXYL3编码的6个蛋白质氨基酸序列相似度进行比较分析（表5），结果显示，杨凌3个分离物和越南番茄黄化曲叶病毒TYLCVNV、以色列TYLCV-IS转录激活子TrAP的氨基酸序列完全相同。TYLCV- SXYL3、 SXYL4和山东寿光分离物TYLCV-SDSG及河北石家庄分离物TYLCV-SJZ1复制增强子REn的氨基酸序列完全相同，且与TYLCV-IS的REn氨基酸序列相比，第58位由缬氨酸（Valine， V）突变为丙氨酸（Alanine，A）、第59位由甲硫氨酸（Methionine，M）突变为亮氨酸（Leucine，L）、第94位由天冬氨酸（Aspartic acid，D）突变为酪氨酸（Tyrosine，Y）、第124位由谷氨酸（Glutamic acid，E）突变为丙氨酸。TYLCV-SXYL2、SXYL3、SXYL4和日本分离物TYLCV-Japan、山东寿光分离物TYLCV-SDSG、上海分离物TYLCV-SH2、河北石家庄分离物TYLCV-SJZ1的C4蛋白氨基酸序列完全相同，与TYLCV-IS的C4蛋白氨基酸序列相比，第64位由脯氨酸（Proline，P）突变为丝氨酸（Ser，S）、第67位由甲硫氨酸突变为异亮氨酸（Isoleucine，I）、第84位由赖氨酸（Lysine，K）突变为精氨酸（Arginine，R）。

通过TMpred在线工具分别对杨凌3个病毒分离物编码的6个蛋白进行跨膜结构预测发现，CP、 Rep、REn存在跨膜结构（图5），而V2、TrAP、C4为胞内蛋白；杨凌3个病毒分离物的CP、V2、Rep和REn氨基酸序列有1～2个位点的区别，没有影响蛋白质的跨膜结构的预测结果。

利用ExPasy的ProtParam在线工具对TYLCV-SXYL2、SXYL3、SXYL4和TYLCV-IS编码蛋白的理论等电点、不稳定系数和亲水性平均系数进行预测和比较分析（表6），发现杨凌番茄黄化曲叶病毒分离物和TYLCV-IS编码AV2蛋白和REn的理论等电点差异较大。按不稳定系数40为不稳定蛋白推测，CP、V2、TrAP、C4为不稳定蛋白，Rep和REn为稳定蛋白。

3 讨论与结论

为了进一步明确引起杨凌地区不同番茄主产区番茄黄化曲叶病害的病原种类和分子特征，依据Begomovirus分类中同时满足外壳蛋白氨基酸序列相似度>90%和核苷酸全长相似性>89%才可能为同一病毒的不同分离物的标准[10]，本研究在杨凌区3个不同番茄主产区调查采样并对全基因组进行了测序和基因组结构分析。本研究表明，在杨凌区五泉、揉谷和李台的番茄主产区引起番茄黄化曲叶病的病原确为TYLCV-IS株系的不同分离物（TYLCV-SXYL2、TYLCV-SXYL3、TYLCV-SXYL4），经鉴定，这3个分离物都为单组分双生病毒且不伴随卫星分子。李云洲等[11]克隆了杨凌地区西北农林科技大学园艺实验场番茄黄化曲叶病毒外壳蛋白基因后发现，其氨基酸序列与以色列株系TYLCV-IS相似度>90%。

陕西省泾阳县2010年暴发番茄黄化曲叶病

后[12]，杨凌地区各大番茄主产区在2011年相继发现番茄黄化曲叶病。但由系统进化树构建及病毒编码的6个蛋白氨基酸相似度比对结果发现，杨凌与山东寿光分离物TYLCV-SXSG亲缘关系比与地理位置最近的泾阳分离物TYLCV-SX8的近，病毒蛋白特别是TYLCV-SXYL3、SXYL4编码的REn的氨基酸序列相似度与TYLCV-SDSG达100%，与泾阳TYLCV-SX8仅为97.8%，这说明了植物病毒的传播流行不仅受地理位置、气候环境的影响，人为因素也起着越来越重要的作用。

虽然TYLCV基因组小，编码的蛋白数量有限，但其与寄主的互作及致病机理仍然不清楚[13]。本研究对不同TYLCV编码的蛋白质间的氨基酸相似度、蛋白质的理化特性和跨膜结构进行了生物信息学分析及比较，表明CP、Rep、REn为跨膜蛋白，V2、 TrAP、C4为胞内蛋白，Rep和REn为稳定蛋白，CP、 V2、TrAP、C4为不稳定蛋白。

参考文献

[1] Foolad M R， Panthee D R. Marker-assisted selection in tomato breeding[J]. Critical Reviews in Plant Sciences， 2012， 31（2）： 93-123.

[2] Lefeuvre P， Martin D P， Harkins G， et al. The spread of tomato yellow leaf curl virus from the Middle East to the world[J]. PLoS Pathogens， 2010， 6（10）： e1001164.

[3] Pan H P， Chu D， Yan W Q， et al. Rapid spread of tomato yellow leaf curl virus in China is aided differentially by two invasive whiteflies[J]. PLoS One， 2012， 7（4）： e34817.

[4] Liu B M， Preisser E L， Chu D， et al. Multiple forms of vector manipulation by a plant-infecting virus： Bemisia tabaci and tomato yellow leaf curl virus[J]. Journal of virology， 2013， 87（9）： 4 929-4 937.

[5] 李常保，柴敏，李季，等.北京番茄黄化曲叶病毒病的发生及分子检测[J].中国蔬菜， 2010（1）：28-30.

[6] Rojas M R， Gilbertson R L， Maxwell D P. Use of degenerate primers in the polymerase chain reaction to detect whitefly-transmitted geminiviruses[J]. Plant Disease， 1993， 77（4）： 340-347.

[7] Briddon R W， Bull S E， Mansoor S， et al. Universal primers for the PCR-mediated amplification of DNA β[J]. Molecular Biotechnology， 2002， 20（3）： 315-318.

[8] Tamura K， Peterson D， Peterson N， et al. MEGA5： molecular evolutionary genetics analysis using maximum likelihood， evolutionary distance， and maximum parsimony methods[J]. Molecular biology and evolution， 2011， 28（10）： 2 731-2 739.

[9] Zhang Y P， Zhu W M， Cui H M， et al. Molecular identification and the complete nucleotide sequence of TYLCV isolate from Shanghai of China[J]. Virus Genes， 2008， 36（3）： 547-551.

[10] Fauquet C M， Bisaro D M， Briddon R W， et al. Revision of taxonomic criteria for species demarcation in the family Geminiviridae， and an updated list of begomovirus species[J]. Archives of Virology， 2003， 148（2）： 405-421.

[11] DiazPendon J A， Truniger V， Nieto C， et al. Advances in understanding recessive resistance to plant viruses[J]. Molecular Plant Pathology， 2004， 5（3）： 223-233.

第3篇

关键词：植物；WRKY转录因子；抗病；生物信息学

中图分类号：S718.46；Q7 文献标识码：A 文章编号：0439-8114（2014）05-1191-05

植物在长期进化过程中形成了一系列机制，以适应和抵御各种生物和非生物逆境，在众多的适应性机制中，基因表达的转录调节在植物应答环境信号刺激反应过程中起着重要作用。转录因子是植物中最重要的一类调节基因。WRKY是近年来新发现的植物特有的新型锌指型转录调控因子，是一类植物特有的转录因子家族，因在其N-端含有由WRKYGQK组成的高度保守的7个氨基酸序列而得名，WRKY基因首先被克隆于甘薯[1]，随后在约20多种植物中证实存在WRKY蛋白，并阐明了相应的分子生物学功能[2]，WRKY家族转录因子主要与植物的抗逆性和衰老等生理过程有关。病原菌、伤害和植物激素类物质等多种外界因素均能诱导WRKY基因的表达[3]。本研究以GenBank上登录的拟南芥（Arabidopsis thaliana）、欧芹（Petroselinum crispum）、辣椒（Capsicum annuum L.）、水稻（Oryza sativa L.）和毛白杨（Populus tomentosa）5个物种的22个WRKY家族抗病转录因子为材料，利用生物信息学方法研究该转录因子编码区的变异，为其他植物WRKY抗病基因克隆及其研究提供理论依据。

1 材料与方法

1.1 供试材料

数据资料来源于美国国立生物技术信息中心NCBI（http：//ncbi.nlm.nih.gov/）核苷酸数据库和国家水稻数据中心（http：///），其中拟南芥有13种，AtWRKY40 NM_106732、 AtWRKY60 NM_128058、 AtWRKY48 NM_124329、AtWRKY25 NM_128578，对丁香假单胞菌起负调控作用[4-6]；AtWRKY18NM_119329的中度水平表达会引起PR基因表达及对丁香假单胞菌的抗性增强[7]；AtWRKY41 NM_117177具有双重调控作用，能够抵抗细菌和真菌病原物的重要下游基因的产物，抗丁香假单胞菌[8]；AtWRKY70 NM_115498，参与两条抗性信号转导途径的调控交叉点，即通过激活SA介导的抗病信号转导途径，同时又抑制JA介导的抗病信号转导，调控拟南芥的抗病反应，主要对丁香假单胞菌起抗病作用[9]；AtWRKY33 NM_129404作为JA/ET介导途径中的正调控子，在抗真菌病原菌方面发挥作用，如防治灰霉病[10]；AtWRKY3 NM_126385对抗腐生病原菌起正调控作用；AtWRKY4 AF425835可以抗青枯病与腐生病原菌，超表达时对假单胞菌有毒小种的抗性增强，对软腐病菌抗性减弱[11]；AtWRKY29 NM_118486是MAPK通路中可作为典型的WRKY基因参与拟南芥植株的抗病信号的转导[12]；AtWRKY6 NM_104910可以抗细菌、病毒、卵菌和真菌[13]；AtWRKY27 AF418310抗青枯病[14]。辣椒有3种，CaWRKY-a AY391747抗烟草花叶病毒[15]；CaWRKY2 DQ402421抗丁香假单胞菌[16]；CaWRKY1 AY229992通过负调控作用抗病菌[17]。欧芹3种，PcWRKY4 AF204925、PcWRKY5 AF204926均为抗大豆疫霉菌的激发子[18]；PcWRKY1 PCU48831抗大豆疫霉菌[19]。毛白杨有1种，PtWRKY23 EF051079抗叶锈病[20]。水稻2种，OsWRKY71 AB190817参与赤霉素信号传导，脱落酸介导的信号传导，依赖于R基因的防卫反应信号途径，抗白叶枯病；OsWRKY13 EF143611参与茉莉酸介导的信号传导、水杨酸介导的信号途径，抗白叶枯病和稻瘟病。

1.2 转录因子系统发育树的构建

利用Maga 5.0软件对NCBI数据库中搜索到的对病原菌有调控作用的转录因子和基因全长序列进行系统进化树的构建。采用Neighbor-Joining法构建系统发育树，对生成的系统发育树进行Bootstrap校正，得到最终的系统发育树。

1.3 转录因子保守基序的分析

利用在线MEME 4.8.0软件（http：//meme.sdsc.edu）对转录因子的氨基酸序列进行保守基序分析。

1.4 转录因子编码蛋白质的三级结构分析

利用在线CPHmodels工具对9种蛋白质进行同源建模，并利用高级结构预测软件RasMol对各转录因子和基因编码的蛋白质三维结构进行分析。

2 结果与分析

2.1 不同植物抗病WRKY转录因子系统发育树的构建

对22个WRKY家族抗病转录因子进行系统发育树构建，结果（图1）表明，可以将这22个抗病WRKY转录因子分为2大类群，7个亚类群。第一大类群中的欧芹PcWRKY1，辣椒CaWRKY-a、CaWRKY2，拟南芥AtWRKY4、AtWRKY3、AtWRKY25、AtWRKY33都含有两个WRKY结构域。拟南芥WRKY抗病转录因子中对腐生病原菌起正调控作用的为AtWRKY3和AtWRKY4，二者抗腐生病原菌，起正调控作用[12]。

欧芹PcWRKY1对大豆疫霉菌有抗性作用[19]，拟南芥AtWRKY33对灰霉病起抗性作用[11]，而辣椒CaWRKY-a对烟草花叶病毒起抗性作用。从系统发生树（图1）上可以看出，这3个转录因子组成第一个亚类群，其中拟南芥AtWRKY33与辣椒CaWRKY-a亲缘性相近，而与欧芹PcWRKY1的亲缘性次之，但目前的研究表明其在抗病原理上并不相同，有待进一步研究。

拟南芥AtWRKY25和辣椒CaWRKY2聚为第二亚类群，二者均对丁香假单胞菌起调控作用；拟南芥AtWRKY3和AtWRKY4聚为第三亚类群，二者均对腐生病原菌起调控作用。

拟南芥AtWRKY48、毛白杨PtWRKY23和辣椒CaWRKY1聚为第四亚类群。研究表明，拟南芥AtWRKY48对丁香假单胞菌起负调控作用[5]，辣椒CaWRKY1对丁香假单胞菌、烟草花叶病毒等起负调控作用[17]，毛白杨PtWRKY23对叶锈病起抗性作用。

拟南芥AtWRKY6、AtWRKY18、AtWRKY60、AtWRKY40，水稻OsWRKY71和欧芹PcWRKY4聚为第五亚类群，其中对细菌、真菌、卵菌、病毒起抗性作用的拟南芥AtWRKY6[13]单独成一类，拟南芥AtWRKY18、AtWRKY60和AtWRKY40均对假单胞菌有抗性作用[4，7]，而拟南芥AtWRKY18和水稻OsWRKY71均会引起R基因表达抗病，且都是通过SA代谢途径起到抗病作用[4]，而欧芹PcWRKY4为抗大豆疫霉菌因子。

拟南芥AtWRKY27、AtWRKY29和水稻OsWRKY13聚为第六亚类群。在抗病方面，拟南芥AtWRKY27抗青枯病，AtWRKY29是MAPK通路中能够抵抗细菌和真菌病原物的重要下游基因的产物，水稻OsWRKY13参与茉莉酸介导的信号传导、水杨酸介导的信号途径，抗白叶枯病和稻瘟病。

拟南芥AtWRKY41、AtWRKY70与欧芹PcWRKY5聚为第七亚类群。研究表明，它们均属于锌指结构C2-HC（C-X7-C-X23-H-X1-C）型[21]，其中拟南芥AtWRKY41与AtWRKY70均对细菌具有抗病性，但抗病途径并不相同[8，10]，而欧芹PcWRKY5对大豆疫霉菌因子有抗性，它们在抗病方面并不完全相同。

2.2 不同植物抗病WRKY转录因子保守基序的分析

由图2可知，22个抗病的WRKY转录因子都具有保守基序1和2，部分WRKY转录因子之间也有共性。系统发育树中第一大类群的1、2、3亚类群中的欧芹PcWRKY1，辣椒CaWRKY-a、CaWRKY2，拟南芥AtWRKY4、AtWRKY3、AtWRKY25和AtWRKY33都具有基序9和基序12，而第一大类群的其他亚类群和第二大类群的其他 WRKY转录因子都不具有基序9和基序12。

第五亚类群的拟南芥AtWRKY6、AtWRKY18、AtWRKY60和AtWRKY40，水稻OsWRKY71，欧芹PcWRKY4都具有基序5和基序6，而第一大类群的其他亚类群和第二大类群的其他WRKY转录因子都不具有基序5和基序6。第四亚类群中辣椒CaWRKY1和毛白杨PtWRKY23特有的基序为基序18。第七亚类群的拟南芥AtWRKY41和AtWRKY70，欧芹PcWRKY5都具有基序17。研究表明，拟南芥AtWRKY18和水稻OsWRKY71通过水杨酸代谢途径抗病[4]，基序分析表明，二者共有基序1、2、4、5、6和14。拟南芥WRKY转录因子中对腐生病原菌抗性起正调控作用的AtWRKY4和AtWRKY3都具有基序11和基序10。许多拟南芥WRKY转录因子作为防卫信号的负调控因子起作用，如AtWRKY18、AtWRKY25、AtWRKY27、AtWRKY40、AtWRKY41、AtWRKY48和AtWRKY 60，这些WRKY转录因子都具有基序1、2、6和5。拟南芥AtWRKY70编码的蛋白质参与两条抗性信号转导途径，一是通过激活SA介导的抗病信号转导途径，二是抑制JA介导的抗病信号转导途径，从而调控拟南芥的抗病反应[10]，其仅有基序1、2、19和20。

2.3 不同植物抗病转录因子编码蛋白质的三级结构分析

高级结构决定蛋白质生物学功能，对蛋白质高级结构的预测和分析，有助于理解蛋白质结构与功能之间的相关性[22]。由图3可知，拟南芥AtWRKY4和AtWRKY25转录因子编码的蛋白质三级结构相似，均属于抗细菌型转录因子[6，12]。欧芹PcWRKY1和辣椒CaWRKY-a转录因子编码的蛋白质三级结构相似，辣椒CaWRKY-a对烟草花叶病毒具有抗性作用，而欧芹PcWRKY1对大豆疫霉菌有抗性作用。水稻OsWRKY13、欧芹PcWRKY4和PcWRKY5、拟南芥AtWRKY18和AtWRKY40编码的蛋白质三级结构相似。辣椒CaWRKY1和毛白杨PtWRKY23，拟南芥AtWRKY48和AtWRKY33编码的蛋白质三级结构相似，但其功能不尽相同[5，10]，有待进一步研究。研究表明，拟南芥AtWRKY18和AtWRKY6，欧芹PcWRKY1以及水稻OsWRKY13的C末端结构域可与（T）（T）TGAC（C/T）序列（W-box）相结合，产生特异性作用，参与植物防卫反应作用[23，24]。

3 小结

通过对22个抗病WRKY家族转录因子进行系统发生树、基序以及蛋白质三级结构分析，得出22个抗病WRKY转录因子分为2个大类群，7个亚类群。第一大类群由欧芹PcWRKY1、PcWRKY4，辣椒CaWRKY1、 CaWRKY-a、 CaWRKY2，拟南芥AtWRKY4、 AtWRKY3、 AtWRKY25、 AtWRKY33、AtWRKY48、AtWRKY6、AtWRKY18、AtWRKY60和AtWRKY40，毛白杨PtWRKY23，水稻OsWRKY71组成。拟南芥AtWRKY41、AtWRKY70、AtWRKY27和AtWRKY29，欧芹PcWRKY5，水稻OsWRKY13组成第二大类群。22个转录因子都具有基序1和2，系统发育树中第一大类群中的拟南芥AtWRKY4和AtWRKY25，欧芹PcWRKY1和辣椒CaWRKY-a具有相似的蛋白质三级结构，都具有基序9和基序12，拟南芥AtWRKY33和AtWRKY48具有相似的蛋白质三级结构，都具有基序18；系统发育树中第四亚类群中的辣椒CaWRKY1和毛白杨PtWRKY23具有相似的蛋白质三级结构。

参考文献：

[1] ISHIGURO S， NAKAMURA K.Characterization of a cDNA encoding a novel DNA-binding protein，SPF1，that recognizes SP8 sequences in the 5’upstream regions of genes coding for sporamin and β-amylase from sweet potato[J]. Mol Gen Genet.1994，244（6）：563-571.

[2] WU K L，GUO Z J，WANG H H， et al. The WRKY family of transcription factors in rice and Arabidopsis and their origins[J].DNA Res，2005，12（1）：9-26.

[3] EULGEM T， RUSHTON P J， ROBATZEK S， et al. The WRKY superfamily of plant transcription factors[J].Trends in Plant Science，2000，5（5）：200-206.

[4] XU X P， CHEN C H， FAN B F，et al. Physical and functional interactions between pathogen-induced Arabidopsis WRKYl8，WRKY40 and WRKY60 transcription factors[J]. The Plant Cell，2006，18（5）：1310-1326.

[5] XING D H， LAI Z B， ZHENG Z Y， et al. Stress-and pathogen-induced Arabidopsis WRKY48 is a transcriptional activator that represses plant basal defense[J]. Mol Plant，2008，1（3）：459-470.

[6] ZHENG Z， QAMAR S A， CHEN Z， et al. Arabidopsis WRKY33 transcription factor is required for resistance to necrotrophic fungal pathogens[J].Plant J，2006，48（4）：592-605.

[7] CHEN C， CHEN Z. Potentiation of developmentally regulated plant defense response by AtWRKY18，a pathogen-induced Arabidopsis transcription factor[J]. Plant Physiology，2002，129（2）：706-716.

[8] ASAI T， TENA G， PLOTNIKOVA J， et al. MAP kinase signalling cascade in Arabidopsis innate immunity[J]. Nature，2002，415：977-983.

[9] LI J， BRADER G， PALVA E T. The WRKY70 transcription factor：A node of convergence for jasmonate-mediated and salicylate-mediated signals in plant defense[J].The Plant Cell，2004，16（2）：319-331.

[10] ZHENG Z， MOSHER S L， FAN B， et al. Functional analysis of Arabidopsis WRKY25 transcription factor in plant defense against Pseudomonas syringae[J]. BMC Plant Biology，2007（7）：1-13.

[11] RAMAMOORTHY R， JIANG S Y， KUMAR N，et al. A comprehensive transcriptional profiling of the WRKY gene family in rice under various abiotic and phytohormone treatments[J]. Plant Cell Physiology，2008，49（6）：865-879.

[12] LAI Z B， VINOD K M， ZHENG Z Y， et al. Roles of Arabidnpsis WRKY3 and WRKY4 transcription factors in plant responses to pathogens[J]. BMC Plant Biology，2008（8）：1-13.

[13] CHEN W Q， PROVART N J， GLAZEBROOK J， et al. Expression profile matrix of Arabidopsis transcription factor genes suggests their putative functions in response to environmental stresses[J]. The Plant Cell，2002，14（3）：559-574.

[14] MUKHTAR M S， DESLANDES L， AURIAC M C， et al. The Arabidopsis transcription factor WRKY27 influences wilt disease symptom development caused by Ralstonia solanacearum[J].Plant J，2008，56（6）：935-947.

[15] PARK C J， SHIN Y C， LEE B J， et a1. A hot pepper gene encoding WRKY transcription factor is induced during hypersensitive response to Tobacco mosaic virus and Xanthomonas campestris[J]. Planta，2006，223（2）：168-179.

[16] OH S K， YI SY， YU S H， et a1. CaWRKY2，a chili pepper transcription factor，is rapidly induced by incompatible plant pathogens[J].Mol Cells，2006，22（1）：58-64.

[17] OH S K， BAEK K H， YI S Y， et al. Capsicum annuum WRKY protein CaWRKY1 is a negative regulator of pathogen defense[J].New Phytologist，2008，177（4）：977-989.

[18] CORMACK R S， EULGEM T， RUSHTON P J， et al. Leucine zipper-containing WRKY proteins widen the spectrum of immediate early elicitor-induced WRKY transcription factors in parsley[J]. Biochimica et Biophysica Acta，2002， 1576（1-2）：92-100.

[19] ULGEMT， RUSHTON P J， SEHMELZER E， et al. Early nuclear events in plant defence signaling：Rapid gene activation by WRKY transcription factors[J]. EMBO J，1999（18）：4689-4699.

[20] WIM G， MANSOUR K， KRZYSZTOF W， et al. A role for AtWRKY23 in feeding site establishment of plant-parasitic nematodes[J]. Plant Physiology，2008，148；358-368.

[21] 田云，卢向阳，彭丽莎，等.植物WRKY转录因子结构特点及其生物学功能[J]. 遗传，2006（12）：1607-1612.

[22] 陈克克，武雪.植物查耳酮异构酶生物信息学分析[J].生物信息学，2009，7（3）：163-167.

第4篇

（1．中国医学科学院北京协和医学院药用植物研究所，北京 100193；2．中国医学科学院药用植物研究所云南分所，

云南景洪 666100；3．广西药用植物园，南宁 530023；4．广西中医药大学，南宁 530001）

摘要：FOS蛋白作为一类核蛋白转录因子，在调控细胞生长、分裂、增殖、分化乃至程序性死亡等方面具有重要的作用，它的表达影响了许多生命活动和过程，引起了人们的广泛关注，并在学习记忆及的标记方面吸引了学者的眼球。对FOS蛋白的作用进行了综述，并对人、大鼠及小鼠FOS蛋白进行了生物信息学分析，旨在为FOS蛋白在生理学方面的研究提供参考依据。

关键词：FOS蛋白；转录因子；生物信息学

中图分类号：Q816；Q811．4 文献标识码：A 文章编号：0439－8114（2015）07－1537-06

DOI:10.14088/j.cnki.issn0439-8114.2015.07.001

FOS是c－fos基因转录产生的成熟mRNA编码的一个核磷蛋白。c－fos基因是人或动物细胞中固有的正常基因，属于即刻早期应答基因（Immediate early response genes，IEG），FOS作为一类核蛋白转录因子，在调控细胞生长、分裂、增殖、分化乃至程序性死亡等方面具有重要作用。FOS蛋白和c－fos基因受到广泛的关注，研究不断深入。本文就FOS蛋白的作用及其在性行为方面的研究进行了论述，对人、大鼠及小鼠的FOS蛋白进行了生物信息学分析。

1 FOS蛋白

c－fos基因高度保守，属多基因家族，与其同族的还有fos－B，fos－1和fros－2。c－fos可在多种因素诱导下迅速地表达，其转录激活在5 min内即可产生，一般维持15～20 min，c－fos mRNA的蓄积在刺激后30～45 min可达高峰，半衰期为12 min。FOS蛋白合成后即刻转入细胞核内，一般在刺激后20～90 min即可检出，60～90 min达峰值，可持续2～5 h，半衰期为2 h［1］。

2 FOS蛋白的作用

在原癌基因的研究中对IEG产物的研究提示FOS蛋白可能是神经元被刺激激活的一种标志［2］。现代学者认为，FOS蛋白参与细胞的正常分化、生长以及学习、记忆等过程，在脑内与皮层、海马、边缘系统、背海马、纹状体内FOS蛋白的表达密切相关［3－7］。在病理状态下与许多疾病的发生、发展有关，如宫颈癌［8］、癫痫［9］。目前FOS蛋白表达还用于偏头痛治疗药物筛选、药效评价和发病机理研究模型的建立［10］、鉴别生前电击与死后电击［11］、作为临床提示脑部受伤时间的参考指标［12］。

FOS蛋白参与神经肽的调节，与神经元的可塑性有关，如细胞水平记忆的形成、神经元损伤后的再生等［1］。当受到如脑缺血、脑出血、血管性痴呆、痫性发作、热应激、恐惧和愤怒应激等刺激后，其在数分钟内做出反应，导致中枢神经系统不同区域出现不同数量的FOS蛋白表达［13］，如室旁核［14，15］、下丘脑视上核、下丘脑、杏仁核［16］等，在对外界刺激-转录耦联的信息传递过程中起着核内第三信使的重要作用［17］，且各种急性应激所致小鼠空间学习记忆功能的改变与FOS蛋白表达的上调有关，其表达在应激后1 h明显增加［18］。Moore等［19］研究发现，FOS蛋白的持续表达是细胞终末分化的标志及发生死亡的先兆［20］，同时还能抑制使细胞维持生存的一些基因的表达，维持着随后的细胞死亡过程并持续很长时间［21］。

3 FOS蛋白与性行为

多年的研究发现大脑接收相关的信号，FOS蛋白的表达可作为与性行为的各个方面尤其是相关的神经活动的标志物［22－24］，并且FOS蛋白随着性行为的增加而表达增高［25－27］，其表达可能与感觉输入或行为输出有关，或者两者都有，人们普遍认为诱导FOS蛋白表达与感觉信息的处理比触发更相关［28］。

现在FOS蛋白已被用于雄性和雌性啮齿动物大脑性行为的图谱功能网络的绘制［29，30］，并且使用FOS蛋白作为标志物具有病变而不会影响细胞分辨率的优势［31－35］。由于分辨率大，时FOS蛋白的增加发生在内侧视前区、杏仁核、条纹终末核、中央被盖区［36－39］、束旁丘脑核［26］、附属嗅球、伏隔核、腹外侧隔、条纹床核、内侧视前区、下丘脑室旁核、腹内侧核、杏仁核、杏仁海马区、腹侧被盖区等。这些脑区域都是性行为调节下的神经网络的部分［40］。总之插入和诱导了FOS蛋白在雄鼠大脑区域中的表达。研究中还发现许多性刺激后FOS蛋白表达的区域是控制雌性性行为和繁殖功能不同方面的区域。在大鼠中，当具有性经验的雄性接触雌性但还没有开始骑跨时在内侧视前区尾部内有FOS蛋白的感应现象［25］，在密闭的容器中为雄性提供动情或者不动情雌性弄脏的垫料时该区也有感应［41］。相比之下，在大鼠、雄性仓鼠［33，42］、雄性沙鼠［32］和雪貂［34］中，随着中的插入和可能减少了FOS蛋白阳性催产素神经元在前侧和内侧分泌性细胞分区中的数量［43］。研究还发现FOS蛋白离散集群只在特定的分区位置出现并且是在后而不是插入后就出现［26，32］。在大鼠中，这些 FOS蛋白集群的神经元通常出现在杏仁核外侧区、条纹终末核喙部、束旁丘脑核内侧。表明后激活了特定的脑部亚分区，能诱导FOS蛋白在大脑特定区域有选择性的表达［29］。

4 FOS蛋白的生物信息学分析

4．1 人类FOS蛋白

人类FOS蛋白（GenBank：CAA24756．1）的编码基因定位于染色体的14q21－31，该基因有4个外显子和3个内含子，FOS蛋白为380个氨基酸的不稳定核内磷酸化蛋白［44］。FOS蛋白存在一个由88个完全相同的氨基酸顺序组成的区域，这个区域包括一个能与DNA结合的基本区和亮氨酸拉链结构。通过Expasy进行一级结构分析可知FOS蛋白的分子式为C1767H2774N480O586S18，相对分子质量为40 695．40，理论等电点pI4．77，带正电残基（Arg＋Lys）为33个，带负电残基（Asp＋Glu）为51个。该蛋白的不稳定系数为78．82，说明其不稳定。脂肪系数为65．32，亲水性系数为－ 0．37，消光系数为21 930，哺乳动物的网织红细胞体外的半衰期为30 h。结构域预测发现其基本区域为亮氨酸拉链的BRLZ蛋白，属于B－ZIP超家族。

利用SOPMA对FOS蛋白序列进行二级结构预测，结果表明，FOS蛋白二级结构中α－螺旋（Alpha helix）占26．84％，β－折叠（Beta turn）占1．05％，延伸链（Extended strand）占8．16％，无规则卷曲（Random coil）占63．95％（图1）。

用Swissmodel对其进行了三级结构预测和可视化分析（图2）。该三级结构模型中用于建立模型的氨基酸残基范围为138~200位，该模型以2wt7A（2．30A）蛋白为模板，序列同源性为100％，E-value为1．43e－28．

4．2 大鼠FOS蛋白

大鼠FOS蛋白（NCBI reference sequence：NP＿071533．1），FOS蛋白的分子式为C1776H2791N4

83O592S17，肽链包含380aa，相对分子质量为40 926．60，理论等电点pI4．81，带正电残基（Arg＋Lys）为33个，带负电残基（Asp＋Glu）为50个。该蛋白的不稳定系数为76．60，说明其不稳定。脂肪系数为65．29，亲水性系数为－ 0．43，消光系数为23 420，哺乳动物的网织红细胞体外的半衰期为30 h。结构域预测发现其基本区域为亮氨酸拉链的BRLZ蛋白，属于B－ZIP超家族。

二级结构预测结果表明，FOS蛋白二级结构中α－螺旋（Alpha helix）占27．63％，β－折叠（Beta turn）占1．05％，延伸链（Extended strand）占8．68％，无规则卷曲（Random coil）占62．63％（图3）。

用Swissmodel对FOS蛋白进行了三级结构预测（图4）。该三级结构模型中用于建立模型的氨基酸残基范围为138～200位，该模型以2wt7A（2．30A）蛋白为模板，序列同源性为100％，E－value为1．26e－28．

4．3 小鼠FOS蛋白

该蛋白PDB ID为2WT7，相对分子质量为28 329．84，保守结构域基本区域为亮氨酸拉链的BRLZ蛋白，属于B－zip1超家族。2WT7有4条链。第一条链为63个残基的多肽，二级结构为96％的α－螺旋。第二条链为90个残基的多肽，二级结构为84％的α－螺旋，其余两条链均为16个残基。从PDB上下载其三级结构（图5）。

4．4 FOS蛋白的序列比对与系统进化树的建立

对大鼠FOS蛋白进行Blastp比对，选择同源性较高或研究较多的动物FOS蛋白序列进行分析。结果表明，与小鼠和金仓鼠（Mesocricetus aurarus）同源性最高，为97％，其次为猩猩（Pongo abelii）、野骆驼（Camelus ferus）各为95％、人（Homo sapiens）为94％、黑猩猩（Pan troglodytes）为94％。

从NCBI的数据库中挑选23个物种的FOS蛋白序列用MEGA5．0绘制进化树，结果显示大鼠与小鼠直接聚为一类，亲缘关系最近，这与序列Blastp的分析结果一致。因此通过以上对大鼠、人及小鼠的FOS蛋白进行对比可以看出，三者的同源性较高，结构和性质相似（图6）。

5 讨论

目前，关于FOS蛋白对细胞生命活动的研究取得了重要进展，尤其在各种应激反应对FOS蛋白表达的影响及FOS蛋白表达与一些疾病的相关方面，如冀群升等［1］研究发现FOS蛋白与神经元的可塑性有关，它可以通过参与神经肽的调节影响细胞水平记忆的形成，方向义等［13］在研究中也发现受到各种应激后在数分钟内中枢神经系统不同区域出现不同数量的FOS蛋白表达，且各种急性应激所致小鼠空间学习记忆功能的改变与FOS蛋白表达的上调有关［18］。而在研究性行为中也发现时一些与学习记忆相关的区域中FOS蛋白也随之增加，如室旁核［14，15］、下丘脑视上核、下丘脑、杏仁核［16］等，这提示FOS蛋白可能与性行为中的学习记忆有关。然而FOS蛋白在这些尤其在性行为这一神秘的过程中是如何发挥作用的，这些作用又与哪些基因和蛋白有关等问题还有待深入研究。

由于从人类脑部取样困难，试验往往选用大鼠脑部作为试验材料，不仅因为大鼠基因组与人类基因组相似度达90％，且大鼠脑量较大，取材方便，生物信息学分析发现大鼠、人及小鼠的FOS蛋白的同源性较高，结构和性质相似。尤其是大鼠和人类的FOS蛋白、相对分子质量、等电点等均相差较小，立体结构高度相似，因此研究大鼠FOS蛋白对研究人类FOS蛋白的各种性质和功能有极大的参考意义，本次生物信息学分析也可为大鼠大脑作为人类FOS蛋白研究的替代材料提供证据。

参考文献：

［1］冀群升，章静波． c－fos原癌基因的进展［J］．国外医学（分子生物学分册），1994，16（4）：152－156．

［2］王晓明，韩济生．原癌基因与核内第三信使．神经科学纲要［M］．北京：北京医科大学，中国协和医科大学联合出版社，1993．

［3］张玉秋，梅俊．学习记忆对脑内c－fos基因表达的影响［J］．生命科学，2000，12（5）：229－230．

［4］张玉秋，梅俊．学习和记忆对大鼠背海马结构内c－fos表达的影响［J］．中国神经科学杂志，2000，16（2）：138－142．

［5］ GILL K M， BERNSTEIN I L，MIZUMORI S J．Immediate early gene activation in hippocampus and dorsal striatum：effects of explicit place and response training［J］． Neurobiol Learn Mem， 2007，87（4）：583－596．

［6］舒丹，吴江，上官守琴，等．催产素抑制外周刺激诱发的大鼠海马LTP及FOS蛋白表达［J］．基础医学与临床，2009，29（8）：845－849．

［7］于芳，张安民，王根深，等．间歇性负重游泳训练对大鼠杏仁基底外侧核（BLA）FOS蛋白表达的影响［J］．北京体育大学学报，2008，31（10）：1357－1360．

［8］熊晶，刘凤英，陶光实，等．　c－fos和c－jun在宫颈癌、CIN及宫颈炎中的表达及意义［J］．现代生物医学进展，2009，9（4）：687－689．

［9］陈功，江澄川．　c－fos、c－jun与癫痫［J］．中华神经医学杂志，2005，4（8）：853－854．

［10］彭成，任永欣，姚干，等．实验性偏头痛动物模型c－fos、c－jun基因表达［J］．中国实验动物学报，2000，8（2）：112－119．

［11］王晔，廖志钢，王世春，等．大鼠电流损伤多器官c－fos表达研究［J］．法医学杂志，2005，21（3）：171－176．

［12］张辉，李卫东，薄爱华，等．FOS蛋白在脑挫伤皮质和海马中表达的研究［J］．中国组织化学与细胞化学杂志，2004，13（1）：110－113．

［13］方向义，胡海涛．中枢神经系统FOS蛋白的表达与外周伤害性刺激［J］．神经解剖学杂志，1996，12（3）：281－283．

［14］卢晓虹，李凌江，李昌琦，等．应激对中枢神经系统即刻早期基因c－fos表达及HPA轴的调节作用研究［J］．中国心理卫生杂志，2000，14（1）：10－13．

［15］赵正卿，雷辉，刘俊华，等．热应激时下丘脑视上核和室旁核FOS蛋白的表达［J］．　神经解剖学杂志，2007，23（3）：313－317．

［16］刘晓伟，曲宏达，张红梅，等．怒、恐应激大鼠脑内c－fos与CRHmRNA表达差异性分析［J］．四川中医，2006，24（1）：11－13．

第5篇

>> 人组蛋白去乙酰化酶11的克隆表达与生物信息学分析 FZ6基因及其蛋白的生物信息学分析拟南芥和大白菜YABBY蛋白家族的生物信息学分析斑马鱼TATA结合蛋白的生物信息学分析黄瓜DVR基因的生物信息学分析金铁锁糖基转移酶PtT1的克隆与生物信息学分析黄芩葡萄糖醛酸水解酶基因的克隆、生物信息学分析及表达蓖麻油体固醇蛋白质的鉴定与生物信息学分析结核分枝杆菌38kDa蛋白结构与功能的生物信息学分析新疆细粒棘球绦虫EgAgB8/3蛋白的生物信息学分析及意义棉铃虫的巧防技术太子参分解代谢关键酶8′羟化酶基因的克隆及生物信息学分析红白忍冬SABATH甲基转移酶基因克隆及其生物信息学分析希金斯炭疽菌腺苷酸环化酶生物信息学分析丹参类贝壳杉烯氧化酶（SmKOL）基因全长克隆及其生物信息学分析唇形科植物脚6基脚6基焦磷酸合酶编码基因及其氨基酸序列的生物信息学分析人ALK－1近端启动子的生物信息学分析酵母转录因子结合位点保守性的生物信息学分析玉米谷胱甘肽过氧化物酶的生物信息学分析欧文氏杆菌铁代谢相关基因的生物信息学分析常见问题解答当前所在位置：l）分析棉铃虫类胰蛋白酶氨基酸序列的理化性质；运用DNAMAN软件比对分析氨基酸序列同源性；运用MEGA 5.0中的Fhylogenetic Tree方法构建分子系统发育树；运用在线工具ProtScale （）进行亲、疏水性的分析；运用Psort在线工具（）进行蛋白质二级结构的分析预测；运用NCBI数据库中CDD在线工具（http：//ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi）进行功能结构域的分析。

2 结果与分析

2.1 棉铃虫类胰蛋白酶氨基酸序列理化性质分析

运用ProtParam在线软件分析棉铃虫7种类胰蛋白酶氨基酸序列理化性质，结果见表1。由表1可知，棉铃虫7种类胰蛋白酶在理论等电点、脂溶指数以及氨基酸组成等方面均表现出相似性。其相对分子质量约为70 000，等电点约为5.00，氨基酸数目为253～256，Ala、Cys、Gly和Thr残基含量较高。7种类胰蛋白酶的不稳定系数均较高，其中类胰蛋白酶Ⅲ的不稳定指数最低，为52.08，表明类胰蛋白酶在棉铃虫细胞内的稳定性较差，推测类胰蛋白酶代谢较为活跃，代谢周转的速度较快。棉铃虫7种类胰蛋白酶的脂溶指数均较低，属于亲水性蛋白质。

2.2 棉铃虫类胰蛋白酶氨基酸序列磷酸化位点预测分析

使用NetPhosk 2.0 Server在线工具对棉铃虫7种类胰蛋白酶的氨基酸序列分别进行预测Ser、Thr与Tyr位点处发生磷酸化的概率结果见表2。从表2可见，在氨基酸磷酸化位点中Ser的预测分值最高，表明Ser发生磷酸化的概率最高，并且发现类胰蛋白酶Ⅲ中不具有Thr磷酸化位点；只有类胰蛋白酶Ⅴ具有Tyr磷酸化位点。以类胰蛋白酶Ⅲ为例进行说明：其氨基酸序列在第83位、243位、246位、247位这4个Ser位点处都有可能发生磷酸化，但第247位Ser发生磷酸化的概率最大，为M3=0.973。

2.3 棉铃虫类胰蛋白酶氨基酸序列分子进化树分析

使用MEGA 5.0中的Fhylogenetic Tree方法构建分子系统发育树结果见图1。由图1可知，7种类胰蛋白酶分为两个分支，类胰蛋白酶Ⅰ、Ⅱ、Ⅶ与Ⅴ处于一个分支，类胰蛋白酶Ⅳ、Ⅲ与Ⅵ处于另一个分支。其中，类胰蛋白酶Ⅰ和类胰蛋白酶Ⅱ进化关系较近，类胰蛋白酶Ⅲ与类胰蛋白酶Ⅵ进化关系较近。

2.4 棉铃虫类胰蛋白酶的氨基酸序列分析

1）使用TMHMM 2.0在线工具对7种类胰蛋白酶的氨基酸序列跨膜结构进行预测分析，均不存在跨膜结构域。

2）使用ProtScale工具对7种蛋白酶的亲、疏水性进行分析。7种类胰蛋白酶的总平均亲水性为0.860～0.960，均表现为亲水性。其中，多肽链靠近N末端区域亲水性最强，最低分值为-0.500到-0.600，而C末端区域疏水性最强，最高分值为2.100到2.300。

3）用DNAMAN软件比对分析7种类胰蛋白酶的氨基酸序列同源性（图2）。在这7种蛋白酶氨基酸序列中，有较多保守的区域（如图2中深颜色区域所示）。经过分析发现，7种类胰蛋白酶氨基酸序列结构相似，同源性最高为85.71%。7种类胰蛋白酶中均含有高度保守的必需氨基酸残基，参与维持蛋白酶的空间结构及行使催化功能。比如第10、54、70、179、196、207与231位的Cys残基，它们之间能够形成二硫键以稳定蛋白酶的空间结构。第205位的Asp残基与228、238位的Gly残基能够与底物形成离子键、氢键，参与类胰蛋白酶对底物的识别与结合。第69位的His残基、114位的Asp残基与211位的Ser残基组成了类胰蛋白酶的催化基团，通过电子的传递，与底物分子中的Arg和（或）Lys残基羧基端肽键发生亲核反应，实现催化功能（氨基酸残基位置以类胰蛋白酶Ⅲ为准）。

2.5 棉铃虫类胰蛋白酶的功能结构域分析

使用NCBI数据库中CDD在线工具对类胰蛋白酶Ⅲ进行功能结构域分析（图3）。结果表明，类胰蛋白酶Ⅲ属于胰蛋白酶超家族，具有该家族特有的功能区域。类胰蛋白酶Ⅲ的16位（Ala）与17位（Arg）氨基酸残基之间含有一个自剪切位点（Cleavage site），该位点与酶翻译后的活化及转运有关；69（His）位、114（Asp）位、211（Ser）位氨基酸残基构成酶的催化位点（Active site）；205（Asp）位、228（Gly）位、238（Gly）位氨基酸残基形成3个底物结合位点（Substrate binding sites），参与酶对底物的识别与结合，其他类胰蛋白酶的分析也得到相似的结果。

2.6 棉铃虫类胰蛋白酶的亚细胞定位分析

亚细胞定位预测结果见表3。由表3可以看出，类胰蛋白酶Ⅰ、Ⅱ主要位于内质网中，类胰蛋白酶Ⅲ主要位于内质网、液泡及细胞外基质中，而类胰白酶Ⅳ、Ⅴ、Ⅵ与Ⅶ主要位于细胞外基质中。亚细胞定位的多样性体现了类胰蛋白酶在棉铃虫生命活动过程中具有多样性的生物学功能，其中类胰白酶Ⅲ、Ⅳ、Ⅴ、Ⅵ与Ⅶ主要发挥消化作用，因为棉铃虫对食物的消化场所主要位于中肠（细胞外）。而类胰蛋白酶Ⅰ、Ⅱ与Ⅲ可能主要行使免疫保护作用，参与棉铃虫对外界环境的免疫应答。

2.7 棉铃虫类胰蛋白酶的二级结构分析预测

利用NPSA在线工具预测类胰蛋白酶的二级结构（表4）。由表4可知，无规卷曲是该类胰蛋白酶整体结构中的主要组成结构元件，β转角出现概率相对较小。α螺旋主要分布于氨基酸序列两侧，而无规卷曲、延伸链则主要分布在多肽链中间区段。

3 小结与讨论

本研究以棉铃虫肠道内7种类胰蛋白酶为研究对象，运用在线工具对其进行生物信息学分析。结果表明，7种类胰蛋白酶理化性质较为相似，为亲水性蛋白酶。Ser是类胰蛋白酶序列中磷酸化概率最大的氨基酸残基。分子系统发育树结果显示类胰蛋白酶Ⅲ与类胰蛋白酶Ⅵ进化关系较近，而类胰蛋白酶I和类胰蛋白酶Ⅱ在进化关系上更为接近。类胰蛋白酶不存在跨膜结构域，属于基质类蛋白，这与其亲水性的特点吻合。功能结构域分析发现类胰蛋白酶属于胰蛋白酶超家族，其氨基酸序列中含有自切割位点、若干催化残基与结合残基。类胰蛋白酶的亚细胞定位具有多样性，主要分布在细胞外与内质网中，这体现了类胰蛋白酶在棉铃虫生命活动过程中具有多样性的生物学功能。二级结构分析预测表明无规卷曲在该类胰蛋白酶整体结构中所占比例最大，是其主要的结构元件。氨基酸序列同源性分析，7种类胰蛋白酶氨基酸序列的同源性较高，达到了85.71%，并且含有高度保守的必需残基，参与维持蛋白酶的空间结构及行使催化功能，包括维持高级结构的Cys残基，形成底物结合口袋的结合残基及参与催化作用的催化残基。依据此研究结果，能够设计出与类胰蛋白酶活性中心特异性结合的抑制剂，抑制其活性，从而扰乱棉铃虫的正常消化，实现抗虫目的。

参考文献：

[1] 常团结，陈蕾，路子显，等. 棉铃虫幼虫中肠类胰蛋白酶基因的克隆及在大肠杆菌中的表达[J]. 动物学报，2002，48（6）：790-796.

[2] 任晓霞，韩召军，王荫长. 棉铃虫乙酰胆碱酯酶cDN段的克隆和序列分析[J]. 动物学报，2002，48（1）：121-124.

[3] 郭线茹，蒋金炜，罗梅浩，等. 转基因抗虫烟草研究进展[J]. 昆虫知识，2005，42（4）：358-363.

[4] CHOUGULE N P， GIRI A P，SAINANI M N， et al. Gene expression patterns of Helicoverpa armigera gut proteases[J]. Insect Biochemistry and Molecular Biology，2005，35（4）：355-367.

[5] KANG Z， JIANG J H， WANG D， et al. Kunitz-type trypsin inhibitor with high stability from Spinacia oleracea L. seeds[J]. Biochemistry （Moscow），2009，74（1）：102-109.

[6] TELANG M A， GIRI A P， SAINANI M N， et al. Characterization of two midgut proteinases of Helicoverpa armigera and their interaction with proteinase inhibitors[J]. Journal of Insect Physiology，2005，51（5）：513-522.

[7] TAMHANE V A， CHOUGULE N P， GIRI A P， et al. In vivo and in vitro effect of Capsicum annum proteinase inhibitors on Helicoverpa armigera gut proteinases[J]. Biochim Biophys Acta，2005，1772（2）：156-167.

[8] BOWN D P， GATEHOUSE J A. Characterization of a digestive carboxypeptidase from the insect pest corn earworm （Helicoverpa armigera） with novel specificity towards C-terminal glutamate residues[J]. European Journal of Biochemistry，2004， 271（10）：2000-2011.

第6篇

>> 小菜蛾PxALP1基因的克隆与生物信息学分析高丛越桔UFGT基因电子克隆和生物信息学分析丹参类贝壳杉烯氧化酶（SmKOL）基因全长克隆及其生物信息学分析小菜蛾p38MAPK基因的克隆与生物信息学分析黄瓜DVR基因的生物信息学分析沙棘WRI1转录因子基因的生物信息学分析黔北麻羊RERGL基因cDNA克隆与生物信息学分析玉米淹水诱导表达ZmERF5基因启动子的克隆与生物信息学分析茶陵野生稻冷响应基因OrCr3的克隆及其生物信息学分析黄芩葡萄糖醛酸水解酶基因的克隆、生物信息学分析及表达金铁锁糖基转移酶PtT1的克隆与生物信息学分析结核分枝杆菌pst S1基因的扩增及生物信息学分析平邑甜茶MhWRKY15基因cDNA克隆及其生物信息学分析红白忍冬SABATH甲基转移酶基因克隆及其生物信息学分析子宫内膜异位症相关基因和microRNA的挖掘及生物信息学分析太子参分解代谢关键酶8′羟化酶基因的克隆及生物信息学分析 FZ6基因及其蛋白的生物信息学分析欧文氏杆菌铁代谢相关基因的生物信息学分析水稻2个F―box基因的生物信息学分析弓1虫RH株SAG1基因序列体外扩增及生物信息学分析常见问题解答当前所在位置：l）对氨基酸序列进行多重比对，并用MEGA4 NJ法（bootstrap 1000）构建系统树。在CCD数据库（）进行二硫键预测。在Swiss-Model（http：///）进行蛋白的三级结构预测。

2.4 丹参毛状根中SmNAC1表达谱分析采用SYBR Green Premix染料（TaKaRa公司）进行qRT-PCR分析，以丹参β-actin作管家基因，分别以特异性引物SmNAC F：5′-CTCCCAACATCAGTCAAG-3′，SmNAC R：5′-ATGGCGGTGACGAT-3′，检测SmNAC1在YE+Ag+处理丹参毛状根0，2，4，8，12，24 h的表达变化。PCR体系为 SYBR Premix TaqTM 5 μL，正反引物各0.2 μL，ROX Reference Dye II 0.2 μL，稀释10倍的cDNA模板1.0 μL，加ddH2O至10 μL。PCR程序为，95 ℃ 30 s，95 ℃ 5 s，60 ℃ 34 s， 40个循环，增加溶解曲线。每个样品设3个生物学重复。

3 结果

3.1 丹参SmNAC1基因序列分析丹参SmNAC1基因全长591 bp，编码196个氨基酸。Blastx检索结果显示，SmNAC1与野生马铃薯Solanum chacoense的NAC1，番茄S. lycopersicum NAC1-like，烟草Nicotiana benthamiana NAC1，水稻Oryza sativa Indica Group NAC-like，紫花苜蓿Medicago truncatula的相似度分别是84%，83%，84%，77%，73%。与SmBTF的相似度只有56%。SmNAC1蛋白55～120 位是NAC_AB（PS51151）的保守结构域。应用Softberry（http：///berry.phtml）分析调控元件和PLANTCARE（http：//bioinformatics.psb.ugent.be/webtools/plantcare/html/）预测，C-端氨基酸有23个顺势作用元件，包括TGGTTT厌氧响应顺式调控元件，AAACAGA赤霉素响应元件，GTTTTCTTAC参与胁迫防御应答的顺式作用元件以及TCTTTAC光应答元件等。使用NetPhos 2.0 Server（http：//cbs.dtu.dk/services/NetPhos/）分析磷酸化位点，共发现10个磷酸化位点，其中丝氨酸位点7个，苏氨酸位点2个，酪氨酸位点1个，没有发现糖基化为点。

3.2 SmNAC1编码蛋白质的基本性质分析 SmNAC1蛋白由196个氨基酸残基组成，相对分子质量为21.66 kDa，等电点4.36。CFSSP 对SmNAC1蛋白进行二级结构预测，该蛋白包含87.8%的α螺旋结构， 36.7% 的β折叠结构和14.8%的无规卷曲，见图1（由于α螺旋和β折叠交互计算，故几种结构类型之和>100%）。无规则卷曲主要位于55～120个氨基酸功能区内，连接其他二级结构元件。在SWISS-MODEL用同源建模方法以人的NAC蛋白（3mcbA）为模板构建同源模型，对SmNAC1的NAC结构域氨基酸进行三级结构预测，结果见图2。SignalP 4.0 Server和TMHMM 2.0分析显示SmNAC1非氨基酸序列没有信号肽，也不包含跨膜结构域，也不是分泌蛋白。亚细胞定位分析表明，该基因不定位于叶绿体或线粒体，推测可能定位在细胞核，具有DNA结合，激活，转录调控，乙酰化等功能。

以人的NAC蛋白（3mcbA）为模板，E=9.311 57e-17。将SmNAC1与Genbank中17个物种25种蛋白进行比对，应用MEGA4使用NJ法（bootstrap 1000）构建系统进化树。SmNAC1与茄科马铃薯S. chacoense NAC2（ScNAC2， ACB32231.1），本氏烟N. benthamiana NAC（NbNAC，BAF46352.1）和番茄S.lycopersicum NAC（SINAC，XP_004249331.1）

亲缘关系最近，见图3。从图中可以看出NAC的变异率是比较高的，同一植物的NAC蛋白并不聚在一起，如拟南芥中的拟南芥Arabidopsis thaliana中的5个蛋白NAC1-1（AtNAC1-1，NP_187845.1），NAC1-2（AtNAC1-2，NP_190516.1），NAC1-3（AtNAC1-3，NP_1196889.4），NAC1-4（AtNAC1-4，NP_001078369.1）和NAC1-5（AtNAC1-5，AEE31552.1），AtNAC1-1和AtNAC1-3聚为一小支，AtNAC1-4和AtNAC1-5聚为一小支，而AtNAC1-2则和蓖麻Ricinus communis NAC1-2（RcNAC1-2，XP_002521293.1）聚为一小支，三者间间隔距离较远。玉米种的3个NAC蛋白中ZmNAC1-1（NP_001147422.1）和ZmNAC1-3（NP001148944.1）聚为一支，与ZmNAC1-2（NP_001147705.1）的距离较远。水稻中的3个NAC蛋白则各自聚在不同的分支。可见NAC蛋白虽然具有保守的结构域，但是其结构的变异性非常大。

3.3 SmNAC1基因表达谱分析对培养18 d的丹参毛状根进行YE+Ag+处理，分析SmNAC1在处理后5个时间点的mRNA水平的相对表达量，见图4。处理后2 h表达量上调至对照的1.4倍，处理后4 h表达量达到对照的2倍，8～12 h保持2倍的表达水平，处理后24 h SmNAC1下调至对照表达水平以下。说明SmNAC1响应YE+Ag+处理，参与了胁迫应答反应。

4 讨论

NAC家族基因是陆生植物特异的转录因子家族，NAC蛋白参与植物的生长发育、形态建成及多马铃薯Solanum chacoense NAC2（ScNAC2， ACB32231. 1）；本氏烟Nicotiana benthamiana NAC（NbNAC，BAF46352. 1）；番茄S. lycopersicum NAC（SINAC，XP_004249331. 1）；丹参Salviae miltiorrhizae NAC1（SmNAC1，kF006346）；黄瓜Cucumis sativus（CsNAC， XP_004171778. 1）；葡萄Vitis vinifera NAC2（VvNAC2，XP_003632619. 1）；野草莓Fragaria vesca subsp. vesca NAC（Fvssp. vescaNAC，XP_004306474. 1）；拟南芥Arabidopsis thaliana NAC1-3（AtNAC1-3，NP_1196889. 4）；拟南芥A. thaliana NAC1-1（AtNAC1-1，NP_187845. 1）；水稻Oryza sativa Japonica Group NAC1（OsNAC1，BAB89723. 1）；水稻O. sativa NAC1-3（OsNAC1-3，AAT01337. 1）；葡萄V. vinifera NAC1（VvNAC1，XP_002283581. 2）；二穗短柄草Brachypodium distachyon NAC（BdNAC，XP_003557882. 1）；玉米Zea mays NAC1-3（ZmNAC1-3，NP001148944. 1）；玉米Z. mays NAC1-1（ZmNAC1-1，NP_001147422. 1）；大豆Glycine max NAC（GmNAC，XP_003554096）；蒺藜状苜蓿Medicago truncatula NAC1（MtNAC1，XP_003624883. 1）；火炬松Pinus taeda NAC（PtNAC，AAF27917. 1）；Micromonas sp. RCC299（Msp. NAC1，ACO64924. 1）；Coccomyxa subellipsoidea C-169（CsuNAC1，EIE21909. 1）；拟南芥A. thaliana NAC1-5（AtNAC1-5，AEE31552. 1）；拟南芥A. thaliana NAC1-4（AtNAC1-4，NP_001078369. 1）；水稻O. sativa NAC1-2（OsNAC1-2，AAM52321. 1）；玉米Z. mays NAC1-2（ZmNAC1-2，NP_001147705. 1）；拟南芥A. thaliana NAC1-2（AtNAC1-2，NP_190516. 1）；蓖麻Ricinus communis NAC1-2（RcNAC1-2，XP_002521293. 1）。

种生物和非生物胁迫应答过程。如玉米的ZmSNAC1基因在低温、干旱、高盐及脱落酸处理后表达量显著上调，而水杨酸处理后表达下调[13]。葡萄中的VvNAC1基因响应病原菌、脱落酸、茉莉酸和乙烯处理表达上调[14]。在巴西橡胶树HbNAC1启动子序列中有多个CCAAT-box，EECCRCAH1，MYB2CONAENSUSAT元件识别MYB和MYC转录因子，在ABA信号通路和非生物胁迫答应中起重要作用[15]。SmBTF3与SmNAC1氨基酸序列的相似度只有56%，但是在N-端都具有NAC-AB保守结构域，二级结构都以α螺旋为主。荧光定量PCR分析表明SmBTF3在根中的表达量最高，对ABA诱导的响应不明显，干旱胁迫短时间内抑制其表达。本研究发现SmNAC1在YE+Ag+联合处理后2 h表达量上调至对照的1.4倍，4 h上调至对照的2倍，24 h表达量下调至对照表达水平一下，可见丹参中的这2个转录因子在丹参的抗逆胁迫中起作用。

[参考文献]

[1] Phan Tran L S， Nakashima K， Sakuma Y， et al. Isolation and functional analysis of Arabidopsis stress-inducible NAC transcription factors that bind to a drought-responsive cis-element in the early responsive to dehydration stress 1 promotor[J]. Plant cell， 2004， 16（9）：2481.

[2] Park J， Kim Y S， Kim S G， et al. Integration of auxin and salt signals by the NAC transcription factor NTM2 during seed germination in Arabidopsis[J]. Plant Physiol， 2011， 156（2）：537.

[3] Hu H H， You J， Fang Y J， et al. Characterization of transcription factor gene SNAC2 conferring cold and salt tolerance in rice[J]. Plant Mol Biol， 2008， 67（1/2）：169.

[4] 孙欣，上官凌飞，房经贵，等. 葡萄NAC转录因子家族生物信息学分析[J]. 基因组学与应用生物学，2011，20（2）：229.

[5] Hu R B， Qi G， Kong Y Z， et al. Comprehensive analysis of NAC domain transcription factor gene family in Populus trichocarpa[J]. BMC Plant Biol， 2010， 10（1）：145.

[6] Rushton P J， Bokowiec M T， Han S C， et al. Tobacco transcription factors ： novel insights into transcriptional regulation in the solanaceae[J]. Plant Physiol， 2008， 147（1）：280.

[7] Le D T， Nishiyama R， Watanabe Y， et al. Genome-wide survey and expression analysis of the plant-specific NAC transcription factor family in soybean during development and dehydration stress[J]. DNA Res， 2011， 18（4）： 263.

[8] Puranik S， Sahu P P， Srivastava P S， et al. NAC proteins： regulation and role in stress tolerance[J]. Trends Plant Sci， 2012， 17（6）：369.

[9] 何炜，叶冰莹，周平，等. 转录因子NAC的研究进展[J]. 亚热带农业研究，2008，4（4）：311.

[10] 何苗，武雪，王喆之. 丹参BTF3基因的克隆及生物信息学分析[J]. 武汉植物学研究， 2009， 26（6）：582.

[11] 张夏楠，崔光红，蒋喜红，等. 丹参转基因毛状根离体培养体系的建立及分析[J]. 中国中药杂志，2012， 37（15）：2257.

[12] 吕冬梅，袁媛，张东，等. 丹参毛状根化学成分稳定性研究[J]. 中国中药杂志，2008，33（6）：653.

[13] Lu M， Ying S， Zhang D F， et al. A maize stress-responsive NAC transcription factor， ZmSNAC1， confers enhanced tolerance to dehydration in transgenic Arabidopsis[J]. Plant Cell Rep， 2012， 31（9）：1701.

[14] Zhu Z， Shi J， He M， et al. Isolation and functional characterization of a transcription factor VpNAC1 from Chinese wild Vitis pseudoreticulata[J]. Biotechnol Lett， 2012， 34（7）：1335.

[15] 康桂娟，黎瑜，夏可灿，等. 巴西橡胶树HbNAC1基因启动子的克隆及序列分析[J]. 基因组学与应用生物学， 2012， 31（5）：447.

Cloning and bioinformatics analysis of SmNAC1 from Salvia miltiorrhiza hairy root

WANG Ya-jun1， JIANG Chao1， ZHAO Rong1， ZHAO Le2， SHEN Ye1*， HUANG Lu-qi1*

（1.National Resource Center for Chinese Materia Medica， China Academy of Chinese Medical Sciences， Beijing 100700， China；

2.College of Pharmaey， Henan University of Traditional Chinese medicine， Zhengzhou 450008， China）

[Abstract] In order to study function of NAC transcription in development， hormone regulation and the stress response of Salvia miltiorrhiza， the NAC transcription was cloned and analyzed. By retrieving cDNA database of S. miltiorrhiza hairy root one NAC unigene was found， then a full length of cDNA was cloned by designing specific primers and PCR amplifying. Using ORF finder it was found that the cDNA containing a NAC-AB conserved domain in N-terminal， so the cDNA was a NAC transcription factor， named as SmNAC1（kF006346）. Bioinformatics analysis showed that SmNAC1 had an open reading frame （ORF） of 591 bp encoding 196 amino acids. The calculated protein had isoelectric point （pI） of 4.36 with molecular weight about 21.66 kDa. The transcription level of SmNAC1 after dealing with yeast extract （YE） and silver ion （Ag+） in S. miltiorrhiza hairy root was markedly stimulated up regulating. It was 1.4 fold compared with the control after induction 2 h， and maintained 2.0 fold on 4-12 h after induction. SmNAC1 may participate in regulation of stress response of YE+Ag+.

第7篇

关键词: 平邑甜茶； WRKY15； cDNA；生物信息学

中图分类号：S661．19 文献标识码：A 文章编号：1009－9980?穴2011?雪06－949－04

Cloning of MhWRKY15 gene in Malus hupehensis and its bioinformatics analysis

SUN Xiao-li， RAN Kun，YANG Hong-qiang*， LI Qiang， JIANG Qian-qian

（College of Horticulture Science and Engineering， Shandong Agricultural University・ State Key Laboratory of Crop Biology； 3Shandong Provincial Key Laboratory of Fruit Biology， Tai’an，Shandong 271018 China）

Abstract: Full-length cDNA sequence of WRKY15 gene from roots of Malus hupehensis （Pamp.） Rehd. var. pinyiensis Jiang， which was tentatively designated as MhWRKY15， with GenBank accession number GU576874， was acquired by RT-PCR and RACE with primers designed respectively based on the EST sequence. Bioinformatics analysis indicated that MhWRKY15 was 1 091 bp in length， containing an open reading frame of 810 bp and encoding 269 amino acids， and it belonged to group II of WRKY transcription factors and was one member of WRKY15 family. The results also showed that the protein encoded by MhWRKY15 was a soluble protein， with the molecular formula C1263H1941N365O425S12， the relative molecular weight was 29 423.2 ku and the isoelectric point was 5.30. There was one conserved WRKY domain in the protein sequence. The protein might be located in nucleus， and there were many phosphorylation sites， N glycosylation sites and O glycosylation sites. The predicted secondary structure demonstrated that random coil was the most important structural conformation.

Key words: Malus hupehensis （Pamp.） Rehd.； WRKY15； cDNA； Bioinformatics

WRKY是植物特有的一种N端含有7个绝对保守的氨基酸序列（WRKYGQK）及锌指结构（CX4-7 CX22-23HXH/C）的转录因子[1-2]，它通过与核心序列为（T）（T）TGAC（T/C）的W-box顺式元件特异结合而调节基因表达[3-4]。目前，在拟南芥和水稻等植物中已克隆了大量WRKY成员[5-6]，根据WRKY结构域个数及锌指结构特征，这些成员可以分为3类。第Ⅰ类含有2个WRKY结构域；第Ⅱ类含有1个WRKY结构域，其锌指结构为C2H2型；第Ⅲ类含有1个WRKY结构域，其锌指结构为C2HC型[7]。WRKY明显受真菌、冷害、高温、干旱及盐胁迫等诱导，并参与胚胎形成、种皮及腺毛发育等多种过程[1-2，7]。平邑甜茶是苹果的优良砧木，克隆其转录因子并进行生物信息学分析，对于苹果砧木的分子调控及遗传改良有重要意义。

1 材料和方法

1.1 总RNA的提取及检测

取具4~6片真叶的平邑甜茶[Malus hupehensis （Pamp） Rehd. var Pinyiensis Jiang]，采用改进快速CTAB法提取根系总RNA[8]，琼脂糖凝胶电泳及Eppendorf核酸蛋白测定仪检测质量及浓度。

1.2 MhWRKY15基因的克隆

按照RNA PCR （AMV） Ver.3.0（TaKaRa）使用说明合成cDNA第1链，根据已知EST序列设计特异的上游引物P1: （5’-CAGATTATGAGCGACCAG GAG-3’）和下游引物P2: （5’-CGAGGAAACAAGTT GAAAG-3’），以cDNA为模板进行PCR扩增。产物回收后克隆入pMD-18T载体，转化大肠杆菌DH5α，提取质粒后测序；根据测序结果设计3’-RACE上游引物P3: 5’-CATGGTGGTCCTGGAGT TCT-3’，下游引物为B26通用引物: 5’-GACTCGAG TCGACATCGATTTTTTTTTTTTTTTTT，扩增得到3’端序列。根据中间片段和3’端序列，设计5’-RACE上游引物P4（5’-CATTGCCCAGTGTAATCCT-3’）和下游引物P5（5’-CATCTTAACCCTCCTTTCT-3’），按照5’-Full RACE Kit（Takara Code: D315）使用说明，得到5’端序列。最后设计全长引物P6（5’-ATG GACCCCACATTCTTCAG-3’）和P7（5’-TCAACAGA ATCTGAGCTTGTG-3’），扩增得到MhWRKY15编码区序列。

1.3 生物信息学分析

用DNAStar软件中的EditSeq程序分析MhWRKY15全长序列，用ORF Finder （）、TMpred（ ch. embnet. org/software/TMPRED_form. html）、SignalP3.0（ cbs. dtu. dk/services/SignalP/）、CELLO（cello. life. nctu. edu. tw/）、NetPhos 2.0（ cbs. dtu. dk/services/NetPhos/）、NetNGlyc 1.0（ cbs. dtu. dk/services/NetNGlyc/）和NetOGlyc 3.1（ cbs. dtu. dk/services/NetOGlyc/）对编码蛋白进行保守域、氨基酸理化性质、跨膜区、信号肽分析、亚细胞定位、磷酸化位点、N-糖基化位点和O-糖基化位点分析。

2 结果与分析

2.1 平邑甜茶MhWRKY15基因cDNA全长序列的克隆

利用特异引物P1和P2，通过RT-PCR扩增得到长约350 bp的目的条带（图1-A），产物测序后确定为342 bp。通过RACE技术分别获得330 bp的5’端（图1-B）和741 bp的3’端（图1-C）序列。在拼接序列起始密码子和终止密码子处分别设计引物P6和P7，扩增得到810 bp的条带（图1-D），测序结果与拼接的编码区序列吻合。将该基因命名为MhWRKY15，GenBank登陆号为GU576874。

2.2 平邑甜茶MhWRKY15基因的核苷酸序列分析

EditSeq程序和ORF Finder分析显示，MhWRKY15全长1 091 bp，含有810 bp的完整ORF，起始密码子为ATG，终止密码子为TGA，包括134 bp的5’非翻译区（5’-UTR）和147 bp的3’非翻译区（3’-UTR），共编码269个氨基酸。

2.3 平邑甜茶MhWRKY15编码蛋白的系统发生分析

2.3.1 蛋白保守域分析 Conserved Domains Database蛋白保守域分析显示，MhWRKY15编码蛋白在80~140位氨基酸之间含有一个WRKY保守功能域，其中WRKYGQK为7个绝对保守的氨基酸残基；在该蛋白DNA结合域中具有一个C2H2型（C-X5-C-X23-H-X1-H）锌指结构，表明该蛋白属于第II组WRKY类转录因子；Blast分析确认该基因为WRKY15家族成员。

2.3.2 系统进化树分析以最大简约法（MP）构建的多物种系统进化树（图2）显示，与平邑甜茶（GU576874）进化关系最近的是苹果（ADL36857.1），其次是大豆（ABS18444.1）和葡萄（XP002269267.1）。

2.4 平邑甜茶MhWRKY15编码蛋白的性质分析

ProtParam Tool分析显示MhWRKY15分子量为29 423.2 ku，分子式为C1263H1941N365O425S12，理论pI值为5.30，不稳定参数为52.50，属于不稳定蛋白。TMPred跨膜区域分析表明，该蛋白从内到外及从外到内的跨膜区域均为0；SignalP 3.0信号肽分析显示该蛋白没有信号肽。NetPhos 2.0分析表明该蛋白存在15个丝氨酸位点、2个苏氨酸位点和1个酪氨酸位点。NetNGlyc1.0分析显示在22、30、40及152位氨基酸处存在4个N-糖基化位点；NetOGlyc 3.1分析表明存在16个O-糖基化位点。CELLO亚细胞定位分析表明该蛋白定位于细胞核。SOPMA分析表明，该蛋白α-螺旋、延伸链和β-转角的比例分别为20.22%、11.61%和3.37%，无规则卷曲比例最高（64.79%）；用SWISS-MODEL构建的三维结构模型也显示MhWRKY15主要以无规则卷曲为主（图3）。

3 讨论

转录因子是结合在目的基因特定DNA序列上的蛋白质，通过增强或抑制基因的转录效率来调控基因表达，真核生物基因表达调控主要是在转录水平进行。WRKY转录因子作为一种诱导型调节因子，参与植物的多种防卫反应、生长发育调节以及物质代谢调节等各种重要生理活动[3，7]。研究通过生物学信息学分析发现MhWRKY15编码蛋白存在磷酸化、N糖基化和O糖基化位点，这表明磷酸化作用或糖基化作用能够调节MhWRKY15转录因子。蛋白磷酸化作用由蛋白激酶催化完成，是细胞信号转导过程中的作用环节；磷酸化位点的存在，表明MhWRKY15转录因子可受蛋白激酶调节，能够在细胞信号转导过程中发挥作用。事实上，WRKY通过与W-box元件发生特异性结合，可调节启动子中含有该元件的基因的表达，能够参与多种应答反应[2]。因此，MhWRKY15会在平邑甜茶转录调控、信号转导及对胁迫应答等中起调节作用。

参考文献 References:

[1] RUSHTON P J， SOMSSICH I E， RINGLER P， SHEN Q J. WRKY transcription factors[J]. Trends in Plant Science， 2010， 5（5）: 247-258.

[2] PANDEY S P， SOMSSICH I E. The role of WRKY transcription factors in plant immunity[J]. Plant Physiology， 2009， 150: 1648-1655.

[3] CAI M， QIU D Y， YUAN T， DING X H， LI H J， DUAN L， XU C G， LI X H， WANG S P. Identification of novel pathogen-responsive cis-elements and their binding proteins in the promoter of OsWRKY13， a gene regulating rice disease resistance[J]. Plant， Cell & Environment， 2008， 31: 86-96.

[4] VAN-VERK M C， PAPPAIOANNOU D， NEELEMAN L， BOL J F， LINTHORST H J M. A novel WRKY transcription factor is required for induction of PR-1a gene expression by salicylic acid and bacterial elicitors[J]. Plant Physiology， 2008，146: 1983-1995.

[5] EULGEM T， SOMSSICH I E. Networks of WRKY transcription factors in defense signaling[J]. Current Opinion in Plant Biology， 2007， 10: 366-371.

[6] ROSS C A， LIU Y， SHEN Q J. The WRKY gene family in rice （Oryza sativa）[J]. Journal of Integrative Plant Biology， 2007， 49（6）: 827-842.

[7] EULGEM T， RUSHTON P J， ROBATZEK S， SOMSSICH I E. The WRKY superfamily of plant transcription factors[J]. Trends in Plant Science， 2000， 5（5）: 199-206.

第8篇

>> 垂体腺苷酸环化酶激活肽在实验性偏头痛大鼠中的作用棉铃虫类胰蛋白酶的生物信息学分析唇形科植物脚6基脚6基焦磷酸合酶编码基因及其氨基酸序列的生物信息学分析黄瓜DVR基因的生物信息学分析红白忍冬SABATH甲基转移酶基因克隆及其生物信息学分析丹参类贝壳杉烯氧化酶（SmKOL）基因全长克隆及其生物信息学分析人组蛋白去乙酰化酶11的克隆表达与生物信息学分析金铁锁糖基转移酶PtT1的克隆与生物信息学分析黄芩葡萄糖醛酸水解酶基因的克隆、生物信息学分析及表达太子参分解代谢关键酶8′羟化酶基因的克隆及生物信息学分析人ALK－1近端启动子的生物信息学分析酵母转录因子结合位点保守性的生物信息学分析 FZ6基因及其蛋白的生物信息学分析黔北麻羊RERGL基因cDNA克隆与生物信息学分析不同物种GATA—2基因编码区生物信息学分析玉米谷胱甘肽过氧化物酶的生物信息学分析石榴等观赏植物DFR基因生物信息学分析欧文氏杆菌铁代谢相关基因的生物信息学分析拟南芥和大白菜YABBY蛋白家族的生物信息学分析丹参SmNAC1基因的克隆和生物信息学分析常见问题解答当前所在位置：l）在线进行分析预测AC相关蛋白序列的等电点、分子质量及氨基酸组成等特征。

1.2.3 蛋白质疏水性预测利用Protscale程序（http：///protscale/）对希金斯炭疽菌中AC相关蛋白序列进行疏水性测定。

1.2.4 蛋白质转运肽及信号肽预测对蛋白质转运肽（transit peptide）的预测利用TargetP 1.1 Server在线分析实现（http：//cbs.dtu.dk/services/TargetP/）[14]。氨基酸信号肽（Signal peptide）的预测则是利用SignalP 3.0 Server[15]在线分析实现（http：//cbs.dtu.dk/services/SignalP-3.0/）。在线预测信号肽使用神经网络方法（Neural networks， NN）和隐马可夫模型（Hidden markov models， HMM）进行操作，而根据算法不同得出的结果有所差别。

1.2.5 蛋白质二级结构及跨膜区结构预测对蛋白质二级结构预测采用PHD[16]在线分析实现（http：//sbg.bio.ic.ac.uk/phyre2/html/page.cgi？id=index）。同时，对希金斯炭疽菌中AC相关蛋白序列的跨膜区结构预测，利用TMHMM Server v. 2.0实现（http：//cbs.dtu.dk/services/TMHMM-2.0/）[15]。

1.2.6 亚细胞定位分析对希金斯炭疽菌中AC相关蛋白序列进行亚细胞定位分析，利用ProtComp v9.0（http：///berry.phtml？topic=protcompan&group=programs&subgroup=proloc）实现[17]，以期获得蛋白质的定位情况。

2 结果与分析

2.1 保守结构域预测结果

基于SMART分析网站，对ChCap1、ChCap2合并序列进行保守结构域分析。结果表明，Srv2在C端含有两个相同的CARP保守结构域，合并序列也含有两个CARP保守结构域，将其初步命名为腺苷酸环化酶蛋白（Adenylate cyclase protein），ChSrv2（图1）。

2.2 ChSrv2与Srv2氨基酸组成分析结果

根据组成蛋白质的氨基酸残基的理化性质，将其分为酸性氨基酸、碱性氨基酸、非极性R基氨基酸、不带电荷的极性R基氨基酸等四大类。对ChSrv2与Srv2中氨基酸残基组成进行对比分析。结果表明，ChSrv2与Srv2的氨基酸数量以及所占比例、所含最高（最低）比例氨基酸及其所占比例方面均具有较大的一致性（表2）。Srv2所含最高比例的氨基酸为丝氨酸（Ser），比例为11.00%，而ChSrv2含最高比例的氨基酸也为Ser，比例为9.60%;在所含最低比例的氨基酸方面，Srv2为半胱氨酸（Cys），比例为0.80%，ChSrv2也为Cys，最低比例为0.40%（表2）。

2.3 Srv2与ChSrv2理化性质分析结果

Srv2与ChSrv2在氨基酸数量、相对分子质量、理论等电点、负电荷氨基酸残基数、正电荷氨基酸残基数、分子式以及原子数量、脂肪族氨基酸指数、总平均亲水性等方面均存在着较大的一致性，特别是在理论等电点、不稳定系数，ChCap2与Srv2相似，理论等电点属于酸性范围内，不稳定系数均大于40，属于不稳定蛋白;ChCap1与Srv2则具有较大的差异，其理论等电点属于偏碱性范围，其不稳定系数小于40，为稳定蛋白（表3）。

2.4 转运肽和信号肽特征

转运肽是一种由12～60个氨基酸残基所组成的前导序列，其功能为引导那些在细胞溶质中合成的蛋白质进入线粒体和叶绿体等细胞器。除了细胞信号蛋白外各种内在蛋白均利用导肽到达细胞器。通过分析，Srv2与ChCap1、ChCap2均定位于分泌途径上，其预测值分别为0.883、0.701、0.660，所处的概率有所不同（表4）。就信号肽预测而言，无论是根据NN进行计算，还是根据HMM进行计算，Srv2与ChCap1、ChCap2均不含有信号肽。

2.5 蛋白疏水性预测结果

根据Protscale分析可知，ChCap1位于36位的丝氨酸（S），其亲水性最强，为-1.926，而位于129位的脯氨酸（P），其疏水性最强（亲水性最弱，下同），为1.626;ChCap2位于54位的苏氨酸（T），其亲水性最强，为-1.005，而位于174位的丙氨酸（A），其疏水性最强，为1.626。Srv2在亲水性（疏水性）最强的氨基酸及其所在位置方面均存在着较大的不同（图2）。

对Srv2与ChCap1、ChCap2的疏水性、亲水性数值进行统计分析。结果表明，3种蛋白在亲水性最强氨基酸残基位置、数值，疏水性最强氨基酸残基位置、数值，疏水性氨基酸残基数值总和以及亲水性氨基酸残基数值总和等方面均存在着较大差异，惟一的相同点是均为亲水性蛋白，这与通过GRAVY计算所得结果一致。

2.6 亚细胞定位特征

通过分析表明，希金斯炭疽菌ChSrv2亚细胞定位与Srv2相同，均定位于质膜上，这与前人对腺苷酸环化酶定位于细胞膜上的研究相一致。

2.7 Srv2在二级结构特征方面与ChCap1、ChCap2存在较大差异

通过分析表明，与Srv2相同，ChCap1、ChCap2均没有典型的跨膜结构。对其二级结构进行分析表明，在二级结构组成方面，ChCap1、ChCap2与Srv2存在着较大差异（图3）。

3 小结与讨论

作为炭疽菌属中重要的病原菌，希金斯炭疽菌主要危害十字花科蔬菜，造成重要的经济损失，国内外学者对其开展了全面而深入的研究。然而，生产上对其引起的炭疽病多采用苯并咪唑类化学药剂防治，而由于该药剂作用靶标以及作用时间的特殊性，均容易引起炭疽菌抗药性出现，严重地制约着上述药剂的进一步使用，急需开发用于防治炭疽病的新作用机制化学药剂，从而较好地挽回生产上的经济损失。

近年来，关于AC在酵母[18]、稻瘟菌[19]、大豆疫霉[20]等真核生物中的功能研究已积累了较多的试验数据，而对于危害禾本科植物造成严重损失的禾谷炭疽菌的AC研究却鲜有报道，随着该病菌全基因组序列的公布，国内外学者对其开展致病基因、抗药性基因的研究将日趋深入。本研究基于酿酒酵母中已经报道的Srv2，利用Blast比对、关键词搜索以及通过SMART保守结构域分析、细胞信号肽、跨膜区结构以及二级结构等生物信息学分析，明确该菌中ChCap1、ChCap2与Srv2在理化性质、二级结构、亚细胞定位方面均具有较大的差异性，同时，通过对上述两个腺苷酸环化酶相关蛋白与其他物种中的同源序列进行Blast比对分析，明确ChCap1、ChCap2分别是希金斯炭疽菌腺苷酸环化酶蛋白序列的重要组成部分，其分别位于N端和C端。通过对其进行序列合并，并结合其SMART保守结构域分析、理化性质、细胞信号肽、跨膜区结构以及二级结构、亚细胞定位等生物信息学分析，结果表明合并后的序列在上述特征、性质方面与Srv2具有较大的相似性。该研究为进一步解析希金斯炭疽菌腺苷酸环化酶的序列以及功能研究提供重要的理论指导。

参考文献：

[1] 沈瑞清，张萍，郭成瑾，等.宁夏炭疽菌属真菌资源研究[J].河南农业科学，2012，41（5）：100-102，149.

[2] 梁惠凌，唐辉.广西常见花卉真菌性病害的防治[J].广西园艺， 2002（2）：18-19.

[3] HYDE K， CAI L， CANNON P， et al. Colletotrichum-names in current use[J]. Fungal Diversity， 2009， 39： 147-182.

[4] 卢博彬，杨暹.菜心炭疽病研究进展[J].长江蔬菜，2009（24）： 1-5.

[5] 张华，周而勋，刘自珠，等.菜心炭疽病苗期抗病性鉴定技术[J].华南农业大学学报，1998，19（3）：50-53.

[6] 张华，刘自珠，郑岩松，等.菜心品种资源炭疽病抗性鉴定[J]. 广东农业科学，2000（3）：47-49.

[7] 李洋，刘长远，陈秀蓉，等.辽宁省葡萄炭疽菌鉴定及对多菌灵敏感性研究[J].植物保护，2009（4）：74-77.

[8] 韩国兴，礼茜，孙飞洲，等.杭州地区草莓炭疽病病原鉴定及其对多菌灵和乙霉威的抗药性[J].浙江农业科学，2009（6）： 1169-1172.

[9] 徐大高，潘汝谦，郑仲，等.芒果炭疽病菌对多菌灵的抗药性监测[J].华南农业大学学报，2004，32（1）：34-36.

[10] 杨叶，何书海，张淑娟，等.海南芒果炭疽菌对多菌灵的抗药性测定[J].热带作物学报，2008，29（1）：73-77.

[11] 詹儒林，李伟，郑服丛.芒果炭疽病菌对多菌灵的抗药性[J]. 植物保护学报，2005，32（1）：71-76.

[12] 张令宏，李敏，高兆银，等.抗多菌灵的芒果炭疽病菌的杀菌剂筛选及其交互抗性测定[J].热带作物学报，2009，30（3）： 347-352.

[13] ALTSCHUL S F， MADDEN T L， SCHAFFER A A， et al. Gapped BLAST and PSI-BLAST： A new generation of protein database search programs[J]. Nucleic Acids Res，1997，25（17）： 3389-3402.

[14] EMANUELSSON O， BRUNAK S， VON H G， et al. Locating proteins in the cell using TargetP， SignalP and related tools[J]. Nature Protocols， 2007， 2（4）： 953-971.

[15] BENDTSEN J D， NIELSEN H， VON H G， et al. Improved prediction of signal peptides： SignalP 3.0[J]. Journal of Molecular Biology， 2004， 340（4）： 783-795.

[16] KELLEY L A， STERNBERG M J. Protein structure prediction on the Web： A case study using the Phyre server[J]. Nature Protocals， 2009， 4（3）： 363-371.

[17] EMANUELSSON O， NIELSEN H， BRUNAK S， et al. Predicting subcellular localization of proteins based on their N-terminal amino acid sequence[J]. Journal of Molecular Biology， 2000， 300（4）： 1005-1016.

[18] GERST J E， FERGUSON K， VOJTEK A， et al. CAP is a bifunctional component of the Saccharomyces cerevisiae adenylyl cyclase complex[J]. Molecular and Cellular Biology， 1991， 11（3）： 1248-1257.

第9篇

关键词：结核分枝杆菌；38kDa；生物信息学；结构；功能

Bioinformatics Analysis for the Structure and Fuction of 38kDa Protein of Mycobacterium Tuberculosis

ZHANG Yi-qing1，YANG Yuan-yuan2，DING Shu-qin1

（1.Ningxia Medical University，Yinchuan 750004，Ningxia，China；2.The First People's Hospital of Yinchuan，Yinchuan 750001，Ningxia，China）

Abstract：Objective To predict the structure and function of recombinant 38kDa of Mycobacterium tuberculosis using bioinformatics method . Methods By online analysis at bioinformatics websites such as NCBI and Expasy ，employing software packages such as DNAstar and Rasmolto do multi-sequence homological alignment， secondary structure and tertiary structure，antigenic epitope analysis，etc. Results Similarity of 38kDa of Mycobacterium tuberculos compared to phosphate-binding protein of Mycobacterium tuberculosis was 87% . Analysis of the predicted protein indicated a molecular mass of 39113.47 Da， PI was 11.779 ， two transmembrane region， function sites and eight antigen epitope were found . Conclusion Bioinformatic is valuable to the study 38kDa 6 ofMycobacterium tuberculosis.

Key words：Mycobacterium tuberculosis ； 38kDa ； Bioinformatics；Structure and fuction

结核病是全球卫生问题之一。2012年WHO的数据显示，全世界约有860万人罹患结核病，130万人死于结核病[1]。中国是全球22个结核病高负担国家之一，卫计委已将结核病列为全国重点控制重大疾病之一。及时有效的诊断对结核病的防治具有重要的意义。结核分枝杆菌诊断抗原的筛选是目前研究的热点。

38kDa 蛋白又名pab，是一种磷酸盐转运蛋白，是MTB分泌较多的抗原。研究表明其属于分泌蛋白，结核病患者体内抗38kDa 蛋白抗体水平较高[2]。38KDa 蛋白广泛用于结核病的血清学诊断试验，检测的敏感性和特异性均较高。有关报道38kDa 的诊断特异度在88%～100%之间，痰涂片阳性患者诊断灵敏度36%～89%，痰涂片阴性患者灵敏度16%～54%、肺外结核诊断灵敏度12%～56%[3]。Wu X[4]的研究成果表明：38KDa 蛋白诊断结核病的敏感性为73.6%，特异性为85.4%，并且发现PPD 阳性血清中的抗38KDa 抗体水平高于PPD 阴性。国内张萍等[5]研究重组38KDa 蛋白用于结核病血清学诊断，发现重组38KDa蛋白检测结核病的敏感性为65.5%，特异性为98.4%，且与痰检阳性的一致率为69.8%。38KDa 蛋白有较好的应用前景，重组38KDa 蛋白作为结核病皮试诊断试剂，其敏感性和特异性都优于目前的结核菌素试验。然而有关38KDa蛋白的基本理化特性、二级结构等的研究报道很少。本研究拟先对其进行生物信息学预测分析，为后续更好的的实验研究奠定基础。

1 资料与方法

1.1一般资料结核分枝杆菌38kDa蛋白全长基因序列源自GenBank（Sequence ID： lcl|4289）。

1.2方法通过NCBI网站（http：//ncbi.nlm.nih.gov/），进入blast 界面，进行核酸和蛋白质的同源性比较。利用Prot Param（http：///tools/protparam/html）预测蛋白质理化性质。通过PredictProtein （http： cubic.bioc. columbia. edu/predi ctprotein/）预测氨基酸序列的跨膜区，用DNAstar软件预测其二级结构。通过SMART（http： //smart. embl-heidelberg.de/smart/show-motifs.pl）预测其结构域。

2 结果

2.1氨基酸序列及理化特性预测 38kDa基因序列由1124个bp组成，编码368个氨基酸，其中50 个碱性氨基酸（K，R），13个酸性氨基酸（D，E），112 个疏水性氨基酸（A，I，L，F，W，V），106个极性氨基酸（N，C，Q，S，T，，Y）。该蛋白的分子质量单位为39113.47 Da，理论等电点为11.779，碱性氨基酸残基（Arg+Lys）百分比为15.6%，酸性氨基酸残基（Asp+Glu）百分比为17.2%，在哺乳动物体外的半衰期为100h，在酵母、大肠埃希菌中的半衰期分别大于20h和10h，在溶液中的不稳定指数为60.32，脂溶性指数为62.72，两亲性指数为-0.436。

2.2氨基酸序列的同源性分析如图1所示，38kDa基因氨基酸序列与结核分枝杆菌磷酸盐转运蛋白（Sequence ID： ref|WP_052645811.1|）同源性达87%。

图1 38kDa基因氨基酸序列的同源性分析

2.3二级结构预测如图2所示，经DNAstar软件预测，38KDa蛋白的二级结构中α-螺旋占21%，β-片层占17%，转角占51%，无规则卷曲占11%。

图2 38kDa蛋白二级结构预测

2.4跨膜区域、结构域预测跨膜区域如图3所示，该蛋白跨膜区有2个，分别为7-23，7-105，该蛋白主要位于细胞外，说明其为分泌性蛋白。SMART预测结果显示该蛋白的结构域有5个，分别位于8-22、35-47、48-79、214-232、233-286。

图3 38kDa蛋白跨膜区域预测

2.5信号肽预测如图4所示，经Signal法预测显示38kDa蛋白的信号肽长为20个氨基酸残基，具于1-20，剪切位点位于20-21氨基酸残基之间。

图4 38 kDa蛋白信号肽预测

3 讨论

随着近年来生物学分子信息的发展，用较低的成本和较快的时间，通过计算机模拟相关的辅助信息可以获得大量的结构和功能信息。本研究中根据对38kDa蛋白氨基酸序列及理化特性预测，我们得知38kDa基因序列由1124个bp组成，编码368个氨基酸，其中50 个碱性氨基酸（K，R），13个酸性氨基酸（D，E），112 个疏水性氨基酸（A，I，L，F，W，V），106个极性氨基酸（N，C，Q，S，T，，Y）。该蛋白的分子质量单位为39113.47 Da，理论等电点为11.779，碱性氨基酸残基（Arg+Lys）百分比为15.6%，酸性氨基酸残基（Asp+Glu）百分比为17.2%，在哺乳动物体外的半衰期为100h，在酵母、大肠埃希菌中的半衰期分别大于20h和10h，在溶液中的不稳定指数为60.32，脂溶性指数为62.72，两亲性指数为-0.436。氨基酸同源性比对发现其基因序列与Genbank公共数据库检索出的与结核分枝杆菌磷酸盐转运蛋白同源性达87%，说明结核分枝杆菌38kDa蛋白与磷酸盐转运蛋白有很高的同源性，但二者仍有差别[6]。经蛋白质二级结构分析，该蛋白序列中α-螺旋占21%，β-片层占17%，转角占51%，无规则卷曲占11%。该蛋白跨膜区有2个，分别为7-23，7-105，该蛋白主要位于细胞外，说明其为分泌性蛋白。SMART预测结果显示该蛋白的结构域有5个，分别位于8-22、35-47、48-79、214-232、233-286。信号肽是一段连续的氨基酸序列，它能够控制蛋白质分泌路径和引导蛋白质到达特定的组织细胞[7]。研究信号肽问题对于了解蛋白质功能、研究疾病机理以及研制新药物等方面都有着重要的作用。本实验我们经Signal法预测结果显示38kDa蛋白的信号肽长为20个氨基酸残基，具于1～20，剪切位点位于20-21氨基酸残基之间。

本研究我们通过生物信息学原理对结核分枝杆菌38 kDa蛋白有了初步的了解和认识，至于该蛋白的获得及其在结核病诊断及治疗中的价值究竟有多大？还需后续的实验研究加以证实。

参考文献：

[1]Organization， W.H.Global tuberculosis control epidemiology，strategy， financing WHO report，2012.

[2]CHAN ED， HEIFETS I， ISEMAN MD. Immunogic diagnosis of tuberculosis： a review[J].Tubercle and Lung Disease， 2000， 80（3）： 131- 140.

[3]Julián E， Matas L， Alcaide J，et al. Comparison of antibody responses to a potential combination of specific glycolipids and proteins for test sensitivity improvement in tuberculosis serodiagnosis [J]. Clin Diagn Lab Immunol， 2004 ；11（1）：70-76.

[4]Wu X，Yang Y，Zhang J，et al.Humoral immune responses against the Mycobacterium tuberculosis 38-kilodalton， MTB48， and CFP-10/ESAT-6 antigens in tuberculosis[J]. Clin Vaccine Immunol， 2010，17（3）：372-375.

[5]Zhang Ping，Zeng Xiao-fan， Ding Jian-zhu， et al. Evaluation of thecell wall antigen and recombinant 38Kd protein of Mycobacterium

tuberculosis for serodiagnostic tests[J]. Chinese Journal of Microecology，2009，21（1）：73-74.

免责声明以上文章内容均来源于本站老师原创或网友上传，不代表本站观点，与本站立场无关，仅供学习和参考。本站不是任何杂志的官方网站，直投稿件和出版请联系出版社。

生物信息学分析优选九篇

第1篇

第2篇

第3篇

第4篇

第5篇

第6篇

第7篇

第8篇

第9篇

生物统计论文

生物技术进展论文

生物实验论文

生物资源论文

生物类论文

生物学论文

生物专业论文

生物技术论文

生物制药论文

生物学科的学科特点

生物科学和生物学科的区别

生物多样性对人类的意义

生物技术

生物资源

中国生物美容

生物磁学

生物学

中国肿瘤生物治疗

文秘服务

期刊咨询

杂志订阅