欢迎来到易发表网,发表咨询:400-808-1701 订阅咨询:400-808-1721

关于我们 期刊咨询 科普杂志

生物信息学分析优选九篇

时间:2023-09-28 15:45:05

生物信息学分析

生物信息学分析第1篇

关键词: 生物信息学, 信息处理,模式识别

Information Processing in the Bioinformatics

Abstract: Bioinformatics, the anagram which incorporates information science into the biology and with its concept takes shape, is a newly developed multi-disciplinary field which has sprung up vigorously since the late 80’s. In this paper, the main research topics of bioinformatics were reviewed, including the coding of genetic information, gene recognition, complexity of nucleotide sequence, correlation structure and fractal characteristic of nucleotide sequence, and the simulation and analysis of genomic regulation model. The information analysis and processing scenarios involved are also included, together with their many successful applications and open problems appearing in the literature. It is believed that the combination of information science and life science will greatly accelerate the progress of study for life science per se.

Keywords: Bioinformatics, Information processing, Pattern recognition

:10000多字

有参考文献

200元

备注:此文版权归本站所有;。

生物信息学分析第2篇

关键词: 生物信息学 农业研究领域 应用

“生物信息学”是英文单词“Bioinformatics”的中文译名,其概念是1956年在美国田纳西州Gatlinburg召开的“生物学中的信息理论”讨论会上首次被提出的[1],由美国学者Lim在1991年发表的文章中首次使用。生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段[2]。2003年4月14日,美国人类基因组研究项目首席科学家Collins F博士在华盛顿隆重宣布人类基因组计划(Human Genome Project,HGP)的所有目标全部实现[3]。这标志着后基因组时代(Post Genome Era,PGE)的来临,是生命科学史中又一个里程碑。生物信息学作为21世纪生物技术的核心,已经成为现代生命科学研究中重要的组成部分。研究基因、蛋白质和生命,其研究成果必将深刻地影响农业。本文重点阐述生物信息学在农业模式植物、种质资源优化、农药的设计开发、作物遗传育种、生态环境改善等方面的最新研究进展。

1.生物信息学在农业模式植物研究领域中的应用

1997年5月美国启动国家植物基因组计划(NPGI),旨在绘出包括玉米、大豆、小麦、大麦、高粱、水稻、棉花、西红柿和松树等十多种具有经济价值的关键植物的基因图谱。国家植物基因组计划是与人类基因组工程(HGP)并行的庞大工程[4]。近年来,通过各国科学家的通力合作,植物基因组研究取得了重大进展,拟南芥、水稻等模式植物已完成了全基因组测序。人们可以使用生物信息学的方法系统地研究这些重要农作物的基因表达、蛋白质互作、蛋白质和核酸的定位、代谢物及其调节网络等,从而从分子水平上了解细胞的结构和功能[5]。目前已经建立的农作物生物信息学数据库研究平台有植物转录本(TA)集合数据库TIGR、植物核酸序列数据库PlantGDB、研究玉米遗传学和基因组学的MazeGDB数据库、研究草类和水稻的Gramene数据库、研究马铃薯的PoMaMo数据库,等等。

2.生物信息学在种质资源保存研究领域中的应用

种质资源是农业生产的重要资源,它包括许多农艺性状(如抗病、产量、品质、环境适应性基因等)的等位基因。植物种质资源库是指以植物种质资源为保护对象的保存设施。至1996年,全世界已建成了1300余座植物种质资源库,在我国也已建成30多座作物种质资源库。种质入库保存类型也从单一的种子形式,发展到营养器官、细胞和组织,甚至DNA片段等多种形式。保护的物种也从有性繁殖植物扩展到无性繁殖植物及顽拗型种子植物等[6]。近年来,人们越来越多地应用各种分子标记来鉴定种质资源。例如微卫星、AFLP、SSAP、RBIP和SNP等。由于对种质资源进行分子标记产生了大量的数据,因此需要建立生物信息学数据库和采用分析工具来实现对这些数据的查询、统计和计算机分析等[7]。

3.生物信息学在农药设计开发研究领域中的应用

传统的药物研制主要是从大量的天然产物、合成化合物,以及矿物中进行筛选,得到一个可供临床使用的药物要耗费大量的时间与金钱。生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。生物信息学为药物研发提供了新的手段[8,9],导致了药物研发模式的改变[10]。目前,生物信息学促进农药研制已有许多成功的例子。ItzstEin等设计出两种具有与唾液酸酶结合化合物:4-氨基-Neu5Ac2en和4-胍基-Neu5Ac2en。其中,后者是前者与唾液酸酶的结合活性的250倍[11]。目前,这两种新药已经进入临床试验阶段。TANG SY等学者研制出新一代抗AIDS药物saquinavir[12]。Pungpo等已经设计出几种新型高效的抗HIV-1型药物[13]。杨华铮等人设计合成了十多类数百个除草化合物,经生物活性测定,部分化合物的活性已超过商品化光合作用抑制剂的水平[14]。

现代农药的研发已离不开生物信息技术的参与,随着生物信息学技术的进一步完善和发展,将会大大降低药物研发的成本,提高研发的质量和效率。

4.生物学信息学在作物遗传育种研究领域中的应用

随着主要农作物遗传图谱精确度的提高,以及特定性状相关分子基础的进一步阐明,人们可以利用生物信息学的方法,先从模式生物中寻找可能的相关基因,然后在作物中找到相应的基因及其位点。农作物的遗传学和分子生物学的研究积累了大量的基因序列、分子标记、图谱和功能方面的数据,可通过建立生物信息学数据库来整合这些数据,从而比较和分析来自不同基因组的基因序列、功能和遗传图谱位置[15]。在此基础上,育种学家就可以应用计算机模型来提出预测假设,从多种复杂的等位基因组合中建立自己所需要的表型,然后从大量遗传标记中筛选到理想的组合,从而培育出新的优良农作物品种。

5.生物信息学在生态环境平衡研究领域中的应用

在生态系统中,基因流从根本上影响能量流和物质流的循环和运转,是生态平衡稳定的根本因素。生物信息学在环境领域主要应用在控制环境污染方面,主要通过数学与计算机的运用构建遗传工程特效菌株,以降解目标基因及其目标污染物为切入点,通过降解污染物的分子遗传物质核酸 DNA,以及生物大分子蛋白质酶,达到催化目标污染物的降解,从而维护空气[16]、水源、土地等生态环境的安全。

美国农业研究中心(ARS) 的农药特性信息数据库(PPD) 提供 334 种正在广泛使用的杀虫剂信息,涉及它们在环境中转运和降解途径的16种最重要的物化特性。日本丰桥技术大学(Toyohashi University of Technology) 多环芳烃危险性有机污染物的物化特性、色谱、紫外光谱的谱线图。美国环保局综合风险信息系统数据库(IRIS) 涉及 600种化学污染物,列出了污染物的毒性与风险评价参数,以及分子遗传毒性参数[17]。除此之外,生物信息学在生物防治[18]中也起到了重要的作用。网络的普及,情报、信息等学科的资源共享,势必会创造出一个环境微生物技术信息的高速发展趋势。

6.生物信息学在食品安全研究领域中的应用

食品在加工制作和存储过程中各种细菌数量发生变化,传统检测方法是进行生化鉴定,但所需时间较长,不能满足检验检疫部门的要求,运用生物信息学方法获得各种致病菌的核酸序列,并对这些序列进行比对,筛选出用于检测的引物和探针,进而运用PCR法[19]、RT-PCR法、荧光RT-PCR法、多重PCR[20]和多重荧光定量PCR等技术,可快速准确地检测出细菌及病毒。此外,对电阻抗、放射测量、ELISA法、生物传感器、基因芯片等[21-25]技术也是未来食品病毒检测的发展方向。

转基因食品检测是通过设计特异性的引物对食品样品的DNA提取物进行扩增,从而判断样品中是否含有外源性基因片段[26]。通过对转基因农产品数据库信息的及时更新,可准确了解各国新出现和新批准的转基因农产品,便于查找其插入的外源基因片段,以便及时对检验方法进行修改。目前由于某些通过食品传播的病毒具有变异特性,以及检测方法的不完善等因素影响,生物信息学在食品领域的应用还比较有限,但随着食品安全检测数据库的不断完善,相信相关的生物信息学技术将在食品领域发挥越来越重要的作用。  生物信息学广泛用于农业科学研究的各个领域,但是仅有信息资源是不够的,选出符合自己需求的生物信息就需要情报部门,以及信息中介服务机构提供相关服务,通过出版物、信息共享平台、数字图书馆、电子论坛等信息媒介的帮助,科研工作者可快速有效地找到符合需要的信息。目前我国生物信息学发展还很不均衡,与国际前沿有一定差距,这需要从事信息和科研的工作者们不断交流,使得生物信息学能够更好地为我国农业持续健康发展发挥作用。

参考文献:

[1]Yockey HP,Platzman RP,Quastler H.Symposium on Information.Theory in Biology.Pergamon Press,New York,London,1958.

[2]郑国清,张瑞玲.生物信息学的形成与发展[J].河南农业科学,2002,(11):4-7.

[3]骆建新,郑崛村,马用信等.人类基因组计划与后基因组时代.中国生物工程杂志,2003,23,(11):87-94.

[4]曹学军.基因研究的又一壮举——美国国家植物基因组计划[J].国外科技动态,2001,1:24-25.

[5]MICHAEL B.Genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[J].PhilosTransR Soc Lond B Bio Sci,2002,357(1422):731-736.

[6]卢新雄.植物种质资源库的设计与建设要求[J].植物学通报,2006,23,(1):119-125.

[7]GUY D,NOEL E,MIKE A.Using bioinformatics to analyse germplasm collections [J].Springer Netherlands,2004:39-54.

[8]郑衍,王非.药物生物信息学,化学化工出版社,2004.1:214-215.

[9]俞庆森,邱建卫,胡艾希.药物设计.化学化工出版社,2005.1:160-164.

[10]Austen M,Dohrmann C.Phenotype—first screening for the identification of novel drug targets.Drug Discov Today,2005,10,(4):275-282.

[11]ARUN AGRAWAL,ASHWINI CHHATRE.State involvement and forest cogovernance:Evidence from the IndianHmi alayas.StComp International Developmen.t Sep 2007:67-86.

[12]TANG SY.Institutionsand collective action:Self-governance in irrigation [M].San Francisco,CA:ICSPress,1999.

[13]PUNGPO P,SAPARPAKORN P,WOLSCHANN P,et a.l Computer-aided moleculardesign of highly potentHIV-1 RT inhibitors:3D QSAR and moleculardocking studies of efavirenz derivatives[J].SAR QSAR EnvironRes,2006,17,(4):353-370.

[14]杨华铮,刘华银,邹小毛等.计算机辅助设计与合成除草剂的研究[J].计算机与应用化学,1999,16,(5):400.

[15]VASSILEV D,LEUNISSEN J,ATANASSOV A.Application of bioinformatics in plant breeding[J].Biotechnology & Biotechnological Equipment,2005,3:139-152.

[16]王春华,谢小保,曾海燕等.深圳市空气微生物污染状况监测分析[J].微生物学杂志,2008,28,(4):93-97.

[17]程树培,严峻,郝春博等.环境生物技术信息学进展[J].环境污染治理技术与设备,2002,3,(11):92-94.

[18]史应武,娄恺,李春.植物内生菌在生物防治中的应用[J].微生物学杂志,2009,29,(6):61-64.

[19]赵玉玲,张天生,张巧艳.PCR 法快速检测肉食品污染沙门菌的实验研究[J].微生物学杂志,2010,30,(3):103-105.

[20]徐义刚,崔丽春,李苏龙等.多重PCR方法快速检测4种主要致腹泻性大肠埃希菌[J].微生物学杂志,2010,30,(3) :25-29.

[21]索标,汪月霞,艾志录.食源性致病菌多重分子生物学检测技术研究进展[J].微生物学杂志,2010,30,(6):71-75

[22]朱晓娥,袁耿彪.基因芯片技术在基因突变诊断中的应用及其前景[J].重庆医学,2010,(22):3128-3131.

[23]陈彦闯,辛明秀.用于分析微生物种类组成的微生物生态学研究方法[J].微生物学杂志,2009,29,(4):79-83.

[24]王大勇,方振东,谢朝新等.食源性致病菌快速检测技术研究进展[J].微生物学杂志,2009,29,(5):67-72.

生物信息学分析第3篇

摘要:信息素养是培养大学生能力的普及标准,是国家进行素质教育的一种手段。为树立动物医学专业学生“终生学习”理念,培养信息处理能力和解决问题的综合能力,以及为国家培养可持续发展人才和有竞争力的人才,笔者通过分析动物医学专业学生的特点,从信息意识、信息能力、信息道德三个维度建立了《动物医学专业学生信息素养培养标准》,并依据该标准给出了培养途径和方法。动物医学是个传统的行业,很多动物医学专业的学生认为:“信息素养的培养、信息技术的学习与其关系不大,只要把专业课学好,多出去实践就足够了。”“专业课都学不过来还学这些信息技术课有啥用。”“毕业了去企业搞销售不坐办公室,根本也用不上这些东西。”“会给动物看病就行,原来没有计算机不也一样看病?”这些认知差距严重影响着动物医学专业学生信息素养的意识和能力[1]。在信息与能源并重的社会,不管哪个行业都应该重视信息资源,获得信息就是人生的赢家。因此,培养信息素养,是为动物医学行业长足发展奠定基础。依据科学性原则、客观性原则、整体性原则、目标性原则和国家对大学生信息素养培养的标准,参照其他行业信息素养培养标准,结合动物医学专业学生的特点,锦州医科大学制订了《动物医学专业学生信息素养培养标准》。它是培养动物医学专业学生信息素养的有效依据,是提升全面素质教育的有效工具,对行业发展和社会进步起到重要的作用[2]。

1信息素养的概念及研究现状

信息素养的概念于1974年被提出,主要是指人们对信息认识、敏感程度和信息处理的能力,以及在信息实施的过程中对行为规范遵守的程度[3]。信息素养作为教育的热点问题,已经在各国教育界进行了普遍性的研究,专家给出了信息素养的概念,分析了信息素养的内涵,制订了一些具有通用性的、大众化的大学生信息素养标准。我国教育部的专家也根据信息素养的内涵建立了《高等教育信息素养能力标准》。信息素养的研究成果为本课题的研究奠定了理论基础。通过调查发现,现有的关于信息素养的研究还不够深入,针对不同行业和学生特点,信息素养的培养目标和培养方案应该是不同的,不能一概而论。例如我国医学教育质量保证体系研究课题组就建立了相应的《本科医学教育标准———临床医学专业(试行)》。这标志着信息素养的研究开始细化,已经进入更深入地研究层次。

2《动物医学专业学生信息素养培养标准》的内容

2.1信息意识

2.1.1信息敏感度信息敏感度主要是指学生对动物医学专业和相关专业知识的反应程度,主要考查学生是否能够及时收集、捕捉专业信息;是否有利用信息技术解决问题的想法;是否树立了“终生学习”的理念;是否具有信息安全意识;是否具有信息成本意识;是否能够从细节中发现信息等。2.1.2信息需求度信息需求度是指学生对信息的需求情况,主要考查学生是否能够准确地表达和描述自己的信息需求;在遇见难题时,是否有通过信息查询、检索解决问题的愿望;是否能够不定期地更新专业知识等。

2.2信息能力

2.2.1信息获取能力信息获取能力是指学生掌握获取信息及相关知识的技能,包括策略、途径、方式方法,主要考查学生是否能够确定信息目标[4];是否具有组合检索的策略;是否能够正确选用检索工具;是否能够从多种途径中获取相关信息等。2.2.2信息吸纳能力信息吸纳能力是指在获取到信息后,对信息的评价判断行为,主要考查学生对获得的信息是否能够真正理解其含义[5];是否能够对信息进行识别,从信息中选取可用信息,去掉无用信息;是否能够对信息进行判断,确认其质量的好坏等。2.2.3信息处理能力信息处理能力是指对已经识别的信息进行加工处理的能力,主要考查学生能否对获得的信息进行分类;是否能够保存信息;是否能够增加信息、更改信息、删除信息、区分信息;是否能够对信息进行深入分析;是否能够归纳总结相关信息;是否能建立信息之间的关联等。2.2.4信息应用能力信息应用能力是指对有效信息的使用和利用情况,主要考查学生是否能将信息进行有效的迁移,转化为自己的知识;是否能够通过信息来分析问题;是否能够根据信息制订解决问题的方案;是否能够进行科学总结和撰写科研论文;是否能够进行一定的创新,提出新观点、新方法和新论断等[6]。

2.3信息道德

2.3.1信息道德规范信息道德规范是指在人的一生中应该遵守的道德标准,主要考查学生是否了解信息素养道德;是否能够正确判断道德规范标准;是否具有伦理道德意识等[7]。2.3.2信息安全意识信息安全意识是指学生应该遵守的法律规范或者道德准则,主要考查学生是否具有法律意识;是否具有信息保护意识;是否能够进行有效的知识产权保护;是否能够尊重他人的科技成果等。

3动物医学专业学生信息素养培养的途径

在建立了《动物医学专业学生信息素养培养标准》后,就要以标准为指导,进行科学有效地执行。信息素养的培养是个长期的工程,必须要配合有效的方法才会取得成效,锦州医科大学对动物医学专业学生实施信息素养教育的方法如下。

3.1开设多门信息素养课程

信息素养课程是对学生进行信息素养教育最直接、最有效的方法,学校在原有开设的计算机应用、文献检索两门课程的基础上,又新开设了计算机在畜牧业中的应用、兽医信息学、信息管理系统、计算机网络等多门信息素养课程,在理论讲解的同时,增加了实践操作的学时比例,强化了学生的信息素养能力[8]。

3.2教学模式和评价方式的改革

为了配合课程的实施,对原有的教学模式和评价方式进行了改革。在信息素养的培养过程中,加入了仿真平台,引导学生学习,学生可以在平台上反复地进行知识内容的学习,不断地累加和强化记忆,提高信息处理的能力。通过开展过程性考核和能力培养的评价方式,全面考核学生的学业态度、学习过程和学习能力,促使学生提高信息素养意识,树立终生学习的理念。教师改革课业布置方式,给学生创造更多的查找资料的机会,提高学生信息获取能力、吸纳能力、处理能力和应用能力[9]。

3.3积极参加社会实践

鼓励学生积极参加社会实践,到本行业的企事业单位锻炼。这对于提高学生专业水平,获取专业信息都是最好的方法,也是锻炼和培养学生多途径获取信息能力最有效的手段。学校鼓励学生在业余时间,如周末、假期参加实践,学生得到了锻炼的机会,也提高了信息应用的综合能力[10]。

3.4积极参与科研团队

鼓励学生积极参加教师的科研项目、大学生创新创业项目,以及科研团队。让学生从科研中学到严谨的科学态度,提高精益求精的科研能力,同时要求学生能够进行科研总结和撰写科研论文。这样可有效提高学生信息素养的道德意识和行为规范,锻炼了信息素养的应用能力。

4结语

生物信息学分析第4篇

>> 人组蛋白去乙酰化酶11的克隆表达与生物信息学分析 FZ6基因及其蛋白的生物信息学分析 拟南芥和大白菜YABBY蛋白家族的生物信息学分析 斑马鱼TATA结合蛋白的生物信息学分析 黄瓜DVR基因的生物信息学分析 金铁锁糖基转移酶PtT1的克隆与生物信息学分析 黄芩葡萄糖醛酸水解酶基因的克隆、生物信息学分析及表达 蓖麻油体固醇蛋白质的鉴定与生物信息学分析 结核分枝杆菌38kDa蛋白结构与功能的生物信息学分析 新疆细粒棘球绦虫EgAgB8/3蛋白的生物信息学分析及意义 棉铃虫的巧防技术 太子参分解代谢关键酶8′羟化酶基因的克隆及生物信息学分析 红白忍冬SABATH甲基转移酶基因克隆及其生物信息学分析 希金斯炭疽菌腺苷酸环化酶生物信息学分析 丹参类贝壳杉烯氧化酶(SmKOL)基因全长克隆及其生物信息学分析 唇形科植物脚6基脚6基焦磷酸合酶编码基因及其氨基酸序列的生物信息学分析 人ALK-1近端启动子的生物信息学分析 酵母转录因子结合位点保守性的生物信息学分析 玉米谷胱甘肽过氧化物酶的生物信息学分析 欧文氏杆菌铁代谢相关基因的生物信息学分析 常见问题解答 当前所在位置:l)分析棉铃虫类胰蛋白酶氨基酸序列的理化性质;运用DNAMAN软件比对分析氨基酸序列同源性;运用MEGA 5.0中的Fhylogenetic Tree方法构建分子系统发育树;运用在线工具ProtScale ()进行亲、疏水性的分析;运用Psort在线工具()进行蛋白质二级结构的分析预测;运用NCBI数据库中CDD在线工具(http://ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)进行功能结构域的分析。

2 结果与分析

2.1 棉铃虫类胰蛋白酶氨基酸序列理化性质分析

运用ProtParam在线软件分析棉铃虫7种类胰蛋白酶氨基酸序列理化性质,结果见表1。由表1可知,棉铃虫7种类胰蛋白酶在理论等电点、脂溶指数以及氨基酸组成等方面均表现出相似性。其相对分子质量约为70 000,等电点约为5.00,氨基酸数目为253~256,Ala、Cys、Gly和Thr残基含量较高。7种类胰蛋白酶的不稳定系数均较高,其中类胰蛋白酶Ⅲ的不稳定指数最低,为52.08,表明类胰蛋白酶在棉铃虫细胞内的稳定性较差,推测类胰蛋白酶代谢较为活跃,代谢周转的速度较快。棉铃虫7种类胰蛋白酶的脂溶指数均较低,属于亲水性蛋白质。

2.2 棉铃虫类胰蛋白酶氨基酸序列磷酸化位点预测分析

使用NetPhosk 2.0 Server在线工具对棉铃虫7种类胰蛋白酶的氨基酸序列分别进行预测Ser、Thr与Tyr位点处发生磷酸化的概率结果见表2。从表2可见,在氨基酸磷酸化位点中Ser的预测分值最高,表明Ser发生磷酸化的概率最高,并且发现类胰蛋白酶Ⅲ中不具有Thr磷酸化位点;只有类胰蛋白酶Ⅴ具有Tyr磷酸化位点。以类胰蛋白酶Ⅲ为例进行说明:其氨基酸序列在第83位、243位、246位、247位这4个Ser位点处都有可能发生磷酸化,但第247位Ser发生磷酸化的概率最大,为M3=0.973。

2.3 棉铃虫类胰蛋白酶氨基酸序列分子进化树分析

使用MEGA 5.0中的Fhylogenetic Tree方法构建分子系统发育树结果见图1。由图1可知,7种类胰蛋白酶分为两个分支,类胰蛋白酶Ⅰ、Ⅱ、Ⅶ与Ⅴ处于一个分支,类胰蛋白酶Ⅳ、Ⅲ与Ⅵ处于另一个分支。其中,类胰蛋白酶Ⅰ和类胰蛋白酶Ⅱ进化关系较近,类胰蛋白酶Ⅲ与类胰蛋白酶Ⅵ进化关系较近。

2.4 棉铃虫类胰蛋白酶的氨基酸序列分析

1)使用TMHMM 2.0在线工具对7种类胰蛋白酶的氨基酸序列跨膜结构进行预测分析,均不存在跨膜结构域。

2)使用ProtScale工具对7种蛋白酶的亲、疏水性进行分析。7种类胰蛋白酶的总平均亲水性为0.860~0.960,均表现为亲水性。其中,多肽链靠近N末端区域亲水性最强,最低分值为-0.500到-0.600,而C末端区域疏水性最强,最高分值为2.100到2.300。

3)用DNAMAN软件比对分析7种类胰蛋白酶的氨基酸序列同源性(图2)。在这7种蛋白酶氨基酸序列中,有较多保守的区域(如图2中深颜色区域所示)。经过分析发现,7种类胰蛋白酶氨基酸序列结构相似,同源性最高为85.71%。7种类胰蛋白酶中均含有高度保守的必需氨基酸残基,参与维持蛋白酶的空间结构及行使催化功能。比如第10、54、70、179、196、207与231位的Cys残基,它们之间能够形成二硫键以稳定蛋白酶的空间结构。第205位的Asp残基与228、238位的Gly残基能够与底物形成离子键、氢键,参与类胰蛋白酶对底物的识别与结合。第69位的His残基、114位的Asp残基与211位的Ser残基组成了类胰蛋白酶的催化基团,通过电子的传递,与底物分子中的Arg和(或)Lys残基羧基端肽键发生亲核反应,实现催化功能(氨基酸残基位置以类胰蛋白酶Ⅲ为准)。

2.5 棉铃虫类胰蛋白酶的功能结构域分析

使用NCBI数据库中CDD在线工具对类胰蛋白酶Ⅲ进行功能结构域分析(图3)。结果表明,类胰蛋白酶Ⅲ属于胰蛋白酶超家族,具有该家族特有的功能区域。类胰蛋白酶Ⅲ的16位(Ala)与17位(Arg)氨基酸残基之间含有一个自剪切位点(Cleavage site),该位点与酶翻译后的活化及转运有关;69(His)位、114(Asp)位、211(Ser)位氨基酸残基构成酶的催化位点(Active site);205(Asp)位、228(Gly)位、238(Gly)位氨基酸残基形成3个底物结合位点(Substrate binding sites),参与酶对底物的识别与结合,其他类胰蛋白酶的分析也得到相似的结果。

2.6 棉铃虫类胰蛋白酶的亚细胞定位分析

亚细胞定位预测结果见表3。由表3可以看出,类胰蛋白酶Ⅰ、Ⅱ主要位于内质网中,类胰蛋白酶Ⅲ主要位于内质网、液泡及细胞外基质中,而类胰白酶Ⅳ、Ⅴ、Ⅵ与Ⅶ主要位于细胞外基质中。亚细胞定位的多样性体现了类胰蛋白酶在棉铃虫生命活动过程中具有多样性的生物学功能,其中类胰白酶Ⅲ、Ⅳ、Ⅴ、Ⅵ与Ⅶ主要发挥消化作用,因为棉铃虫对食物的消化场所主要位于中肠(细胞外)。而类胰蛋白酶Ⅰ、Ⅱ与Ⅲ可能主要行使免疫保护作用,参与棉铃虫对外界环境的免疫应答。

2.7 棉铃虫类胰蛋白酶的二级结构分析预测

利用NPSA在线工具预测类胰蛋白酶的二级结构(表4)。由表4可知,无规卷曲是该类胰蛋白酶整体结构中的主要组成结构元件,β转角出现概率相对较小。α螺旋主要分布于氨基酸序列两侧,而无规卷曲、延伸链则主要分布在多肽链中间区段。

3 小结与讨论

本研究以棉铃虫肠道内7种类胰蛋白酶为研究对象,运用在线工具对其进行生物信息学分析。结果表明,7种类胰蛋白酶理化性质较为相似,为亲水性蛋白酶。Ser是类胰蛋白酶序列中磷酸化概率最大的氨基酸残基。分子系统发育树结果显示类胰蛋白酶Ⅲ与类胰蛋白酶Ⅵ进化关系较近,而类胰蛋白酶I和类胰蛋白酶Ⅱ在进化关系上更为接近。类胰蛋白酶不存在跨膜结构域,属于基质类蛋白,这与其亲水性的特点吻合。功能结构域分析发现类胰蛋白酶属于胰蛋白酶超家族,其氨基酸序列中含有自切割位点、若干催化残基与结合残基。类胰蛋白酶的亚细胞定位具有多样性,主要分布在细胞外与内质网中,这体现了类胰蛋白酶在棉铃虫生命活动过程中具有多样性的生物学功能。二级结构分析预测表明无规卷曲在该类胰蛋白酶整体结构中所占比例最大,是其主要的结构元件。氨基酸序列同源性分析,7种类胰蛋白酶氨基酸序列的同源性较高,达到了85.71%,并且含有高度保守的必需残基,参与维持蛋白酶的空间结构及行使催化功能,包括维持高级结构的Cys残基,形成底物结合口袋的结合残基及参与催化作用的催化残基。依据此研究结果,能够设计出与类胰蛋白酶活性中心特异性结合的抑制剂,抑制其活性,从而扰乱棉铃虫的正常消化,实现抗虫目的。

参考文献:

[1] 常团结,陈 蕾,路子显,等. 棉铃虫幼虫中肠类胰蛋白酶基因的克隆及在大肠杆菌中的表达[J]. 动物学报,2002,48(6):790-796.

[2] 任晓霞,韩召军,王荫长. 棉铃虫乙酰胆碱酯酶cDN段的克隆和序列分析[J]. 动物学报,2002,48(1):121-124.

[3] 郭线茹,蒋金炜,罗梅浩,等. 转基因抗虫烟草研究进展[J]. 昆虫知识,2005,42(4):358-363.

[4] CHOUGULE N P, GIRI A P,SAINANI M N, et al. Gene expression patterns of Helicoverpa armigera gut proteases[J]. Insect Biochemistry and Molecular Biology,2005,35(4):355-367.

[5] KANG Z, JIANG J H, WANG D, et al. Kunitz-type trypsin inhibitor with high stability from Spinacia oleracea L. seeds[J]. Biochemistry (Moscow),2009,74(1):102-109.

[6] TELANG M A, GIRI A P, SAINANI M N, et al. Characterization of two midgut proteinases of Helicoverpa armigera and their interaction with proteinase inhibitors[J]. Journal of Insect Physiology,2005,51(5):513-522.

[7] TAMHANE V A, CHOUGULE N P, GIRI A P, et al. In vivo and in vitro effect of Capsicum annum proteinase inhibitors on Helicoverpa armigera gut proteinases[J]. Biochim Biophys Acta,2005,1772(2):156-167.

[8] BOWN D P, GATEHOUSE J A. Characterization of a digestive carboxypeptidase from the insect pest corn earworm (Helicoverpa armigera) with novel specificity towards C-terminal glutamate residues[J]. European Journal of Biochemistry,2004, 271(10):2000-2011.

生物信息学分析第5篇

关键词:苹果;TCP;转录因子;全基因组分析

中图分类号:Q754文献标识号:A文章编号:1001-4942(2014)05-0012-06

TEOSINTE BRANCHED1/CYCLOIDEA/PROLIFERATING CELL FACTOR1(简称TCP)家族是一类植物特有的转录因子家族。最早发现的家族成员是玉米TB1(teosinte branched 1)基因,金鱼草CYC(cycloidea)基因和水稻PCF1、PCF2基因,这4个基因编码的蛋白都包含一段由约60个氨基酸组成的保守序列,该保守序列能形成一种非典型的螺旋-环-螺旋结构(non-canonical basic-Helix-Loop-Helix structure)[1,2,3]。根据其代表成员TB1、CYC和PCFs的首字母缩写,把能够编码这段保守氨基酸序列的基因命名为TCP基因,把这段保守的氨基酸序列命名为TCP结构域[2]。TCP结构域中的螺旋-环-螺旋区域(bHLH)含有两个由保守的亲水氨基酸构成的中性螺旋结构和一个负责连接两个螺旋区域的环结构。在第二个螺旋区域有一个特异的“LXXLL”基序,动物bHLH蛋白的研究结果表明这段基序可以通过调控转录的共激活单元结合到核定位蛋白上[4]。TCP家族成员除了含有TCP结构域外,还存在一个保守的R结构域[5],R结构域并不是所有的TCP转录因子共有的,它富含精氨酸、赖氨酸和谷氨酸等极性氨基酸,可以形成一个 亲水性的α螺旋[3]。

前人对CYC、TB1、PCFs和其他9条预测的拟南芥和玉米TCP基因进行了进化分析,结果表明,这12个基因可以被分为两个亚家族,一个包含有CYC和TB1,命名为CYC/TB1亚家族;另一个包括PCFs,命名为PCF亚家族。其中TCP结构域普遍存在于所有的TCP家族成员中,而R结构域则特异存在于CYC/TB1亚家族的一些基因中[3]。对多种菊亚纲植物的TCP基因家族成员之间的进化关系进行聚类分析,表明TCP基因家族在各物种间的多样化对其形态学上的进化具有重要作用[6]。Yao等通过对拟南芥23个TCP基因及水稻22个TCP基因的进化分析,将TCP家族分为三个亚家族:Class Ⅰ、Class Ⅱ和Class Ⅲ,同时对其结构域进行了序列比对,并分析了不同基因在不同组织中的表达模式[7]。

TCP家族转录因子主要在快速生长的组织或器官中表达,与植物细胞的分化和发育有密切关系。玉米TB1基因影响侧生分生组织的生长和发育[1,8,9];水稻TB1基因被认为是水稻侧枝发育的负调控元件[10];拟南芥TCP16基因对早期花粉的发育有重要作用[11]。拟南芥TCP20基因能够结合CYCB1的GCCCR元件,具有调控细胞分裂和生长的作用[12],可与AtTCP9基因对抗性地调控拟南芥叶片发育和茉莉酸代谢过程[13]。研究表明,拟南芥中的5个TCP基因:TCP2、TCP3、TCP4、TCP10和TCP24是microRNA 319a的靶基因,参与调控叶片的形态发生[14]。豆科模式植物百脉根中的LjCYC1和LjCYC3参与调控花分生组织的生长发育过程,另一类豆科植物豌豆中的CYC类TCP基因也参与控制背腹轴向不同类型花瓣的发育[15,16,17]。

2010年8月,Velasco等在Nature Genetics上发表了关于‘金冠’苹果基因组测序工作的文章,标志着苹果全基因组序列的测定已经完成[18],这一成果将苹果生物学研究带入了崭新的系统生物学时代,为研究者从全基因组水平对苹果进行研究奠定了基础。苹果RING finger、MAPK和MAPKK、MdWRKY转录因子及DREB转录因子家族基因已通过生物信息学的方法鉴定出来,并进行了全基因组分析和基因功能预测[19~22]。目前TCP转录因子家族的研究主要集中在模式植物拟南芥、水稻和玉米中,蔬菜和果树尤其是苹果中的报道还非常少。本文从苹果全基因组出发,利用生物信息学的方法,鉴定出苹果全部的TCP转录因子,对其家族进化关系及结构域序列保守性进行了系统预测和分析,以期为进一步研究MdTCP基因的作用奠定一定的理论基础。

1材料与方法

从苹果功能基因组数据库(http:///)下载TCP转录因子家族序列;从GDR数据库下载‘金冠’苹果全基因组序列,构建本地Blast数据库,以拟南芥TCP转录因子家族基因序列执行本地Blast(1e-003)搜索[23];合并两部分结果,利用Perl程序筛选,去掉重复序列,所得结果再利用PFAM及NCBI-CDD工具进行蛋白结构预测,删除不含TCP结构域的基因。利用ExPASy Proteomics Server(http:///),对所有TCP基因编码蛋白进行分子量、等电点预测。

从GDR数据库下载‘金冠’苹果基因组信息文件(assembly gff3 file),利用Perl程序选取TCP基因的染色置信息,并利用MapDraw工具进行染色体定位作图。

用MUSCLE进行序列比对,选取TCP结构域序列,再利用 MEGA5构建进化树。进化树生成算法采用邻接法(Neighbor-Joining,NJ),校验参数Bootstrap 重复1 000次[24];基因结构利用生物学软件Gene Structure Display Server(GSDS,http:///)分析获得;保守性分析则采用DNAMAN生物学软件进行保守序列比对。

2结果与分析

2.1苹果TCP转录因子家族成员的鉴定

利用生物信息学方法,从苹果全基因组鉴定得到52个TCP转录因子家族成员,根据其系统进化树分析结果,对其进行了系统编号。MdTCP对应的基因编号、基因组登录号、编码序列长度、外显子数量、蛋白长度、分子量、等电点、所在染色置和拟南芥同源基因等特征见表1。由表1可知,MdTCP蛋白长度在115 aa(MdTCP50)~612 aa(MdTCP27)范围内,等电点在5.41(MdTCP32)~10.65之间(MdTCP3)。如图1所示,有49个MdTCP基因存在于不同染色体上,其中5号染色体最多,有7个;3号染色体上没有分布;其余染色体上各有1~5个MdTCP基因分布。另外有3个MdTCP基因MdTCP50、MdTCP51和MdTCP52未发现相应的染色体定位信息。

2.2苹果TCP转录因子家族系统进化及基因结构分析

如图2所示,MdTCP基因的内含子和外显子数量表现出了较高的保守性,其中没有内含子的MdTCP基因有32个,占总数的61.5%;有1个内含子的有9个,占17.3%;有2个内含子的有7个,占13.5%;有3个和5个内含子的MdTCP基因分别有2个,各占3.8%。

图2苹果TCP转录因子家族系统进化树和基因结构分析

2.3苹果与拟南芥TCP转录因子家族系统进化及保守结构域分析

进化树分析(图3)表明,52个MdTCP转录因子可分为ClassⅠ、ClassⅡ和Class Ⅲ三类,分别包括22、4和26个,其中第二类数量较少,这与拟南芥和水稻中的规律是一致的[7]。前人研究表明,拟南芥中有24个TCP家族成员[7,25],由图3可知,不同的AtTCP转录因子与52个MdTCP转录因子有着不同的同源性,例如,AtTCP20与MdTCP22、MdTCP35、MdTCP47同源性较高,AtTCP9与MdTCP18同源性较高。对预测的52个苹果TCP转录因子蛋白序列进行保守结构域序列比对,结果发现,三类苹果TCP蛋白中均包含有TCP结构域,即TCP转录因子的特征序列――bHLH结构域(图4)。

3讨论与结论

随着越来越多物种全基因组测序工作的完成,海量的基因组数据、信息摆在我们面前,如何从这些数据中找到我们所需要的部分成为亟待解决的难题。利用生物信息学方法对基因组数据进行分析,研究各个物种间的进化关系和相互间的亲缘关系,以及物种内各基因家族成员的进化关系,能够为后续基因功能的研究提供一定的借鉴。本文利用生物信息学方法,对苹果基因组中的TCP转录因子进行了鉴定与分析。以期为今后研究苹果TCP转录因子的具体生理作用奠定一定的理论基础。

TCP转录因子在植物中分布较广,各物种间的分布数量存在一定差异。拟南芥TCP转录因子家族有24个成员,水稻有22个成员[7,25],本研究鉴定了52个苹果TCP家族成员。通过系统进化分析发现,MdTCP22、MdTCP35、MdTCP47与AtTCP20的同源性较高,MdTCP18与AtTCP9的同源性较高,结合拟南芥研究结果,这些基因可能在苹果生长发育及代谢过程中起作用;而MdTCP8、MdTCP9、MdTCP10、MdTCP11、MdTCP25和MdTCP49与AtTCP2、AtTCP3、AtTCP4和AtTCP10的同源性较高,说明它们有可能作为microRNA的靶基因参与苹果叶片的发育。借鉴拟南芥、水稻及其它物种中TCP转录因子在植物生长发育和相关代谢过程中的功能研究,探索MdTCP转录因子在苹果生长发育尤其是叶片和侧枝、某些激素代谢过程中的功能及其相互作用机制是今后苹果相关研究的重点。

参考文献:

[1]Doebley J, Stec A, Gustus C. Teosinte branched1 and the origin of maize: Evidence for epistasis and the evolution of dominance[J]. Genetics, 1995, 141(1):333-346.

[2]Luo D, Carpenter R, Vincent C, et al. Origin of floral asymmetry in Antirrhinum[J]. Nature, 1996,383:794-799.

[3]Cubas P, Lauter N, Doebley J, et al. The TCP domain: A motif found in proteins regulating plant growth and development[J]. Plant Journal, 1999, 18(2):215-222.

[4]Heery D M, Kalkhoven E, Hoare S, et al. A signature motif in transcriptional co-activators mediates binding to nuclear receptors[J]. Nature, 1997,387:733-736.

[5]Kosugi S, Ohashi Y. PCF1 and PCF2 specifically bind to cis elements in the rice proliferating cell nuclear antigen gene[J]. The Plant Cell, 1997,9(9):1607-1619.

[6]Reeves P A, Olmstead R G. Evolution of the TCP gene family in Asteridae:cladistic and network approaches to understanding regulatory gene family diversification and its impact on morphological evolution[J]. Molecular Biology and Evolution, 2003, 20(12):1997-2009.

[7]Yao X, Ma H, Wang J, et al. Genome-wide comparative analysis and expression pattern of TCP gene families in Arabidopsis thaliana and Oryza sativa[J].Journal of Integrative Plant Biology,2007, 49(6): 885-897.

[8]Doebley J, Stec A, Hubbard L. The evolution of apical dominance in maize[J]. Nature, 1997,386:485-488.

[9]Wang R L, Stec A, Hey J, et al. The limits of selection during maize domestication[J]. Nature, 1999,398:236-239.

[10]Takeda T, Suwa Y, Suzuki M, et al. The OsTB1 gene negatively regulates lateral branching in rice[J]. Plant Journal, 2003, 33(3):513-520.

[11]Takeda T, Amano K, Ohto M A, et al. RNA interference of the Arabidopsis putative transcription factor TCP16 gene results in abortion of early pollen development[J]. Plant Molecular Biology, 2006, 61(1/2):165-177.

[12]Li C, Potuschak T, Colon-Carmona A, et al. Arabidopsis TCP20 links regulation of growth and cell division control pathways[J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(36):12978-12983.

[13]Danisman S, Van der Wal F, Dhondt S, et al. Arabidopsis class I and class II TCP transcription factors regulate jasmonic acid metabolism and leaf development antagonistically[J].Plantphysiology,2012,159(4):1511-1523.

[14]Palatnik J F, Allen E, Wu X, et al. Control of leaf morphogenesis by microRNAs[J]. Nature, 2003, 425:257-263.

[15]李超. 农杆菌介导的豌豆花瓣瞬间表达系统的建立及利用该系统对百脉根TCP基因亚细胞定位的研究[D]. 上海:上海交通大学, 2009.

[16] Feng X, Zhao Z, Tian Z, et al. Control of petal shape and floral zygomorphy in Lotus japonicus[J]. Proceedings of the National Academy of Sciences of the United States of America, 2006, 103 (13):4970-44975.

[17] Wang Z, Luo Y, Li X, et al. Genetic control of floral zygomorphy in pea (Pisum sativum L.) [J]. Proceedings of the National Academy of Sciences of the United States of America, 2008, 105 (30):10414-410419.

[18] Velasco R, Zharkikh A, Affourtit J, et al. The genome of the domesticated apple (Malus × domestica Borkh.) [J]. Nature Genetics, 2010, 42(10):833-839.

[19] Li Y Z, Wu B J, Yu Y L, et al. Genome-wide analysis of the RING finger gene family in apple[J]. Molecular Genetics and Genomics, 2011, 286(1):81-94.

[20]许瑞瑞, 张世忠, 曹慧, 等. 苹果WRKY转录因子家族基因生物信息学分析[J].园艺学报, 2012, 39(10):2249-2260.

[21]Zhao T, Liang D, Wang P, et al. Genome-wide analysis and expression profiling of the DREB transcription factor gene family in Malus under abiotic stress[J]. Molecular Genetics Genomics, 2012, 287(5):423-436.

[22]Zhang S, Xu R, Luo X, et al. Genome-wide identification and expression analysis of MAPK and MAPKK gene family in Malus domestica[J].Gene, 2013, 531(2):377-387.

[23]Mount D W. Using the basic local alignment search tool (BLAST) [J]. Cold Spring Harbor Protocols, 2007, doi: 10.1101/pdb.top17.

生物信息学分析第6篇

【关键词】  乳糖酶基因;克隆;生物信息学分析

    [abstract] objective: to clone and analyze lactase gene from lactobacillus delbrueckii bulgaricus. methods: cloned lactase gene from lactobacillus delbrueckii bulgaricus with pcr, made sequencing and bioinformatics analysis. results: cloned lactase gene (3 024 bp) successfully. it was presumed that the lactase gene encode 1 008 amino acids, with protein molecule 114 kda, isoelectric point 4.9, 9 potential glycosylation sites in amino acid sequence. made homology comparison with other lacteses. conclusion: the lactase gene is cloned successfully and the bioinformatics analysis is made by biological analysis software to investigate its character. it provides foundation for further study and colonization at low cost.

    [key words] lactase gene; clone; bioinformatics analysis

    乳及乳制品含有丰富的优质蛋白质、脂肪、碳水化合物以及几乎全部已知的维生素和多种矿物质,还含有免疫球蛋白等抗病因子,易被人体消化吸收,是人类改善营养、增强体质的理想食品[1]。除此之外,在牛乳等制品当中还含有5%左右的乳糖,它是牛奶中主要的碳水化合物,对人体有着重要的作用。主要表现在于乳糖能促进钙质吸收及整理肠道的功效,特别是乳糖被分解后的半乳糖是婴儿脑发育的必需物质,与婴儿大脑的迅速成长有密切关系。然而,人体却不能直接利用乳糖,它必须被乳糖酶分解为单糖的葡萄糖及半乳糖后才能被吸收和利用。据研究发现,世界各国人口都有不同程度的乳糖酶缺乏,东方人乳糖酶缺乏高达85%[2],从而导致“乳糖不耐症”的发生。

    乳糖酶(ec3.2.1.23,又名β半乳糖苷酶)能将牛乳中的乳糖水解为葡萄糖和半乳糖,并具有半乳糖苷的转移作用[3]。利用该酶生产低乳糖制品或口服酶制剂,能够有效解决“乳糖不耐症”问题。乳糖酶广泛存在于扁桃、桃、杏、苹果和咖啡豆等植物中,大肠杆菌、乳酸杆菌、酵母菌和霉菌等微生物中,以及有效哺乳动物的小肠等器官和皮肤组织中。然而,不同来源的乳糖酶,其酶学性质相差很大。本研究从保加利亚德氏乳杆菌中成功的克隆出乳糖酶基因,并利用生物分析软件对其进行生物信息学分析。了解该酶的性质特征,为进一步研究及低成本表达该酶奠定基础。

    1  材料与方法

    1.1  材料

    1.1.1  菌株与质粒  保加利亚德氏乳杆菌购买于广东省微生物研究所菌种保藏中心;大肠杆菌dh5α由本室保存;pgmt vector购于北京天根生化科技有限公司。

    1.1.2  试剂材料   细菌培养试剂购于sigma公司;引物由上海生工合成;la dna聚合酶购于自大连宝生物公司;细菌基因组提取试剂盒、dna胶回收试剂盒、小量质粒提取试剂盒、dna ladder购于北京天根生化科技有限公司;t4连接酶、琼脂糖、荧光染料由本室保存。

    1.2  方法

    1.2.1  保加利亚德氏乳杆菌基因组dna的提取

    用灭菌双蒸水溶解干冻管里的保加利亚德氏乳杆菌,并划平板到mrs固体培养基,37 ℃培养72 h,挑取单个菌落于mrs液体培养基进行增菌(37 ℃摇床)。利用细菌基因组提取试剂盒提取保加利亚德氏乳杆菌基因组dna,并用1%的琼脂糖凝胶电泳检测纯度。

    1.2.2  引物设计与合成  从genbank数据库中检索到保加利亚德氏乳杆菌中乳糖酶基因序列(genbank序列号:gi149564)设计引物如下:p1:5'5' cgcggatccgcgatg agc aa taagtta3';p2:5'ccgctcgagcggttattttagtaaaaggg3'。上述引物由大连宝生物工程有限公司合成(下划线碱基分别为bamh i和xho i酶切位点)。

    1.2.3  乳糖酶基因的pcr扩增与鉴定  反应总体积为25 μl:模板dna(1 μg/μl) 3 μl,10×buffer2.5 μl,mg2+( 25 mm)2.0 μl, dntp(2.5 mm)2.5 μl,引物p1(10 pmol/μl) 0.4 μl,引物p2 (10 pmol/μl)0.4 μl,la dna聚合酶(5 u/ul)0.2 μl,双蒸水14 μl;反应条件:98 ℃,1 min;94 ℃,30 sec;50 ℃,30 sec;72 ℃,4 min; 30个循环;72 ℃,5 min.然后用1% 的琼脂糖凝胶电泳检测,同时加上500 bp ladder对pcr产物进行初步鉴定。

    1.2.4  乳糖酶基因的克隆与鉴定  pcr扩增出目的基因,1%琼脂糖电泳,切胶后用dna胶回收试剂盒进行纯化,得到纯化的pcr产物与pgmt vector进行连接(4 ℃,24 h),转入新制备[4]的感受态大肠杆菌dh5α,再涂于含氨苄青霉素的lb培养基上37 ℃培养过夜,用接种针分别挑取仅有的4个菌落于含氨苄青霉素的lb液体培养基上增菌培养(做好标记)。采用小量质粒提取试剂盒分别对4管菌液提取质粒。采用三酶切(bamh i、xho i和pvu i)和pcr两种方法对重组子进行鉴定。经鉴定的阳性重组质粒由北京天根生化科技有限公司测序。

    1.2.5  乳糖酶基因序列的生物信息学分析  利用生物软件dnassist version2.0对该序列进行物理化学性质的分析,推测其氨基酸序列。利用在线分析软件sopma对其进行二级结构分析以及在线分析软件netnglyc1.0进行蛋白质功能位点预测。并利用在线分析软件blast在genbank 数据库中进行同源性分析[5]。并利用dnaman软件绘制其同源关系图。

    2  结果与分析

    2.1  乳糖酶基因克隆与鉴定

    用细菌基因组提取试剂盒提取保加利亚德氏乳杆菌基因组dna,1%琼脂糖凝胶电泳,可见到清晰的条带,说明获得高质量的基因组dna。以该基因组dna为模板,进行目的基因的pcr扩增,结果可扩出3 024 bp的目的片段。将该目的基因片段进行胶回收纯化后,与pgmt vector进行连接,转化感受态大肠杆菌dh5α,通过氨苄青霉素筛选,得到4个菌落,4个菌落分别在含有氨苄青霉素的lb液体培养基上增菌培养,采用小量质粒提取试剂盒分别对4管菌液提取质粒。pcr及酶切(如图1)所得质粒,电泳结果发现第3号质粒成功地被三酶切,得到3 024 bp的目的基因,初步证明包含乳糖酶dna的重组质粒pgmtlacz构建成功。注:1、2、3、4号为质粒三酶切,5号为500 bp ladder

    2.2  测序结果及生物信息学分析

    序列测定证明.构建的重组载体中含有乳糖酶全长编码序列,经blast同源性分析,与genbank中登录的序列完全一致。利用生物软件dnassist 2.0对已克隆基因进行分析,其结果推测出肽链具有1 008个氨基酸,该蛋白分子量为114kda,等电点为4.9。利用在线分析软件sopma对其蛋白序列进行二级结构分析,结果发现该蛋白氨基酸序列中有205个氨基酸组成α螺旋,占氨基酸总数的20.34%;64个氨基酸组成β折叠,占总数的6.35%;489个氨基酸随意缠绕,占总数的48.51%;250个氨基酸组成扩展链,占总数的24.8%(如图2)。蓝条带代表α-螺旋的位置;绿条带代表β-折叠的位置 利用在线分析软件netnglyc1.0对该蛋白功能位点进行预测,结果发现该蛋白序列共有9处潜在糖基化位点:nasf258、nqsl389、nesy464、nsss635、nesy878、nfsp900、nrsk912、nlsa938、nytw961。

    2.3  乳糖酶基因同源性比较

    将本实验已克隆出的乳糖酶基因翻译成氨基酸序列,通过在线分析软件blast与genbank 数据库中含有乳糖酶基因的氨基酸序列进行同源性比较,结果发现与乳糖分解酵素的同源性高达到99%,而其他却较低,分别是链球菌49%;乳酸菌46%;酪酸梭状芽胞杆菌45%;产气荚膜梭菌45%;长双歧杆菌45%。利用dnaman软件对同源性比较所得结果进行同源关系图的绘制(如图3)。

3  讨论

    乳糖是牛奶中主要的碳水化合物,全脂牛奶中约30%的热量和脱脂牛奶中60%的热量都是由乳糖提供。然而对于“乳糖不耐症”的人群来讲,无法充分利用这种能量,一旦身体的能量需求不能得到满足(营养不良的儿童),蛋白质就仅被用于满足能量需要,而不能作为构成人体蛋白的单元。除此之外,乳糖还是矿物质成分的载体,可促进矿物质元素的吸收。因此,假如乳糖不被吸收,它将被排放到肠中被肠道微生物发酵产酸产气,从而导致胃肠功能失调,并造成有价值的蛋白质和矿物质的损失,如铁、锌、钙质的丢失,这与小儿佝偻病和成年人的骨质疏松症都有着密切的关系。然而,乳糖是一种双糖,因为分子太大,不能被人体直接吸收,需要被小肠中的乳糖酶分解为葡萄糖和半乳糖,然后再被人体吸收[6,7]。

    据研究发现,随着人类的生长发育,体内乳糖酶活性却呈规律性衰减,其中我国就有75%~95%[8],最终造成“乳糖不耐症”的发生。由此可见,人体不断补充乳糖酶至关重要。当今乳糖酶广泛应用于食品行业,特别是乳品行业,需求量逐年增加。然而,国内大量的乳糖酶的需求都基本须来自于进口,价格昂贵,因此,研发出一套能够低成本生产乳糖酶的方法迫在眉睫。本研究通过保加利亚德氏乳杆菌,成功的克隆出乳糖酶基因。并利用生物软件对其进行生物信息学分析,了解该酶的理化性质,为下一步表达及制作口服片剂奠定基础。并通过二级结构及糖基化位点的预测为今后对该酶的进一步研究和应用提供很好的数据平台。

【参考文献】

  1 许牡丹,范金波,檀志芬,等.米曲氍β半乳糖苷酶的纯化与性质研究[j].陕西科技大学学报,2003,2l(4):1316.

2 calloway dh, colassito dj, mathens rd. gases produced by human intestinal microflora[j]. nature, 1966, 212:12381239.

3 高焕春.乳糖酶的特性及其在乳品工业中的应用[j].中国乳品工业,1996,24(3):1921.

4 sambrook joseph sambrook, t.maniatis. eds.2nd ed.molecular cloning: a laboratory manual[m].new york:cold sping harbour laboratory press,1989.10.

5 altschul sf, madden tl, schaffer aa, et al. gapped blast and psiblast: a new generation of protein database searchprograms[j]. nucleic acids res, 1997,25(17):33893402.

6 bernard cochet. effects of lactase intestinal calcium absorption in normal and lactasedeficient subjects [j]. gastroenterology,1983,84:935.

生物信息学分析第7篇

文献标识码:A

文章编号:1007-7847(2015)02-0119-05Bioinformatic Analysis of TATA-binding Protein of ZebrafishYANG Shao-bin, FENG Jing-wen, ZHAO Wen-cheng, WANG Zhao-song, XU Shi-lei*(Tianjin Medical University Cancer Institute and Hospital, National Clinical Research Center for Cancer, Tianjin Key Laboratory of Cancer Prevention and Therapy, Tianjin 300060, China)Abstract : TATA-binding protein (TBP) is important in the process of transcription initiation in zebrafish. By means of bioinformatic methods, TBP of zebrafish is illustrated and analyzed by physicochemical property, sequence homology among different species, conserved domains, transmembrane structures, hydrophilici ty/hydrophobicity, protein secondary structure, protein tertiary structure, as well as protein-protein interactions. The results showed that zebrafish TBP consists of 302 amino acids, with isoelectric point of 9.8. This protein belongs to the TBP superfamily without transmembrane structure, and it is a hydrophilic protein. The secondary structure analysis showed that it contained 5 a. helices and 8 f3 sheets and random coil was the major structure element. The reliability of predicted three-dimensional structure of zebrafish TBP was up to 98.9%. Further analysis proved that the predicted protein structure was stable. It showed that the 10 most relevant interaction proteins with the zebrafish TBP were all transcription factors or TF II D complex members. Therefore, the results provided great information about zebrafish TBP in transcription regulation for further research.Key words: zebrafish; TATA-binding protein; bioinformatics(Life Science Research, 2015,19(2): 119?123)

TATA结合蛋白(TATA-binding protein,TBP)址一种特异性结合DNA序列上TATA框的转录因子。TATA序列存在于真核细胞基因启动子中转录起始位点上游30个bp左右[1]。TBP与其他一些TBP相关蛋白共同组成厂TFⅡD复合物,TFⅡD是一种常见的转录因子,它是RNA聚合酶Ⅱ起始复合体的组成部分。TBP能够帮助RNA聚合酶Ⅱ跨过转录起始位点。TBP在DNA双链解链(double strand separation)的过程中也起到一定的作用,这是通过其能够使DNA弯曲80°来实现[2-4]。TBP的另一个特点是含有一长串谷氨酰胺氨基酸残基。这个区域调节TBP的C端和DNA的结合能力、转录复合体形成的比率以及转录的起始。斑马鱼属于鲤科,鲤目。由于再生能力强的特性,斑马鱼经常被当作研究脊椎动物的生物模型[5]。分析研究斑马鱼TBP有助于更好地理解斑马鱼基因转录过程。到目前为止,对斑马鱼TBP的生物学研究已经有一定的进展,但是对其生物信息学分析还未见报道。为此,本研究采用生物信息学方法,对斑马鱼TBP的理化性质、保守结构域、跨膜区、亲水性/疏水性、二级结构、三级结构、与其他物种亲缘关系等进行预测和分析,为其后续研究奠定全面的理论基础。1材料与方法1.1材料数据资料来源于UniProt网站已经注册的TBP氨基酸序列。其中TBP:斑马鱼zebrafish(Q7SXL3)、非洲爪蛙Xenopus laevis( P27633)、小鼠Mouse( P29037)、牛Bos taurus (Q2HJ52)、人Human( P20226)。1.2方法利用ProtParam分析蛋白质理化性质;蛋白序列同源性、多序列比对及序列系统进化树分别由NCBI protein blast .ClustalX2.0、njplot等软件实现;利用TMHMM、ProtScale分析蛋白质的跨膜区和疏水性;NCBI Conserved Domains数据库用来分析保守区域;Jpred、Swiss-Model和Structural Analysis and Verification Server分别预测蛋白质二级、三级结构及其合理性。String则用来预测蛋白质的相互作用。各软件、数据库的相关信息如表1。2结果与分析2.1斑马鱼TBP的理化性质预测和分析使用ProtParam蛋白质理化性质预测网站对5种TBP进行理化性质预测,得到结果如表2。结果显示,TBP基因在5个不同物种中编码的氨基酸个数在297~339之间;相对分子质量在32702.8~37698.1之间;各物种TBP等电点差异其微,均在9.8附近,说明TBP是碱性蛋白质;TBP在5个物种中的半衰期均达到了30h;5种蛋白的不稳定系数均大于40,表明它们不是稳定蛋白;各TBP的脂肪族系数在76.58~88.65之间;5种蛋白的平均疏水性均为负值,表明它们都是亲水蛋白质。2.2斑马鱼TBP的同源性预测和分析

使用Protein Blast软件对斑马鱼TBP进行同源性分析,数据显示,非洲爪蛙、小鼠、牛、人TBP与斑马鱼TBP进行比较时,比对序列覆盖范围(Query cover)分别是100%、100%、100%、75%;在此基础上的序列相似性(Identity)分别为88%、86%、85%、93%,;利用ClustalX2.1程序对斑马鱼TBP与非洲爪蛙、小鼠、牛、人TBP序列进行多重比对,发现各物种问多聚谷氨酰胺区如图1。结果显示,由低等物种到高等物种,TBP多聚谷氨酰胺区谷氨酰胺氨基酸残基数量在进化过程中不断增加,推测谷氨酰胺区的长度与TBP的转录调节能力呈正相关。

生物信息学分析第8篇

关键词:水稻;Os5h基因;Os7h基因;F-box;生物信息学

中图分类号:S511;078 文献标识码:A 文章编号:0439-8114(2016)09-2396-04

F-box蛋白是一类含有40~50个保守氨基酸F-box结构域的蛋白家族成员,在真核生物中广泛存在。研究报道双子叶模式植物拟南芥基因组中至少存在568个F-box蛋白基因,单子叶模式植物水稻中有687个F_box蛋白基因。植物F-box蛋白基因家族中只有少部分F-box蛋白基因的功能被研究报道,研究表明F-box蛋白参与许多植物生长发育的过程,尤其与花发育有关,并参与生长素、乙烯、GA、JA等激素和光信号传导等多种生理过程,也在植物的逆境和防御反应中发挥重要功能。最近报道F-box蛋白SLF控制植物基于S-RNase的自交不亲和。F-box蛋白在生物体内数量庞大,功能复杂,但目前已经研究透彻的F-box蛋白基因非常有限,为此,美国针对模式植物拟南芥启动了拟南芥全基因组F-boX蛋白研究计划,这一计划的实施将促进F-box蛋白家族功能的揭秘,

关于水稻中F-box蛋白类基因的研究较少,其中1个赤霉素不敏感的基因dwarf2是赤霉酸信号的正调控因子。dwarf3(D3)控制着水稻分蘖芽的活动,MAIF1受非生物逆境诱导,可能是mieroRNA的靶基因。

为了更多地了解F-box蛋白基因在水稻中的表达特性,本研究对水稻中2个新的F-box蛋白基因进行了生物信息学预测分析,有助于揭示F-boX蛋白家族的功能,同时为水稻作物遗传改良提供参考。

1 材料与方法

1.1 基因结构及其编码蛋白序列的特征分析

RiceGenomeAnnotationProjectRiceGenomeBrowser网站分析基因结构及蛋白质序列。Pfm(http://pfam.sanger.ac.uk/)和Mobyle数据库(http://mobyle.pasteur.fr/cgi-bin/portal,py?#forms::hm-memit)获得F-boxmotif结构域及其氨基酸序列。采用ClustalXVersion2.0程序比对蛋白质序列。

1.2 2个F-box基因的启动子预测

选取基因ATG上游1500bp的启动子序列在PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)中进行分析,显示基因启动子序列所包含的motif,选取相关的重要motif,根据结果进行修正,手工绘图。

1.3 2个F-box基因的转录表达分析

在CREP(http:///crep-cgi/home.p1)水稻基因表达谱数据库中分别搜集了Os5h、Os7h基因在明恢63以及珍汕97品种两个水稻品种中8个对应组织器官的表达情况。

1.4 2个F-box基因的共表达分析

Os5h和Os7h的共表达分析是在水稻寡核酸芯片数据库中进行的(http:///eoex-pression/coexpression.shtml),相关性的阈值设置为0.5。分析的步骤完全按照网站说明进行。

2 结果与分析

2.1 水稻Os5h和Os7h的结构模式图及其编码蛋白的序列特征

在RiceGenomeAnnotationProjectRiceGenomeBrowser网站(http://rice.plantbiology.msu.edu/analvses.shtml)分别输入Os5h、Os7h基因的水稻LOC号,即显示这两个基因的模式图,确定了各基因的内含子和外显子的数目及位置。Os5h含有3个外显子,CDS总长894bp,编码297个氨基酸。Os7h含有5个外显子,CDS总长1191bp,编码396个氨基酸(图1)。

将Os5h、Os7h基因的蛋白序列及F-boxmotif的氨基酸序列用ClustalXVersion2,0程序来进行蛋白质的序列比对,并对结果进行手工修正绘图。得到蛋白序列特征模式图(图2)。图中黑色方框为Os5h、Os7h基因所编码蛋白含有的F-boxdomain,表明它们都属于F-box家族基因。

2.2 启动子的预测分析

启动子预测分析显示(图3),水稻Os5h和Os7h均含有大量光应答有关的元件。如Q-box、GAG-motif、Box I、Spl、I-box等,热胁迫应答元件HSE。茉莉酸甲酯的应答元件CGTCA-motif、TGACG-motif,脱落酸应答顺式元件ABRE,胚乳表达元件Skn-1motif。另外,Os5h还含有赋予高转录水平元件的5UTR Py-richstretch、低温应答LTR元件、厌氧诱导ARE元件、冷和脱水应答元件C-repeat/DRE、防御和胁迫应答TC-richrepeats元件、水杨酸应答TCA-element元件、昼夜节律控制cir-cadian元件。Os7h还含有干旱诱导MBS元件、缺氧特异诱导GC-motif元件、胚乳表达GCN4_motif元件及分生组织特异激活元件CCGTCC-box。

2.3 水稻Os5h和Os7h基因的转录表达分析

在CREP(http:///crep-cgi/home.p1)水稻基因表达谱数据库中分别搜集了Os5h、Os7h基因在明恢63以及珍汕97两个品种中8个对应组织器官的表达情况。所取组织器官分别为继代愈伤、胚芽,成熟期的茎、叶、根、花、3-5cm长幼穗、15-20cm长幼穗。芯片结果显示,Os5h基因在花中表达最高。胚芽中最低(图4A)。芯片结果显示。Os7h基因在根中表达相对其他组织较低,但整体表达相对比较均匀(图4B)。

2.4 基因的共表达分析结果

在水稻寡核苷酸芯片数据库中对Os5h(OsO3g02550)和Os7h(Os03g02560)基因进行共表达分析。结果表明。多个表达蛋白(如LOCOs06g15700基因)、多种酶。还有过敏反应(如LOCOs05g51420基因)、镉诱导的蛋白(如LOCOs07g05040基因)与Os5h基因正向共表达(表1)。有1个葡萄糖-1-磷酸磷酸转移酶的大亚基LOC_Os05g50380基因、叶绿索的前体与此基因负向共表达。多个表达蛋白、锌指家族蛋白、多种酶蛋白与Os7h基因正向共表达,有2个抗病蛋白LOCOS01G15580基因和LOCOs07g17250基因与其负向共表达(表2)。

3 小结与讨论

基因结构分析显示,Os5h和Os7h这两个基因均含有保守F-box结构域,属于F-box基因家族,因此可能在泛素途径中的SCF蛋白复合体中发挥作用。基因转录表达分析结果显示,这2个F-box基因为组成型表达,其中尤其在花器官中表达较高。可能控制花的发育。启动子的分析预测显示,它们的启动子中含有较多的光应答元件。有研究报道,EID1和AFR这2个F-box蛋白参与phvyA介导的光信号传导。已报道的水稻Hd1是水稻种第一个被克隆的数量性状基因,其在短日照下促进抽穗和在长日照下抑制抽穗。由于Hd1本身的转录并不受日照长短的影响,推测转录受其影响的基因的表达受光周期变化的控制。

生物信息学分析第9篇

1材料和方法

1.1材料与试剂

1.1.1样品收集:从超市购买了4个品牌的5种牛奶,包括高温灭菌奶(常温保质期30天)和巴氏消毒牛奶(2℃~6℃保质期7天),分别标记为A、B、C、D、E。样品ABC为高温灭菌奶,DE为巴氏灭菌奶,C和D是同一品牌的常温奶和巴氏奶,每种牛奶收集了同一批次的3个样品。所有的样品均在2012年5~7月进行取样。

1.1.2试剂:QIAgenDNAStoolextractionkit-购自德国QIAGEN公司,PremixTapVersion2.0、pMD18-TVector-购自日本Takara公司,Cycle-Purekit-购自美国OMEGA公司,TransDH5αCompetentCell-购自北京全式金生物技术有限公司,KAPASYBRFASTqPCRKit-购自美国KAPA公司。

1.2仪器与设备NanodropND1000分光光度计-购自美国Thermo公司,GeneAmpPCRSystem2720ThermaCycler-购自美国ABI公司,BeckmanAllgreX-22R离心机-购自美国Beckman公司,PowerPacBasic电泳仪-购自美国Bio-RAD公司,凝胶成像系统-购自美国AlphaInnotech公司。ABI7300实时定量PCR仪-购自美国ABI公司。

1.3方法

1.3.1DNA提取取100mL的牛奶样品用Collado[16]等(2009)的方法提取牛奶中的细菌DNA-7150g离心20min,弃掉上层溶液,收集沉淀,用5mLTE(1x)重新悬浮沉淀;7150g离心5min,弃掉上层溶液,沉淀用QIAgenDNAStoolextractionkit(QIAGEN)提取细菌基因组DNA。提取的DNA溶解在50μL的TE(1x)中,用NanodropND1000分光光度计测定DNA浓度,用1%琼脂糖凝胶电泳检测提取的DN段大小。样品于-20℃冰箱中保存备用。

1.3.216SrRNAPCR用通用引物338F-CCTACGGGAGGCAGCAG,534R-ATTACCGCGGCTGCTGG扩增16SrRNA-V3区[17]。引物由上海生物生工(北京合成部)有限公司合成。PCR反应体系为:PremixTapVersion2.010μL,上下游引物各10μM,模板20ng,补水(PURELABUltra–ELGA纯化水,高压灭菌备用)到20μL。反应条件为:95℃预变性5min,94℃变性30s,55℃退火30s,72℃延伸30s,共30个循环,1.5%琼脂糖凝胶电泳检测扩增产物,100V,40min,紫外光下观察电泳条带(如图1)。PCR产物用Cycle-Purekit(OMEGABIO-TEK,D6942-01)进行纯化,测定浓度。纯化产物用于随后的克隆实验。

1.3.3序列信息分析测序获得的序列在blast.ncbi.nlm.nih.gov/Blast进行16SribosomalrRNAsequences(bacteria)的比对,当MAXindent≥98%时,记录该序列对应的细菌属名和一致的始末位点。用BioEdit软件对所得的序列根据一致位点提取16SrRNA-V3区的扩增序列,用ClustalX(1.83)进行序列比对。RDP-classifier在线软件rdp.cme.msu.edu/classifier/classifier.jsp对所有序列进行菌属鉴定,对每个样品的菌属进行归类。用“1-ΣH2”(H是每种菌属占样本所有菌属的百分比)来评估每个牛奶样品中的DNA菌群多样性[18]。PAUPversions4.0软件构建N-J系统发生树。

1.3.416SrRNA基因的Real-TimePCR定量细菌总数提取的牛奶中细菌DNA用于模板定量细菌总数,DNA克隆获得的pMD18-16SrRNA重组质粒用于标准品的制备。10倍梯度稀释的质粒用于实时定量PCR中标准曲线的生成。反应体系为:KAPASYBRGreenMasterMix(2×)10μL,上下游引物各4μM,模板20ng,补水到20μL。反应条件为:95℃预变性3min,95℃变性3s,60℃延伸40s,共40个循环。数据结果用7300SystemSDSSoftware进行分析。每孔3个重复。

2结果分析

2.1DNA提取与PCR扩增我们成功提取了5种牛奶的15个样品的细菌基因组DNA。琼脂糖凝胶电泳的结果显示,DNA呈现弥散状,没有明显的主带。用16SrRNA-V3区的通用引物对全部样品进行PCR扩增,均得到约为190bp的扩增片段,阴性对照无扩增条带(图1)。在15个PCR扩增产物中随机选择了5个(每个品牌选择一个样本)进行T-A克隆。每个样品得到了至少1000个克隆,随机选取100个克隆进行测序(表1)。

2.2牛奶中的细菌总数利用检测细菌的16SrRNA基因数量来反映牛奶中细菌总数。结果显示,所有牛奶样品中均含有大量的16SrRNA基因片段。考虑到不同种类细菌中16SrRNA基因的拷贝数在2~15个[19],我们对绝对定量获得的数据进行最小化和最大化处理(各样品中的细菌16SrRNA基因按照最小拷贝数和最大拷贝数计算),所得结果和国家标准进行比较(图4)。按照每个细菌含有最少16SrRNA基因拷贝数计算获得最大细菌总数,各品牌牛奶样品中最大细菌总数均低于国家标准。

2.3菌种鉴定及菌群结构分析我们对5个牛奶样品的500个克隆进行了测序,成功的获得了472条16SrRNA-V3区的序列,其中有131种不同的序列。样品A和B得到93条序列,其中A中有20种不同的序列,样品B中有25种不同序列。C、D、E分别得到95、96、95条序列,不同的序列数目为39、51、32(表1)。菌属鉴定的结果表明,472条序列中的452条序列可以鉴定到五个纲的17个属:芽孢杆菌纲(Bacilli)占12%、黄杆菌纲(Flavobacteria)占3%、β-变形菌纲(Beta-proteobacteria)占2%、放线菌纲(Actinobacteria)占1%和γ-变形菌纲(Gamma-proteobacteria)占82%(表1)。另外的20条序列只能鉴定到纲的水平,分别为黄杆菌纲(5%)、β-变形菌纲(5%)和γ-变形菌纲(90%)。可以明确鉴定到属的序列中,有58条序列鉴定为革兰氏阳性菌,分属于棒状杆菌属(Corynebacterium),厌氧芽孢杆菌属(Anoxybacillus)和链球菌属(Streptococcus),占总序列的12%。其中Corynebacterium只在样品E中检测到1个克隆;所有的10个Anoxybacillus克隆都是在D样品中检测得到,且与A.kestanbolensis有99%以上的相似性。在样品C和E中都检测到Streptococcus,分别占其所测序列的1%和49%。C样品中的Streptococcus序列鉴定为嗜热链球菌属(S.thermophilus);E样品中的46个Streptococcus克隆全部与无乳链球菌(S.agalactiae)有100%的相似性。革兰氏阴性菌的序列占所有序列的83%,分属于14个属:假单胞菌属(Pseudomonas),不动杆菌属(Acinetobacter),沙雷氏菌属(Srratia),气单胞菌属(Aeromonas),黄杆菌属(Flavobacterium),水栖菌属(Enhydrobacter),嗜冷菌属(Psychrobacter),希瓦尔氏菌属(Shewanella),金黄色杆菌属(Chryseobacterium),肠杆菌属(Enterobacter),詹森菌属(Janthinobacteriu),无色杆菌属(Achromobacter),微小菌属(Microvirgula),戴米提亚菌属(Demetria)。其中Pseudomonas最多,占全部序列的46%,其次为Acinetobacter,占23%,而且这两种细菌都以较高比例存在于在所有样品中。Pseudomonas和Acinetobacter在各个样品中检测到的比例分别为:A(71%,16%)、B(75%,13%)、C(30%,43%)、D(40%,17%)、E(16%,25%)(表1,图3)。Serratia在样品A(8%)和B(5%)中检测到;Aeromonas存在于样品B(1%)、C(1%)、D(13%)和E(1%)中;Flavobacterium在样品C(8%)和D(3%)中发现。C样品中有3%的序列为Enhydrobacter,比对结果显示,与气囊栖水菌(E.aerosaccus)有≥99%的序列相似性。样品C克隆中有3%为Shewanella,序列比对结果证明为腐败希瓦尔氏菌(S.putrefaciens)。样品C和D中检测到Psychrobacter,分别占比例为3%和1%。Chryseobacterium分布在样品C和E中。Janthinobacterium在C和D中分别占1%和4%。

2.4优势菌群的系统发育树分析各牛奶样本中不但检测到的菌属不同,即使是同一菌属,其序列(菌株)也存在差异,图4a是所有Pseudomonas序列构建的N-J系统发育树,发现样品A、B的序列集中在上端的分支上,中间的分支中大部分序列出自样本E,而样品C、D的序列集中在下端的分支上。说明同一品牌牛奶中的细菌可能具有更近的亲缘关系。图4b是所有Acinetobacter序列构建的N-J系统发育树,与图4a情况相似,同一品牌牛奶中的序列相似性更高。

2.5市售牛奶中细菌的多样性我们发现各个样品中能够明确鉴定的属为:A到D依次为5个、5个、11个、8个、8个,各个样品中有一定差异。为了更好了解牛奶样本中的细菌多样性,我们利用各样品中所有的序列进行了多样性分析。5个样品A、B、C、D、E的值分别为0.61、0.65、0.93、0.94、0.74,平均值为0.78。可以看出,A和B的菌群多样性明显低于C和D。

3讨论

3.1基于16SrRNA-V3区克隆测序鉴定细菌菌群用分子生物学技术直接从环境中提取细菌DNA并对其进行分析,再结合PCR扩增等方法研究环境中菌群多样性及结构是近年来国内外比较常见的研究方法。如林海龙等[19]对中药废水污泥中的菌群结构的分析,Rasolofo等[10]、Raats等[9]对生奶中细菌菌群结构以及冷藏过程中的菌群结构的变化情况的分析。几乎所有这些研究都基于基本的培养法获得生牛奶(即原料奶)中细菌的单克隆,再通过大量培养后提取细菌的基因组DNA进行PCR鉴定。然而市售牛奶,尤其是高温灭菌的市售牛奶,细菌DNA在牛奶中已经成游离状态,对DNA提取的要求比较高。所以如何从市售牛奶中提取到可以用于PCR扩增的DNA成为整个研究成功的关键。本研究通过增加牛奶的使用量,利用提取粪便中细菌DNA的试剂盒成功的从市售牛奶中提取到细菌DNA,并对这些DNA进行细菌16SrRNA-V3区的PCR扩增,成功获得了目的产物(图1)。通过T-A克隆和测序分析,得到了不同品牌的5种市售牛奶中菌群的16SrRNA-V3序列信息,并对其进行比对、鉴定。所得结果表明,用该方法可以提取到市售牛奶中的细菌DNA,所提基因组DNA可以用来进行下游的实验研究。

3.2各品牌牛奶中的细菌总数均处于相对较高水平牛奶中细菌总数是评价牛奶质量的一个重要标准。虽然牛奶中不可避免的存在一些细菌[1-3],但是各种细菌的大量存在势必影响牛奶的品质[25]。我们的实验结果表明各个品牌牛奶中细菌总数均低于国家标准,然而相比较于乳业发达国家的105个/mL细菌数量,各牛奶样品中细菌总数均处于相对较高水平(图2)。这与我国部分奶源依赖散户养殖,饲料质量和卫生状况都不佳造成细菌总数不易控制,长时间储存导致的细菌繁殖,以及规模化养殖管理不善不无关系[21]。因此,监督部门应加强管理,促使国内奶制品产业环境进一步得到改善。

3.3不同品牌牛奶中的菌群结构不同Tatsuro等[22]用通用引物扩增16SrRNA-V3区的结果显示Lactobacillus和Staphylococcus是牛奶中的主要菌群,Lafarge等[12]也得到的相同的结果;与此不同,Delbes等[11]的结果则表明牛奶中的优势菌群是Clostridium和Lactobacillus;我们在市售牛奶中检测到的优势菌群是Acinetobacter和Pseudomonas,这与部分研究者的检测结果一致[9,10]。即使同为优势菌群,我们发现它们在5个样品中所占比例也不尽相同(图3)。然而在E样本中,Acinetobacter和Pseudomonas已非优势菌群,进化树的聚类分析显示同一属的细菌中,来自同一样本的细菌序列具有更高的相似性,其亲缘关系更近(图4)。各个样本中的非优势菌的种类也不同,如Serratia存在于样品A和B中,在样品C、D检测到了Janthinobacterium,只在样品E中检测到了Streptococcusagalactiae(表1)。Vacheyrou等[23]的研究表明大量的微生物菌群转移是从牛棚到挤奶室,然后到牛奶中,而且牛奶中存在的大部分细菌都能在表面发现。因此我们推测不同品牌牛奶中菌群结构的差异是由于奶源不同所造成的,而奶源环境中的菌群结构存在较大差异。

3.4牛奶中的致病菌乳腺炎是世界奶牛养殖业中发病率最高、造成经济损失的主要疾病之一。其病因多为细菌感染。RiffonR等[24]根据感染特点提出环境感染和接触感染的观点。环境感染的主要病原菌为大肠杆菌(E.coli),其次有停乳链球菌(S.dysgalactiae)、链球菌(S.uberis)和副链球菌(S.parauberis)等;接触感染的主要病原菌是金黄色葡萄球菌(S.auresu)和无乳链球菌(S.agalactiae)。我们在样品E中不仅检测到,且检测到近一半的序列(49%)为S.agalactiae,说明该品牌的该批次生奶可能受到了严重污染。所以我们怀疑E样品奶源已有患有乳腺炎的奶牛,尽管这些奶牛可能没有表现乳腺炎的病症。