生物信息数据库的分析与评价毕业论文

 2021-04-10 11:04

摘 要

近些年,随着生物信息技术的不断发展,与其直接相关的各种分子生物信息数据库的也得到了空前的发展。分子生物信息数据库种类很多,归纳起来,大体可以分为四个大类,即基因组数据库、核酸和蛋白质一级结构序列数据库、生物大分子(主要是蛋白质)三维空间结构数据库以及以上述3类数据库和文献资料为基础构建的二次数据库。分子生物信息数据库可以分为:一次数据库,二次数据库,DBCat,它们在功能,内容,数据格式上都有很大的不同。在DNA序列方面有GenBank、EMBL和DDBJ等。在蛋白质一级结构方面有SWISS-PROT、PIR和MIPS等。在蛋白质和其它生物大分子的结构方面有PDB等。在蛋白质结构分类方面有SCOP和CATH等。本文就是对这些各种主要的数据库进行深入的分析与研究,了解它们的结构和内容总结它们的优缺点,并给出一些改进方案。最后,结合这些数据库的特点,设计一个瑞典-海地HIV病毒感染人群的HIV-1的p17 gag 和 env 区序列的多重比对数据库。

关键词: 分子生物信息数据库 GenBank EMBL DDBJ SWISS-PROT PIR MIPS

瑞典-海地HIV

Abstract

In recent years,Along with the development of technology of biological information ,and its direct various related molecular biology information database of also got an unprecedented development.Molecular biological information database has many different kinds .To sum up,Can be divided into four kinds big, namely genome database, nucleic acids and proteins primary structure sequence database, the biological macromolecular (mainly protein) 3 d space structure to the above three kinds of database and the database and literature material as the basis of constructing second database .Molecular biological information database can be divided into: a database, second database, DBCat, they in function, content, data formats are very different.In the DNA sequences have GenBank, EMBL and DDBJ, etc;In the protein level structure have SWISS-PROT, PIR and MIPS, etc ;In the protein and other biological macromolecular structure has PDB, etc ;In the protein structure have SCOP classification and CATH, etc .This paper is to these various main database in-depth analysis and research, understand their structure and content summarizes the advantages and disadvantages of them, and give some improvement plan.Finally, combined with the characteristics of the database, design a Swedish-Haiti HIV infected people HIV-1 p17 gag and env area sequence of multiple than in the database.

Keywords: molecular biological information database GenBank EMBL DDBJ SWISS-PROT PIR MIPS Sweden-Haiti HIV

目 录

第一章 绪论 3

1.1 国内外研究现状和发展趋势 3

1.1.1·生物信息学研究内容 4

1.1.2·国外生物信息学发展状况 4

1.1.3·我国生物信息学研究现况与展望 5

第二章 世界各大生物信息数据库的分析与评价 6

2.1常用核酸序列数据库 7

2.1.1·EMBL、GenBank和DDBJ数据库结构 7

2.1.2·其它常用核酸序列数据库简介 11

2.1.3·常用核酸序列数据库的分析与评价 13

2.2 常用蛋白质序列数据库 14

2.2.1·SwissProt和PIR数据库结构 15

2.2.2其它蛋白质序列数据库 18

2.2.3常用蛋白质序列数据库的分析与评价 19

第三章 设计一个与某疾病相关基因和蛋白的数据库 20

3.1 开发技术简介 20

3.1.1 JAVA语言产生和发展 20

3.1.2 java的特性 21

3.1.3 JSP介绍 22

3.1.4 Web的MVC三层结构介绍 23

3.1.5 SSH整合框架介绍 24

3.2 开发环境 25

3.2.1 MyEclipse介绍 26

3.2.2 Oracle 11g数据库介绍 27

3.2.3 Tomcat服务器介绍 27

第四章 系统设计的总体目标和总体设计 28

4.1 界面设计目标 29

4.2 数据库设计 29

4.2.1 数据库分析 29

4.2.2 数据库概念设计 29

4.3 系统功能模块的实现 31

4.3.1 登录页面设计 31

4.3.2 系统主页面设计 34

4.3.3 “添加基因信息”功能页面设计 35

4.3.4 “修改基因信息”功能页面设计 38

4.3.5 “删除基因信息”功能页面设计 41

4.3.6 “修改密码”功能页面设计 44

4.3.7 “系统用户”功能页面设计 44

第五章 结论 46

致谢 47

参考文献 48

附录 49

第一章 绪论

在世纪之交之际,人类基因组计划已经取得了决定性的成功,这也标志着生物信息技术的发展进入了一个新的阶段。面对着海量的生物信息方面的数据,生物信息数据库的建立也面临着更高的考验,但是同时也会给生物信息数据库的发展带来质的飞跃。例如,在GenBank中,DNA碱基数目呈指数增加,大约每14个月就会增加一倍。到目前为止,大部分的基因数据库还都是免费向用户开放的。用户可以免费进行查询,下载使用。但是随着数据库数据的不断增加,对数据库的维护成本也越来越高,再加上技术商业性的推广,对用户进行收费使用将会是一个趋势。而我国的生物信息数据库的发展相对于国际上的一些国家而言,明显落后。那么我国将在以后生物信息发展上面处于一个非常被动的局面。所以建立我国自己的生物信息数据库刻不容缓。

1.1 国内外研究现状和发展趋势

生物信息学是在生命科学的研究中以计算机为工具对生物信息进行储存、检索和分析的一门新兴的交叉学科。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。

生物信息学萌生于计算机初创期。随着人类基因组计划的实施,有关核酸、蛋白质的序列和结构数据呈指数增长。面对巨大而复杂的数据,运用计算机管理数据、控制误差、加速分析过程势在必行。1956年,在美国田纳西州盖特林堡召开了首次“生物学中的信息理论研讨会”,会议产生了生物信息学的概念。1987年,林华安博士正式为这一领域定下生物信息(Bioinformatics)这一称谓。然而,那时人们对生物信息学的认识只是特殊含义上的片面的生物信息学,随着测序技术的日臻完善和现代科学技术革命中信息革命以及计算机产业的蓬勃发展,生物信息学在1995 年经历了里程碑式的发展。那一年,第一个细菌的全基因组序列——流感嗜血杆菌全基因组测定研究成果在《科学》发表,人类第一次有了一个物种完整的全基因组信息,生物信息学从此开始进入了名副其实的发展时期。在GenBank中,1999年12月其DNA碱基数已经达到30亿,它们来自47000多种生物。各种生物的EST序列已经达到343万多条,其中人类表达标签(expressed sequence tag,EST)序列已经超过169条,估计覆盖人类基因90%以上,UniGene的数目大约达到7万个。这一系列的标志性的突破,预示着生物信息数据库的发展进入了全新的阶段。

1.1.1·生物信息学研究内容

生物信息学是伴随着基因组研究而发展的。它以人类基因组计划完成为标志,经历了两个历史时代,即测序基因组时代和功能基因组时代。其研究重点主要体现在基因组学(G e n o m i c s )和蛋白组学(Proteomics)两方面。具体说,是从核酸和蛋白质序列出发,分析序列中表达的结构与功能的生物信息。其研究内容主要包括:

您需要先支付 80元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找,优先添加企业微信。