⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 第一章 生物信息学引论.htm

📁 这是一些经典算法的描述
💻 HTM
📖 第 1 页 / 共 5 页
字号:
 id="_x0000_i1031" type="#_x0000_t75" alt="" style='width:366.75pt;height:158.25pt'>
 <v:imagedata src="./第一章%20生物信息学引论.files/image012.png" o:href="http://www.lmbe.seu.edu.cn/chenyuan/xsun/bioinfomatics/web/images/6.bmp"/>
</v:shape><![endif]--><![if !vml]><img width=489 height=211
src="./第一章%20生物信息学引论.files/image013.jpg" border=0 v:shapes="_x0000_i1031"><![endif]><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;DNA是遗传信息的载体。DNA的核苷酸序列上存储着蛋白质的氨基酸序列编码信息,存储着基因表达调控的信息,存储着遗传信息。遗传信息存储在DNA四种字符组成的序列中,生物体生长发育的本质就是遗传信息的传递和表达。因此,可以说DNA序列包含着最基本的生命信息。存储在DNA中的信息使无活力的分子组织成有功能的活细胞,进而构成能进行新陈代谢、生长和繁殖的生物体。人们已经认识到遗传信息的载体主要是DNA[在少数情况下核糖核酸(RNA)也充当遗传信息的载体],控制生物体性状的基因是一系列DNA片段。一方面,DNA通过自我复制,在生物体的繁衍过程中传递遗传信息。另一方面,基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状。在基因表达过程中,基因上的遗传信息首先通过转录从DNA传到RNA,然后再通过翻译从RNA传递到蛋白质。基因控制着蛋白质的合成,从基因的DNA序列到蛋白质序列存在着一种明确的对应关系,而这种对应关系就是我们所知道的第一遗传密码。</span><span
lang=EN-US><o:p></o:p></span></p>

<p align=center style='text-align:center'><span lang=EN-US><!--[if gte vml 1]><v:shape
 id="_x0000_i1032" type="#_x0000_t75" alt="" style='width:402pt;height:303.75pt'>
 <v:imagedata src="./第一章%20生物信息学引论.files/image014.png" o:href="http://www.lmbe.seu.edu.cn/chenyuan/xsun/bioinfomatics/web/images/7.bmp"/>
</v:shape><![endif]--><![if !vml]><img width=536 height=405
src="./第一章%20生物信息学引论.files/image015.jpg" border=0 v:shapes="_x0000_i1032"><![endif]><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;蛋白质分子在生物体内执行着各项重要任务,如生化反应的催化、营养物质的输运、信号的识别与传递等。蛋白质的功能多种多样,但是必须注意一点,即蛋白质功能取决于蛋白质的空间结构。要了解和掌握蛋白质的功能必须首先分析蛋白质的结构,对于其它生物大分子也一样。因此,蛋白质结构是一种重要的生物分子信息。然而,蛋白质结构决定于蛋白质的序列(这是目前基本共认的假设),蛋白质结构的信息隐含在蛋白质序列之中。</span><span
lang=EN-US><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;作为信息的载体,DNA分子和蛋白质分子都打上了进化的烙印。通过比较相似的蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基因复制而产生的分子进化证据。比较来自于不同种属的同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚至种属之间的系统发生关系,推测它们共同的祖先蛋白质。
生物分子信息具体表现为DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功能数据等。序列数据、结构数据是非常直观的,但是功能数据却是多变复杂的,如关于蛋白质功能的定性描述、蛋白质之间的相互作用描述、基因表达数据、代谢路径、调控网络等。在所有类型的数据中,序列是最基本的数据,而且也是目前最多的数据。</span><span
lang=EN-US><o:p></o:p></span></p>

<p align=center style='text-align:center'><span lang=EN-US><!--[if gte vml 1]><v:shape
 id="_x0000_i1033" type="#_x0000_t75" alt="" style='width:365.25pt;height:238.5pt'>
 <v:imagedata src="./第一章%20生物信息学引论.files/image016.png" o:href="http://www.lmbe.seu.edu.cn/chenyuan/xsun/bioinfomatics/web/images/8.bmp"/>
</v:shape><![endif]--><![if !vml]><img width=487 height=318
src="./第一章%20生物信息学引论.files/image017.jpg" border=0 v:shapes="_x0000_i1033"><![endif]><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;对生物分子数据及其关系的概括见左下图。遗传信息从DNA序列向蛋白质序列的传递是人类已经基本了解的第一部遗传密码,然而蛋白质序列与蛋白质结构也存在着一定的对应关系,蛋白质序列决定蛋白质结构,因此有人将从蛋白质序列到蛋白质结构的关系称为第二部遗传密码。</span><span
lang=EN-US><o:p></o:p></span></p>

<p><span lang=EN-US><!--[if gte vml 1]><v:shape id="_x0000_i1034" type="#_x0000_t75"
 alt="" style='width:372pt;height:224.25pt'>
 <v:imagedata src="./第一章%20生物信息学引论.files/image018.png" o:href="http://www.lmbe.seu.edu.cn/chenyuan/xsun/bioinfomatics/web/images/9.bmp"/>
</v:shape><![endif]--><![if !vml]><img width=496 height=299
src="./第一章%20生物信息学引论.files/image019.jpg" border=0 v:shapes="_x0000_i1034"><![endif]><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;第一部遗传密码已被破译,但是,对于密码究竟处于DNA序列的哪些区域还了解得不全面,对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少,对DNA遗传语言还有待于进一步探索。对于第二部密码,目前则只能用统计学的方法进行分析。无论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量的生物分子数据之中。生物分子数据是宝藏,生物信息数据库是金矿,等待我们去挖掘和利用。</span><span
lang=EN-US><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;与一般信息相比,生物分子信息具有明显的特征。首先,生物分子信息数据量大,例如DNA序列以千兆碱基(Giga
base,Gb)为单位。随着信息处理技术进入现代生物学研究领域,随着互联网在全球的贯通,各种生物信息学数据库迅速发展,生物分子数据积累速度成倍增长。其次,生物分子信息复杂,既有生物分子序列的信息,又有结构和功能的信息,既有生命本质信息,如基因,又有生命表象信息,如基因表达信息。生物分子信息另一个重要的特征是,生物分子信息之间存在着密切的联系,例如,基因序列与蛋白质序列之间的关系,生物分子序列与结构之间的关系,结构与功能之间的关系,基因变异与疾病之间的关系。</span><span
lang=EN-US><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp;&nbsp;对于生物分子信息,靠人工难以完成数据处理和分析的任务,更谈不上发现隐藏在这些信息之中的内在规律。同时,对于生物分子信息,仅靠某一学科的专家,也无法进行分析研究,因此,在生物信息学研究领域中,要求生物学家、数学家和计算机科学工作者协力合作,发展新的分子生物学计算理论和方法,运用先进的计算机技术收集、集成和分析处理生物信息。</span><span
lang=EN-US><o:p></o:p></span></p>

<h3><!--mstheme--><span lang=EN-US style='font-size:12.0pt;color:#EFCE8F'>1.1.3
生物信息学的研究目标和任务</span><span lang=EN-US><o:p></o:p></span></h3>

<!--mstheme-->

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp; 揭示生物分子数据的内涵是生物信息学的长远目标。生物分子数据具有深刻的内涵,数据之间存在着复杂的联系,这些数据中蕴涵着丰富的生物学知识和生物学规律。生物信息学的发展将揭示生物分子信息的本质,使人类彻底了解、掌握遗传信息的编码、传递及表达,从而加快人类了解自身的进程。<O:P>
</O:P></span><span lang=EN-US><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp; 目前生物信息学的主要任务是研究生物分子数据的获取、存贮和查询,发展数据分析方法。主要包括三个方面。第一是收集和管理生物分子数据,使得生物学研究人员能够方便地使用这些数据,并为信息分析和数据挖掘打下基础。生物分子数据来自于生物学实验,应用信息学技术收集和管理这些数据,将各种数据以一定的表示形式存放在计算机中,建立数据库系统,并提供数据查询、搜索和数据通讯工具。<O:P>
</O:P></span><span lang=EN-US><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp; 第二是进行数据处理和分析。通过数据分析,发现数据之间的关系,认识数据的本质,进而上升为生物学知识。并在此基础上,解释与生物分子信息复制、传递和表达有关的生物过程,解释在生物过程中出现的信息变化与疾病的关系,帮助发现新的药物作用目标,设计新的药物分子,为进一步的研究和应用打下基础。生物分子信息处理流程见图1.2。目前生物信息学的主要研究对象是DNA和蛋白质。在DNA分析方面,着重分析DNA序列中的基因信息及基因表达调控信息,分析基因表达数据,分析基因之间的相互作用关系,比较不同种属的基因组,研究基因组中非编码区域的生物学功能。在蛋白质分析方面,着重分析蛋白质序列与蛋白质结构及功能之间的关系,预测蛋白质的结构和功能,研究蛋白质的进化关系。<O:P>
</O:P></span><span lang=EN-US><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.0pt'>&nbsp;&nbsp;&nbsp; 生物信息学的研究第三个方面是开发分析工具和实用软件,解决具体的问题,为具体的生物信息学应用服务,例如,开发生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具等。</span>
<span lang=EN-US><o:p></o:p></span></p>

<p align=center style='text-align:center'><span lang=EN-US><!--[if gte vml 1]><v:shape
 id="_x0000_i1035" type="#_x0000_t75" alt="" style='width:355.5pt;height:201.75pt'>
 <v:imagedata src="./第一章%20生物信息学引论.files/image020.png" o:href="http://www.lmbe.seu.edu.cn/chenyuan/xsun/bioinfomatics/web/images/10.bmp"/>
</v:shape><![endif]--><![if !vml]><img width=474 height=269
src="./第一章%20生物信息学引论.files/image021.jpg" border=0 v:shapes="_x0000_i1035"><![endif]><o:p></o:p></span></p>

<p><span lang=EN-US style='font-size:10.5pt;mso-bidi-font-size:10.0pt;
font-family:"Times New Roman";mso-font-kerning:1.0pt'>&nbsp;&nbsp;&nbsp; </span><span
style='font-size:10.0pt'>随着生物技术特别是分子生物学技术的发展,目前已经积累了大量的生物信息学数据,表<span
lang=EN-US>1.1列出了目前已经得到的各类数据量及生物信息学对各类数据处理的基本任务。生物分子数据类型的不断增多及数据量的不断膨胀促进了生物信息学的研究与应用。生物信息学研究成果不断涌现,各种生物信息源如雨后春笋层出不穷,而各种生物信息分析算法和工具也日益更新。</span></span><span
lang=EN-US><o:p></o:p></span></p>

<!--mstheme-->

<div align=center>

<table border=1 cellspacing=0 cellpadding=0 style='border-collapse:collapse;
 border:none;mso-border-alt:solid windowtext .5pt;mso-padding-alt:0cm 5.4pt 0cm 5.4pt'
 bordercolordark="#003366" bordercolorlight="#c0c0c0" height=706>
 <tr style='height:27.0pt'>
  <td width=100 style='width:74.65pt;border:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;
  height:27.0pt'><!--mstheme-->
  <p class=MsoPlainText><span style='font-size:10.0pt'>数据源<O:P> </O:P></span><span
  lang=EN-US><o:p></o:p></span></p>
  </td>
  <td width=243 style='width:182.55pt;border:solid windowtext .5pt;border-left:
  none;mso-border-left-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;
  height:27.0pt'><!--mstheme-->
  <p class=MsoPlainText><span style='font-size:10.0pt'><!--mstheme-->数据量<O:P> </O:P></span><span
  lang=EN-US><o:p></o:p></span></p>
  </td>
  <td width=201 style='width:151.1pt;border:solid windowtext .5pt;border-left:
  none;mso-border-left-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;
  height:27.0pt'><!--mstheme-->
  <p class=MsoPlainText><span style='font-size:10.0pt'><!--mstheme-->生物信息学任务<O:P>
  </O:P></span><span lang=EN-US><o:p></o:p></span></p>
  </td>
 </tr>
 <tr style='height:61.5pt'>
  <td width=100 style='width:74.65pt;border:solid windowtext .5pt;border-top:
  none;mso-border-top-alt:solid windowtext .5pt;padding:4.25pt 5.4pt 4.25pt 5.4pt;
  height:61.5pt'><!--mstheme-->
  <p class=MsoPlainText><span lang=EN-US style='font-size:10.0pt'>DNA序列<O:P> </O:P></span><span
  lang=EN-US><o:p></o:p></span></p>
  </td>
  <td width=243 style='width:182.55pt;border-top:none;border-left:none;
  border-bottom:solid windowtext .5pt;border-right:solid windowtext .5pt;
  mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;
  padding:4.25pt 5.4pt 4.25pt 5.4pt;height:61.5pt'><!--mstheme-->
  <p class=MsoPlainText><span lang=EN-US style='font-size:10.0pt'><!--mstheme-->3000万条序列<O:P>
  </O:P></span><span lang=EN-US><o:p></o:p></span></p>
  <p class=MsoPlainText><span lang=EN-US style='font-size:10.0pt'>400.0 亿个碱基<O:P>
  </O:P></span><span lang=EN-US><o:p></o:p></span></p>
  </td>
  <td width=201 style='width:151.1pt;border-top:none;border-left:none;
  border-bottom:solid windowtext .5pt;border-right:solid windowtext .5pt;
  mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;
  padding:4.25pt 5.4pt 4.25pt 5.4pt;height:61.5pt'><!--mstheme-->
  <p class=MsoPlainText style='text-indent:10.0pt;mso-char-indent-count:1.0;
  mso-char-indent-size:10.0pt;mso-char-indent-size:10.5pt'><span
  style='font-size:10.0pt'><!--mstheme-->分离编码与非编码区域<O:P> </O:P></span><span
  lang=EN-US><o:p></o:p></span></p>
  <p class=MsoPlainText style='text-indent:10.0pt;mso-char-indent-count:1.0;
  mso-char-indent-size:10.0pt;mso-char-indent-size:10.5pt'><span
  style='font-size:10.0pt'>识别内含子与外显子<O:P> </O:P></span><span lang=EN-US><o:p></o:p></span></p>
  <p class=MsoPlainText style='text-indent:10.0pt;mso-char-indent-count:1.0;
  mso-char-indent-size:10.0pt;mso-char-indent-size:10.5pt'><span
  style='font-size:10.0pt'>基因产物预测<O:P> </O:P></span><span lang=EN-US><o:p></o:p></span></p>
  <p class=MsoPlainText style='text-indent:10.0pt;mso-char-indent-count:1.0;
  mso-char-indent-size:10.0pt;mso-char-indent-size:10.5pt'><span
  style='font-size:10.0pt'>基因功能注释<O:P> </O:P></span><span lang=EN-US><o:p></o:p></span></p>
  <p class=MsoPlainText style='text-indent:10.0pt;mso-char-indent-count:1.0;
  mso-char-indent-size:10.0pt;mso-char-indent-size:10.5pt'><span
  style='font-size:10.0pt'>基因调控信息分析<O:P> </O:P></span><span lang=EN-US><o:p></o:p></span></p>
  </td>
 </tr>
 <tr style='height:90.0pt'>
  <td width=100 style='width:74.65pt;border:solid windowtext .5pt;border-top:
  none;mso-border-top-alt:solid windowtext .5pt;padding:4.25pt 5.4pt 4.25pt 5.4pt;
  height:90.0pt'><!--mstheme-->
  <p class=MsoPlainText><span style='font-size:10.5pt;mso-bidi-font-size:10.0pt;
  mso-ascii-font-family:"Times New Roman";mso-hansi-font-family:"Times New Roman";
  mso-font-kerning:1.0pt'>蛋白质序列<O:P></span><span style='font-size:10.5pt;
  mso-bidi-font-size:10.0pt;font-family:"Times New Roman";mso-font-kerning:
  1.0pt'> </O:P></span><span lang=EN-US><o:p></o:p></span></p>
  </td>
  <td width=243 style='width:182.55pt;border-top:none;border-left:none;
  border-bottom:solid windowtext .5pt;border-right:solid windowtext .5pt;
  mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;
  padding:4.25pt 5.4pt 4.25pt 5.4pt;height:90.0pt'><!--mstheme-->
  <p class=MsoPlainText><span lang=EN-US style='font-size:10.5pt;mso-bidi-font-size:
  10.0pt;font-family:"Times New Roman";mso-font-kerning:1.0pt'><!--mstheme-->100</span><span
  style='font-size:10.5pt;mso-bidi-font-size:10.0pt;mso-ascii-font-family:"Times New Roman";
  mso-hansi-font-family:"Times New Roman";mso-font-kerning:1.0pt'>万条序列<O:P></span><span
  style='font-size:10.5pt;mso-bidi-font-size:10.0pt;font-family:"Times New Roman";
  mso-font-kerning:1.0pt'> </O:P></span><span lang=EN-US><o:p></o:p></span></p>
  </td>

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -