ENCODE是DNA元素的百科全书。Encode于2003年启动,旨在识别人类基因组中的所有功能元素(工作位)。这项工作是由美国、英国、西班牙、新加坡和日本的32个实验室的400多名科学家完成的。他们的研究结果发表在《自然》、《基因组生物学》和《基因组研究》三本杂志上的30篇公开发表的论文中。这是迄今为止对人类基因组最详细的分析。
他们的主要调查结果简化如下:
- 基因组中只有1%的蛋白质编码。也就是大约21000个基因。
- 70,000个序列为"启动子"区域编码。它们位于基因的上游,蛋白质在那里结合以控制基因的表达。
- 大约有40万个"增强子"区域,它们调节着远方的基因。
- 有四百万个基因"开关"。这些是控制基因开启或关闭的DNA序列。它们通常在基因组上离它们控制的基因很远。
- 大约80%的基因组有明确的生化功能。那种认为大部分DNA是"垃圾DNA"的想法绝对是错误的。"人类基因组的绝大部分并不对蛋白质进行编码,直到现在,似乎还不包含确定的基因调控元素。为什么进化会保留大量'无用'的DNA,一直是个谜,似乎很浪费。但事实证明,保留这些DNA是有充分理由的。ENCODE项目的结果表明,这些DNA的大部分延伸段都藏有与蛋白质和RNA分子结合的区域,使这些区域处于相互合作的位置,从而调节蛋白质编码基因的功能和表达水平"。
- 进化是由编码蛋白质的基因和编码调节控制的DNA的变化引起的。
"进化生物学的一大挑战是了解物种之间DNA序列的差异如何决定其表型的差异。进化变化可能通过蛋白质编码序列的变化和改变基因调控的序列变化而发生"。
工作中使用的方法包括:
- 他们分离了基因组转录的RNA并进行了测序。
- 他们确定了约120种转录产物的结合位点。
- 他们检查了对组蛋白进行化学修饰的模式。这是为了找到基因表达被促进或抑制的区域。
- 他们在147种细胞类型上做了1648次实验。
与这项工作有关的新闻项目有: