
Juan Gaertner / Science Photo Library
研究人员创造了迄今为止修饰基因表达的DNA区域的最全面的目录1那2。百科全书 - 于2007年首次发布并上个月更新 - 帮助研究人员在自闭症等条件下揭示基因之间的DNA细分的功能和其作用。
基因占人类基因组的不到2%。找到与自闭症相关的许多遗传变异在基因之外,在DNA的“不编码”部分中。科学家的一项重大挑战已经破译了这些不上限区域的功能。
2003年,研究人员开始工作DNA元素的百科全书(编码),一个旨在解释DNA超越基因的功能的项目。
最初,科学家们通过1%的基因组鉴定了编码分子如蛋白质的DNA的延伸,以及调节基因表达的所谓的“功能元素”。2012年,该团队扩展了百科全书,包括整个基因组,两年后,他们在鼠标基因组中映射了功能元素。
该项目的最新版本,编码3,7月所述自然,包括来自近6000个实验的数据,超过先前版本的两倍多。它还详细描述了来自小鼠和人的1,300个细胞样本中的功能元素,代表503个细胞和组织类型 - 比以前的版本中大约四倍3.。研究人员表示,将来的释放是为了包括更多的实验和细胞样本。
研究人员可以探索来自所有编码实验的数据在线的。
监管登记册:
为了创造百科全书,数百名研究人员跑了一系列实验,以收集关于基因组中功能元素的位置的分子线索及其可能的角色。对于新的释放,研究人员将直接从人和小鼠中汲取的细胞,该小鼠可以比用于先前编码版本的实验室生长的细胞更准确地重新成分健康组织。
例如,在一次测试中,研究人员确定了部分染色质- 酶联的DNA和蛋白质的卷曲复合物 - 可用于酶。酶和其他蛋白质可获得的区域被认为在基因表达中发挥作用。
在另一个实验中,它们在282'转录因子的基因组内映射了结合位点,其中参与调节基因表达的蛋白质。该团队还在具有改变DNA缠绕的化学标签的组蛋白附近的DNA的延伸延伸。更严格的风阻止进入引发基因表达的蛋白质。
研究人员敲击了所有这些分子线索,以确定可能调节的调节元件,例如改变邻近基因的表达和增强子的启动子,其调节远处基因的表达。该团队根据其与不同的组蛋白标签或转录因子的关联分类这些监管要素,以及它们接近基因序列的开始。新目录中的926,535件可能在人民和339,815人中的监管要素。
“在任何给定的组织中,有几十万活跃,”马克Gerstein,耶鲁大学生物医学信息学教授,以及该项目的领先调查人员之一。
目录,可以通过a访问基于Web的服务器Gerstein说,可以帮助研究人员更好地了解基因组的非编码区域。与其他数据集配对,它可以帮助科学家识别在大脑中特别活跃的监管区域。
RNA.R.ANK.:
在另一个研究中,在7月份发表基因组生物学,使用编码的研究人员开发一种方法来识别最有可能损害与RNA结合的蛋白质的遗传变体,这是一种细胞的蛋白质建筑说明书4.。
这些“RNA结合蛋白”有助于稳定,改变或破坏RNA,改变基因在细胞中的表达方式。研究有联系突变一些RNA结合蛋白质到自闭症。
编码的最新释放细节这些蛋白质中112的结合位点。使用这些数据,研究人员编目了52.6万字母的遗传密码,构成了这些网站。
They then created software that scores variants within these regions based on several lines of evidence, such as whether the variant is found in a highly conserved sequence, suggesting it has an important function, or the extent to which the variant’s sequence alters the protein’s binding site. A high score suggests the variant disrupts protein binding.
该软件也可以被编程为因素到分数组织特定标准,例如变型是否位于大脑中有效的已知调节元件内。
要测试软件,团队比较了在其他两个数据集中记录的变体的分数,人类基因突变数据库和1000个基因组项目。
研究人员报道,正如预期的那样,与医疗条件的关系的变异显着高于那些没有那些没有。该软件还强调了与医疗条件相关的720个变体,其他变体排名方法没有发现。
该软件可以帮助研究人员与RNA结合蛋白联系的揭示变体,其中研究人员表示,包括其他方法的重要功能,包括参与自闭症的人。它是自由的在线提供。
0.评论
通过加入讨论,您同意我们的同意隐私政策。