新的AI工具可以研究人类基因组中的“深色对象”

作者: bet356亚洲版本体育 分类: 奇闻 发布时间: 2025-06-28 10:28
图片来源:JuSun/iStock via Getty研究人员已将大量基因组数据喂入机器学习系统,培训它们以预测非编码序列的作用。根据Nature的说法,Alphagenome的新开发的人工智能(AI)模型是一种深媒体模型,将帮助科学家在基因组 - 遵循-Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -Non -non -Non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non -non型模型模型,以了解如何影响细胞的内部功能并引起癌症 - 类似癌症。当前,从事非商业活动的研究人员可以使用编程界面通过DeepMind服务器访问模型。这种AI模型在6月25日的预印本中进行了描述。2001年,大自然发表了人类基因组的草图,由埃斯塔多斯州,英国,日本,德国,德国,法国和中国的科学家共同完成。然而,迄今为止,大约31亿个基准对中的许多是一个谜。从人类基因组的长期来看,98%是与蛋白质编码合成的基因,即r不编码的自我,可以影响蛋白质活性,并包含大量与该疾病相关的突变相关部位。这部分特别感到科学家的头痛。由于没有准备好的答案,因此很难知道DNA顺序的作用,因为AlphaFold预测了3D蛋白的结构。从吸引一组细胞机到附着于染色体的特定部分,并将邻近基因写入RNA分子,到吸引影响基因表达发生的loccasion,时间和程度的转录因子,DNA的单个片段具有许多相互关联的作用。例如,许多DNA依从性通过改变染色体的3D形状来影响基因活性,从而限制或简化对转录机的访问。在过去的几十年中,科学家已经开发了十二个AI模型来了解基因组。其中许多集中于单个任务,例如猜测基因表达水平或确定外显子对b的方式E -CLIP并以各种蛋白质的形式尊敬。字母组合是用于解释DNA的“集成”工具。字母组可以处理多达100万个DNA碱基,其中可能包括基因和无数的调节元素,并且可能在不同的生物学特性中做出数千个预测。此外,字母组合在预测过程中对单个DNA碱基的变化非常敏感,这意味着科学家可以预测突变的影响。 DeepMind研究人员使用字母肌元来研究先前研究中发现的白血病患者的各种突变。该模型准确地预测,非编码区突变不会直接激活附近的基因,典型的癌症驱动器。但是,字母培训组接受了人类的宝石和慕斯以及其他相关的实验数据的训练,并且尚未测试其对其他生物的有效性。此外,还有提高字母组预测准确性的空间。例如,模型很难位于超过100,000个碱基对中。 ALP说,彼得·库(Peter Koo)是统一史密斯特·赫格尼组(United Statesthe Hagenome)的冷春港实验室的计算生物学家,类似模型尚未捕获细胞性质的变化如何影响DNA对DNA的依从性的功能。因为这些模型只能在固定的环境中预测,而细胞是动态的 - 新型:蛋白质水平,DNA化学标签和其他条件会随着时间或细胞类型而变化,这可以以相同的依从性起作用的方式改变。 (Xu Rui)

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!