点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:人工智能新模型可解码DNA隐藏“语言”
首页> 数字化频道> AI+ > 正文

人工智能新模型可解码DNA隐藏“语言”

来源:科技日报2024-08-09 13:50

  基于DNA序列训练的大型语言模型(艺术图)。

  图片来源:物理学家组织网

  科技日报北京8月6日电(记者张佳欣)DNA包含了维持生命所需的基础信息。理解这些信息是如何存储和组织的,一直是20世纪最大的科学挑战之一。现在,借助GROVER这一基于人类DNA训练的新型大型语言模型,研究人员有望解码基因组中隐藏的复杂信息。GROVER由德国德累斯顿工业大学生物技术中心开发,它将人类DNA视为文本,通过学习其规则和上下文来提取DNA序列的功能信息。这一新工具有望彻底改变基因组学并加速个性化医疗的发展。相关研究论文发表在新一期《自然·机器智能》杂志上。

  大型语言模型通过文本训练,发展出了在多种语境下使用语言的能力。研究人员设想将生命代码DNA当作一种语言,训练了一个大型语言模型——GROVER。

  在语言方面,人们谈论的是语法、句法和语义。而对于DNA来说,这意味着学习核苷酸的序列等。就像GPT模型学习人类语言一样,GROVER基本上学会了DNA“语言”。

  研究表明,GROVER不仅能准确地预测接下来的DNA序列,还可用来提取具有生物学意义的上下文信息,例如识别DNA上的基因启动子或蛋白质结合位点。此外,GROVER还学习了“表观遗传”过程,即在DNA序列不发生改变的情况下,基因表达的可遗传变化。

  GROVER有望解锁DNA中蕴含着关于人类本质、疾病易感性以及对治疗反应的关键信息。研究人员相信,通过语言模型理解DNA的规则,将有助于揭示隐藏在DNA中的生物意义,从而推动基因组学和个性化医学发展。

[ 责编:王一涵 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 南海影像日志丨驰骋蔚蓝 破浪护疆

  • 荷风十里东湖夏 碧水长天入画来

独家策划

推荐阅读
6月15日-6月21日光明图片一周见报作品精选
2026-06-22 15:25
随着小浪底水利枢纽3条排沙洞的闸门徐徐开启,巨大白色"水龙"喷涌而出,以2600立方米每秒的流量向下游奔腾而去。这标志着黄河2026年主汛期前调水调沙正式启动
2026-06-22 15:24
近年来,新疆乌苏市坚持党建引领乡村产业发展,以"避暑+"经济串联观光旅游、休闲娱乐等多元产业,在青山绿水间因地制宜发展"清凉产业",带动村民增收
2026-06-22 15:24
今年以来,如城街道立足本土特色花木资源,融合花木景观与田园营地资源,推动传统苗木产业与乡村文旅休闲业态双向赋能、深度融合,持续丰富乡村游玩场景,擦亮属地生态农旅特色名片
2026-06-22 15:23
连日来,陕西省渭南市合阳县公安局洽川派出所聚焦黄河干流、洽川湿地、沿河滩涂等重点水域,严厉打击网捕、电鱼等非法捕捞行为。同时组织警力深入沿河村庄开展禁渔普法宣传,普及《黄河保护法》,引导群众主动参与生态保护,凝聚全民护河护渔合力,持续筑牢黄河合阳段生态安全屏障
2026-06-22 15:23