点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:新语言模型学会读取“另类文本”
首页> 数字化频道> AI+ > 正文

新语言模型学会读取“另类文本”

来源:科技日报2024-04-09 17:13

  科技日报北京4月8日电(记者 张梦然)最新发表在《自然·机器智能》上的一篇论文中,美国普林斯顿大学研究人员详细介绍了一种语言模型,该模型可追踪部分基因组序列并优化这些序列,利用其语义表示能力来设计更有效的信使RNA(mRNA)疫苗。

  新模型的代码包含所有生命功能的指令。基因组中每个序列都遵循复杂的语法和句法,这些结构产生了意义。正如改变几个单词可从根本上改变句子含义,生物序列的微小变化也可使序列编码产生巨大差异。

  科学家将遗传信息的流动总结为“生物学中心法则”:信息从DNA转移到RNA再到蛋白质,蛋白质创造活细胞的结构和功能。mRNA在最后一步(称为翻译)将信息转化为蛋白质。mRNA只有一部分包含蛋白质代码,其余部分不进行翻译,但控制翻译过程的重要方面。

  控制蛋白质生产效率是mRNA疫苗发挥作用的关键机制。在对少数物种进行模型训练后,研究人员生成了数百个新的优化序列,并通过实验验证了这些结果。最佳序列的性能优于疫苗开发的多个领先基准,其中蛋白质生产的整体效率提高了33%。

  研究团队使用经过训练的模型创建了包含211个新序列的库,每个都针对所需功能进行了优化,提高了翻译效率。这些蛋白质,如新冠疫苗靶向的刺突蛋白,可驱动针对传染病的免疫反应。

  新模型是第一个专注于mRNA非翻译区域的语言模型。研究人员表示,即使是少量提高蛋白质生产效率,也会对新兴疗法产生重大推动作用。经过对来自少数物种的mRNA的训练,它能解码核苷酸序列并揭示有关基因调控的新知识。而基因调控是生命最基本的功能之一,是找到疾病和紊乱根源的关键。

[ 责编:刘昊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 山西运城:花海春色

  • 星空相册丨春分悬日

独家策划

推荐阅读
山东省荣成市美术馆,一场集中展示胶东地域特色的非物质文化遗产精品展火热开展,胶东花饽饽、剪纸、捏塑、根雕、钩针编织等多项非遗技艺作品集中亮相
2026-03-21 17:34
贵州省毕节市威宁自治县双龙镇杨湾桥水库清水沟尾水区的小树林旁,一群国家一级保护动物黑颈鹤正在水边悠游觅食、梳理羽毛,时而引颈高歌,时而结伴嬉戏
2026-03-21 17:26
河南省洛阳市洛浦公园内樱花竞相绽放,景色怡人,吸引市民驻足观赏。
2026-03-21 17:23
组织开展"学气象,知冷暖 "主题活动,学生们通过观察了解气象设备的功能与作用、体验设备的使用方式,探索气象奥秘,感受气象科技魅力
2026-03-21 17:19
江苏苏州天气转暖,春和景明。古运河畔绿柳依依,桃花、玉兰花竞相绽放,古城、街坊,河道在碧蓝晴空映衬下,呈现出水清岸绿、春意盎然的生态景观,别有一番江南水乡独特风韵
2026-03-21 17:15