English 邮箱 数字农科院
官方微信
中国农科院微信公众号
农科专家在线微信公众号
  • 组织机构
    走进中国农科院
    寄语
    院章程
    院领导
    历任领导
    组织架构
    院机关
    院属单位
    区域创新中心
  • 新闻中心
    图片新闻
    时政要闻
    农科要闻
    科研活动
    三农一线
    媒体报道
    视频农科
    政务新媒体矩阵
  • 科学研究
    重大成果
    科研进展
    科技创新
    科技奖励
    农业高端智库
    中国农科院重大科学发现
    中国农科院重大产品创制、重大技术突破和重大智库报告
    中国农科院重大科技任务布局
    中国农科院十大科研进展
  • 科技支撑
    主推成果
    产业专家团
  • 人才教育
    人才队伍概况
    人才工作概述
    专家学者
    人才动态
    研究生教育
    中国农科院人才招聘网
  • 国际合作
    总体概况
    合作伙伴
    合作平台
    合作机制
    国际农业科学计划
    中国农科院年报
  • 平台基地
    资源概况
    平台
    基地
  • 信息服务
    资源服务
    数字农科院
    农业科研信息化典型案例
  • 党建文化
返回门户首页 数字农科院 邮箱
官方微信
中国农科院微信公众号
农科专家在线微信公众号
English
  • 院网首页
  • 图片新闻
  • 时政要闻
  • 农科要闻
  • 科研活动
  • 三农一线
  • 媒体报道
  • 视频农科
  • 政务新媒体矩阵
返回首页 English
首页 -  新闻中心 -  媒体报道
分享到

[经济日报]中国科学家将基因组分析速度提升5倍

发布时间:2019-12-23 |来源: 经济日报 2019年12月23日|作者:常理
字体 小 中 大

  自基因组学技术问世以来,测序与分析一直是基因组学技术中最主要的两个环节。实际上,与繁重的测序工作相比,基因组的分析也同样复杂,需要耗费大量时间。

  然而,随着近年来基因组学技术发展突飞猛进,这种状况正在逐步改变。

  日前,中国农业科学院深圳农业基因组研究所阮珏团队在《自然·方法学》上发表了第三代测序数据组装算法Wtdbg,极大提高三代测序数据的分析效率,与今年4月发表在《自然·生物技术》上的Flye算法相比,分析速度提升了5倍,并首次将测序数据分析时间降低到少于测序数据产出时间。

  基因组的测序与分析

  DNA测序技术成熟于上世纪70年代中后期,1990年人类基因组计划的提出,将基因组测序技术逐步由实验室迈入商业化阶段;到2004年人类基因组计划完成时,第二代基因组测序技术已经相对成熟,开始大规模商业化应用;2013年,单分子等第三代测序技术出现,也预示着测序技术应用更广,测序的成本越低。

  “如今,完成一个人的全基因组测序是普通家庭都可以负担起费用的‘平常’事情了。以三代测序为例,完成个人全基因组测序仅需1天时间、费用低于5万元。”论文作者、中国农业科学院深圳农业基因组研究所研究员阮珏告诉经济日报记者。

  在测序技术日新月异的同时,分析技术也在共同成长。以人类基因组组装为例,在2014年需要消耗50万个CPU小时,且只能在超大计算机集群上进行。因而,以全基因组组装方式对群体进行测序分析已经成为生物医学研究的趋势。

  关键钥匙:模糊布鲁因图

  Wtdbg算法的开发得益于一个新的组装图理论——模糊布鲁因图的提出。模糊布鲁因图借鉴了德布鲁因图的思想,将测序数据切分为固定长度的短串,再从短串构建出的图上恢复出全基因组序列。

  上世纪90年代,德布鲁因图被引入基因组组装领域,其以速度优势常用于第二代测序数据的组装分析,但因测序噪音极高,从未成功应用在第三代测序数据。

  2013年起,阮珏和美国哈佛医学院的博士李恒在德布鲁因图基础上,设计出一个新的组装图理论——模糊布鲁因图。通过重新对短串进行定义,它能够容忍高噪音数据,并随后对生成组装图和恢复基因组序列做了大量相应的重构,使其兼具高效率和高容错的优点。

  不断进化的新算法

  近年来,生物信息学领域的科学家们致力于改变这种数据产出速度远高于数据分析速度的尴尬状况,不断开发出更高效的组装分析算法。

  2013年,阮珏与李恒合作开始了测序数据分析方法如组装算法的开发,力求推动测序数据的分析速度更快、分析质量更高。2016年,他们的研究结束,并将研究成果Wtdbg对所有人免费开放使用。3年来,这项成果不仅被几十篇学术论文引用,还被国内多家基因测序分析公司作为主要组装分析工具,并且在2019年世界大学生超算竞赛中作为性能测试赛题。

  “我们收到大量反馈,不仅有助修订算法软件中的漏洞,还带来了新想法和思路。算法需要不断在实践中完善,只有通过更多实际应用,我们才能更有效调整改进这套算法。目前的算法与2016年相比已经是2.0版本,而更高版本的算法于今年初也开始了研究。”阮珏告诉记者。

打印本页
关闭本页
院网信息发布与管理
最新动态
  • [工人日报]我国科学家破译油菜害虫西北斑芫菁染色体水平基因组
    2025-04-25
  • [新京报]177.65公斤 新品种刷新我国三熟制模式下油菜单产纪录
    2025-04-25
  • 奶牛瘤胃微生物优势脲酶结构与绿色脲酶抑制剂
    2025-04-25
  • 蛋白乙酰化修饰调控大口黑鲈肝脏炎症和纤维化进程
    2025-04-25
  • 陆地棉与海岛棉叶片细胞类型的保守与分歧
    2025-04-25
  • 能调控水稻粒重的新基因“鲲鹏”
    2025-04-25
  • 杨振海走进树人讲堂 为研究生作专题讲座
    2025-04-25
  • 纳米尺度“破译”镉与吸附材料间的相互作用
    2025-04-25
  • 核酸标准物质新进展
    2025-04-25
  • 抗病毒基因的敲除可提高植物病毒载体介导的蛋白表达
    2025-04-25
  • 视频农科
  • 通知公告
  • 特别关注
  • 政务新媒体矩阵
  • 网站地图
  • 联系我们
我要捐赠

主办:中国农业科学院承办:中国农业科学院农业信息研究所地址:北京市海淀区中关村南大街12号邮编:100081

Copyright@中国农业科学院京ICP备10039560号-5京公网安备11940846021-00001号