当前位置:首页 > 人文 > 正文

生物大数据

发布时间:2015-09-15 15:10 来源:转载网络 |  | 

“大数据”一词最初起源于互联网和IT行业,然而随着“人类基因组计划”的完成,带动了生物行业的一次革命,高通量测序技术得到快速发展,使得生命科学研究获得了强大的数据产出能力,包括基因组学、转录组学、蛋白质组学、代谢组学等生物学数据,这些数据具有数据量大(Volume)、数据多样化(Variety)、有价值(Value)、高速(Velocity)等特点。

编辑摘要 本词条内容尚未完善,欢迎各位编辑词条,贡献自己的专业知识!

生物大数据 - 定义


    “大数据”一词最初起源于互联网和IT行业,然而随着“人类基因组计划”的完成,带动了生物行业的一次革命,高通量测序技术得到快速发展,使得生命科学研究获得了强大的数据产出能力,包括基因组学、转录组学、蛋白质组学、代谢组学等生物学数据,这些数据具有数据量大(Volume)、数据多样化(Variety)、有价值(Value)、高速(Velocity)等特点。

生物大数据 - 特点


    生物大数据不仅带有“大数据”的特点,而且具有生物数据自身的特性,下面将结合大数据的“4V”特点一一具体阐释:
    1、数据量大:上个世纪末进行的“人类基因组计划”是由6个国家花费30亿美元10几年的时间才得以完成,如今,只需花费几千美元几个小时即可完成一个人基因组的解析。如此低廉高效的研究方式得到生物科学家们的青睐,大量的物种得以测序解析,使得生物研究家们进入的生物数据的海洋。据不完全统计,截止到2013年6月,深圳华大基因研究院仅原始的测序相关的数据量就达到12PB,并且以每月60TB的速度增长,预计未来几年内每月的原始数据增量会超过2PB。
    2、数据多样化:由于测序仪器种类繁多(比如常见的高通量测序仪器CG测序仪、illumina hiseq、Roche 454、Ion Torrent等),产生的数据格式也各不相同。同时,利用不同的生物信息分析软件或分析流程处理得到的结果也是千差万别。
    3、价值高:随着生物信息学的发展,越来越多有价值的信息从生物数据中挖掘出来,这些价值不仅体现在其在生物科研领域,而且已应用于农业、健康和医学等领域。
    4、高速:这主要体现在数据的急剧增长速度,不仅体现在数据的量上,而且在数据的多样化和价值上。

生物大数据 - 应用


   “十一五”以来,国务院批准发布《促进生物产业加快发展的若干政策》和《生物产业发展“十一五”规划》,大力推进生物技术研发和创新成果转化。生物大数据本身好比一块有待开发的土地资源,我们基于大数据的“4V”特点,推进其在医疗健康、农业和食品等领域的快速应用,比如基因检测、优良农作物品种培育等。