深圳市生命科技产学研资联盟三项团体标准发布
2021年11月23日,深圳市生命科技产学研资联盟正式发布《基因检测服务中微生物组数据共享规范》、《低深度全基因组重测序的基因型推断和遗传变异解读的通用要求》、《人类基因组的低深度全基因组重测序的基因型推断和遗传变异解读》三项团体标准,助力基因测序行业高质量发展。
《基因检测服务中微生物组数据共享规范》
随着高通量测序技术日渐成熟以及成本的迅速降低,相关组学研究进展迅猛。促进微生物组学在医疗检测,健康管理等领域的广泛应用。微生物组的快速发展也伴随出现不同的产业分工,存在数据多中心多节点间交互传输的情况,如数据所有者和算法提供方分离,数据分析端与应用端分离等业态。而目前微生物组的生物信息分析中产生大量格式不统一、非结构化或半结构化的数据,不利于各节点间的数据分享及交互,会出现元数据记录不全等问题,下游数据应用端难以还原数据生产环境及追溯质量控制条件。此外,数据分析端与应用端的数据交互还多以文本拷贝等形式进行,时效性不佳,不利于下游基于互联网的解读应用开发,也不利于数据审核机制的建立及进行必要的数据安全管控。
为解决上述问题,规范基因检测服务中微生物组数据格式,提升数据交流有效性,制定团体标准《基因检测服务中微生物组数据共享规范》。该标准由深圳华大生命科学研究院和深圳国家基因库共同提出,深圳市生命科技产学研资联盟归口,起草工作组由深圳华大生命科学研究院、深圳华大智造科技股份有限公司、深圳华大基因股份有限公司、兰州大学第二医院、北京量化健康科技有限公司、北京知因新生活细胞生物科技有限公司、深圳市生命科技产学研资联盟、深圳华大基因科技有限公司等单位组成。该标准对微生物组在数据交换中的数据格式及元数据进行规范和统一,有助于降低下游应用开发沟通成本和减少歧义,促进产业分工及数据分享,提升微生物组数据的可应用性,打通数据分析、数据分享的信息壁垒。
《低深度全基因组重测序的基因型推断和遗传变异解读的通用要求》与《人类基因组的低深度全基因组重测序的基因型推断和遗传变异解读》
与目前广泛应用于消费级基因检测的芯片测序相比,全基因组低深度测序拥有覆盖更多变异解读位点的优势。随着基因组二代测序技术的不断发展,测序深度得到了有效控制;特定群体高质量参考数据集(Reference Panel)的建立,结合生信分析中基因型推断(GenotypeImputation)技术,测序深度进一步降低的同时,可以提供质量较高的全基因组低深度测序结果,以其精准和经济的优势,为全基因组遗传变异检测全民推广提供基础。
由于低深度全基因组测序缺乏对下机数据质控、基因型推断技术和变异解读结果等环节建立统一的标准。因标准的缺失,低深度全基因组测序产出统一的高质量变异解读结果无法保证,低深度全基因组测序的数据在行业或团体中的传输和共享也难以顺利进行。为此,深圳市生命科技产学研资联盟联合深圳华大生命科学研究院等企事业单位制定团体标准《低深度全基因组重测序的基因型推断和遗传变异解读的通用要求》以及《人类基因组的低深度全基因组重测序的基因型推断和遗传变异解读》。上述两项标准由深圳华大生命科学研究院和深圳国家基因库共同提出,深圳市生命科技产学研资联盟归口,起草工作组由深圳华大生命科学研究院、深圳市生命科技产学研资联盟、深圳市早知道科技有限公司、深圳瑞奥康晨生物科技有限公司、深圳华大智造科技股份有限公司、深圳华大基因科技服务有限公司、青岛华大智造科技有限责任公司、深圳华大基因科技有限公司、北京知因新生活细胞生物科技有限公司等单位的专家组成。本标准基于低深度全基因组重测序实际使用情况出发,以现行法律法规的规定和相关标准为基础,主要对低深度全基因组测序的下机数据质控、基因型推断技术和变异解读结果等环节进行规范,旨在确保低深度全基因组测序产出统一的高质量变异解读结果。