1、ICS 07.080 CCS C 04 DB4403 深 圳 市 地 方 标 准 DB4403/T 126 2020 基因身份证技术规程 Technical regulation of DNA identity document 2020-11-23 发布 2020-12-01 实施 深圳市市场监督管理局 发布 DB4403/T 126 2020 I 目 次 前言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 缩略语 . 3 5 基本要求 . 3 6 基因组遗传标记选取类型及要求 . 4 7 制作流程 . 5 附录 A(资料性) DNA 位点 . 8 附录
2、 B(资料性) 基因身份证信息采集单 . 10 参考文献 . 11 DB4403/T 126 2020 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则 第 1部分:标准化文件的结构和起草规则的规定起 草 。 本文件由深圳市发展和改革委员会提出和归口。 本 文件 起草单位: 深圳华大法医科技有限公司 、深圳华大基因股份有限公司,深圳华大基因科技有 限公司。 本文件主要起草人:沈悦生、王秋娟、阳明霞、郑飞雪、胡雪松、吴昊、叶明芝、姜华艳、王洪琦、 尹烨。 DB4403/T 126 2020 1 基因身份证技术规程 1 范围 本文件规定了基因 身份证 制作 的 基本要求、基因组遗
3、传标记选取类型及要求、制作流程等内容。 本文件适用于深圳市范围内基因身份证制作。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB 19489 实验室生物安全通用要求 GB/T 30989 2014 高通量基因测序技术规程 GB/T 37870 2019 个体鉴定的高通量测序方法 GB 50346 生物安全实验室建筑技术规范 GA/T 461 2019 居民身份证制证用数字相片技 术要求 GA/T 1012 2019 居民身份证指
4、纹采集和比对技术规范 GA/T 1162 2014 法医生物检材的提取、保存、送检规范 GA/T 1380 2018 法庭科学 DNA数据库人员样本采集规范 3 术语和定义 GB/T 30989 2014界定的以及下列术语和定义适用于本文件。 3.1 基因 身份证 DNA Identity Document 由个人基本信息标识符和部分基因组信息组成。可甄别个体、种族、血型等,并为识别个人身份提 供证据。 3.2 ABO 血型基因 ABO gene 位于 9号染色体长臂, 由 7个外显子和 6个内含子组成,基因全长约 18 kb,其中 7个外显子全长约 1065 bp,大小从 28 bp到 68
5、8 bp不等。 注: 大多数临床表型及基因分型亚型多态性位于 6号外显子。 3.3 ABO 血型基因分型 ABO genotyping DB4403/T 126 2020 2 从基因序列水平 对 ABO血型基因进行分型, 其结果精确到血清学水平后的亚型 。 3.4 Rh 血型基因 Rh gene 位于 1号染色体短臂,包括 RHD、 RHCE和小膜蛋白 1基因( SMP1), RHD和 RHCE基因 3 端相对,相隔 约 30000 bp并且高度同源。 3.5 Rh 血型基因分型 Rh genotyping 从基因序列水平对 Rh血型 基因 进行分型,可区分免疫原性最强的 RHD基因全缺失、部
6、分 D、弱 D、 DEL 型, 其结果精确到血清学水平后的亚型 。 3.6 HLA 高分辨分型 HLA high resolution genotyping 从基因序列水平对 HLA基因 进行分型, 其结果精确到血清学水平后的亚型。 3.7 种族溯源 ancestry trace 通过人群基因与基因型频率存在明显群体差异的一组 SNP位点,分析某一人群的遗传成分构成,或 推断某一个体的群体来源及其成分构成。 3.8 祖先信息遗传标记 ancestry informative markers, AIMs 在不同人群中等位基因存在较大差异的遗传位点,也称人群特异标记。 3.9 探针捕获 probe
7、 capture 通过设计长度一般为 90 120 nt的捕获探针群,在杂交系统中特异性结合经过酶切或超声打碎的 DNA片段的过程。 3.10 主成分分析 principal component analysis, PCA 将分散在一组变量上的信息,集中到某几个综合指标(主成分)上的一种统计分析方法。 来源: GB/T 29859 2013,定义 2.6.5 3.11 DNA 分型 DNA genotyping 利用生物学检测方法测定个体 DNA序列, 并将其 与其他个体的 DNA序列或参考 DNA序列进行比对, 以 确定 该个体与其他个体的遗传组成( 基因型 ) 差异 的过程。 DB4403
8、/T 126 2020 3 3.12 测序片段 reads 高通量测序平台产生的含有碱基序列和质量值的序列片段。 来源: GB/T 35890 2018,定义 3.1 3.13 序列比对 sequence alignment 比较两个或两个以上核酸序列间的相似性的过程。 来源: GB/T 29859 2013,定义 2.2.1 3.14 参考序列 reference genome sequence 测序片段对应的物种基因组序列。 来源: GB/T 35890 2018,定义 3.11 4 缩略语 下列缩略语适用于本文件。 AIMs: 祖先信息遗传标记( Ancestry Informative
9、 Markers) AISNPs: 祖源 SNP( Ancestry Informative SNPs) bp: 碱基对( Base Pair) DNA: 脱氧核糖核酸( Deoxyribonucleic Acid) Fst: 族群间遗传分化指数( Fixation index between subpopulation and total population) IISNPs: 个体识别 SNP( Individual Identification SNPs) InDel: 插入缺失( Insertion Deletion) MAF: 次等位基因频率( Minor Allele Freque
10、ncy) nt:碱基( Nucleotide) PIC: 多态信息量( Polymorphism Information Content) SNP: 单核苷酸多态性( Single Nucleotide Polymorphisms) SOP:标准作业程序( Standard Operating Procedure) STR: 短串联重复序列( Short Tandem Repeat) 5 基本要求 5.1 实验室要求 实验室应根据功能划分为试剂储存和准备区、样本制备区、扩增区、扩增产物分析区和其他区域。 实验室建设其他要求应符合 GB 19489和 GB 50346的规定。 5.2 设施设备要
11、求 5.2.1 主要 仪器 DB4403/T 126 2020 4 试验过程 中主要 包括 以下仪器 : a) 高通量测序仪 :应满足测序通量 100 Mb,碱基识别质量 20,碱基识别正确率 99.9%; b) 聚合酶链式反应仪 :应满 足温度设置范围为 0 99 ,最大循环数为 99; c) 高速 离心机 :应满足最高转速 16000 r/min; d) 微量移液管 ; e) 涡旋震荡仪; f) 冰箱:应满足温度调节范围为 -20 4 。 5.2.2 主要 试剂 试验过程中主要包括以下试剂 : a) DNA 提取试剂盒 ; b) PCR 扩增试剂:基因身份证的引物混合液及 PCR 预混体系
12、。 PCR 反应的预混体系包括 DNA 聚合 酶、 PCR 缓冲液、镁离子、 dNTP、 PCR 稳定剂和增强剂; c) 文库制备试剂盒 :核酸样本的基因文库构建试剂包括 DNA 聚合酶、 PCR 缓冲液; d) 高通量测序试剂:包括测序引物、高效测序反应 酶、缓冲液。 6 基因组遗传 标记选取类型及要求 6.1 遗传 标记类型 遗传标记类型见表 1。 表 1 遗传标记类型 个体识别 急救医学 种族 溯源 遗传标记类型 IISNP、 STR ABO、 Rh血型、 HLA分型 AISNPs 6.2 遗传 标 记选取要求 6.2.1 个体识别 进行个体识别时,针对目前应用较为广泛的 STR和 SN
13、P遗传标记,遗传标记选取应符合以下要求: a) 基因座定义和具有的特征已有文献报道 , 已有种属特异性、灵敏度、稳定性研究 , 有可供使用 并公开发表的群体遗传学数据; b) 遗传方式符合 孟德尔 遗传规律; c) 遗传标记的分型不受年龄、疾病及其他因 素影响,终生不变; d) 体细胞稳定性,同一个体的不同组织有相同的分型; e) 具有遗传多态性,符合哈迪 温伯格( Hardy Weinberg, H W) 平衡 法则 , STR 遗传标记的 H0.5、 PIC0.5, SNP 遗传标记的 H0.4、 MAF0.4; f) 通过 家系调查,至少观察 500 次减数分裂后,遗传标记的突变率 0.
14、2%; g) STR 侧翼 50 bp 范围内无超过 5 bp 的 InDel, 以保证捕获效率; h) 位点间互不连锁( r20.001); b) 人群特异性位点,即某个位点在一个人群中具有多态 性,而在另外的人群中不具备多态性特征, 或者在一个人群中某等位基因较其他人群更多的出现。选择以 MAF0.01, 0.5(绝对等位 基因频率差异); c) Fst0.3。 注: 符合遗传标记选取要求的基因座及遗传信息参见附录 A。 7 制作 流程 7.1 概述 基因身份证的制作分为 5个步骤,具体流程见图 1。 图 1 基因身份证制作流程 7.2 基础 资料 收集 基因身份证基础资料应包括 本人姓名
15、、性别 、 民族 、 身份证号、联系方式、家庭住址、既往史、彩 色正面免冠数字化照片及知情同意书。基因身份证 信息采集单参见附录 B。 7.3 样本 采集 、 运输及保存 7.3.1 样本 类型 外周血、唾液、口腔脱落细胞等。 7.3.2 采集、 运输及保存方法 采集方法参见 GA/T 1380 2018中 3的要求。保存及 运输 方法参见 GA/T 1162 2014中 6、 7的要求 。 7.4 基因组 测序 7.4.1 DNA 提取 根据样本类型,按照商业试剂盒中相应的操作说明进行提取操作。 7.4.2 标签文库建立与测序 构建基于芯片捕获的标签文库,并依据 不同测序平台 的 参考步骤测
16、序 。 建库过程中 应 设置阴性对照 与阳性对照。测序仪要求参见 GB/T 30989 2014中 7.3。 7.5 基因组分型 DB4403/T 126 2020 6 7.5.1 概述 将测序数据 进行过滤、序列比对,并对比对结果进行筛选统计,判断各个位点的基因型,具体流程 见图 2。 图 2 基因组分型流程图 7.5.2 过滤 去除测序数据中有接头污染、扩增重复与低质量(碱基识别质量值 2.5 ng/L。 7.6.4 测序前 DNA 样品质量控制 测序前定量检测 DNA浓度,宜根据高通量测序设备操作说明及项目要求进行定量。 7.6.5 测序数据 测序数据质 量 应满足 Q30 %80, S
17、plitRate %90。 注: Q30 %,错误率在 0.1 %碱基质量值为 30的序列比例。 SplitRate%,拆分率,数据中成功拆除标签的序列占总数 据的比例。 7.6.6 分型结果 每个位点最低支持 reads数目应符合表 2的要 求,若不符合则判定该位点分型失败,若样本中 90%以 上位点分型失败则判定该样本检测失败 (对照品除外) 。 DB4403/T 126 2020 7 表 2 参数 数值 对照表 测序 reads支持数目 a ( X) 最低的碱基支持数 b ( X) 5000 7000 300 2500 250 1000 50 500 40 200 10 100 5 50
18、 5 a表示被测基因组上单个碱基被测到的平均次数。 b最低的碱基支持数为在相应的测序 reads 支持数目时,所需要的最少碱基支持数。 7.6.7 异常记录 7.6.7.1 分析流程中,任何偏离数据标准分析流程之处均应详细记录,包括软件程序包、脚本、版本 号、数据库、命令行或参数的任何变动。分析流程中出现的漏洞、纰漏应 详细记录在异常记录文档中, 包括问题的描述、问题发生原因的调查、修正措施、相关的交流及直接负责人的批示。异常记录文档应 与相关案例分析报告对应。 7.6.7.2 分析特殊样本或基因组区间时,流程中任何与 SOP 不同的变动、相应的解释说明均应在最终 的结果报告中体现。 7.7
19、结果记录 基因 身份证 结果记录 应 包括表 3的内容。 表 3 结果记录 内容 生物标记 结果分析 结果记录示例 个体识别 SNP或 STR位点集 SNP或 STR 记录分型结果 rs1229984: T/T; D21S11: 29,30 ABO血型 ABO血型基因 NCBI数据库亚型 O04/B101 RH血型 RHD和 RHCE NCBI数据库 RHD亚型 RHD 1227G A /d HLA HLA A、 B、 C、 DQB1、 DRB1 国际 IMGT/HLA数据库 HLA A: 11:01:01, 24:02:01 HLA B: 35:01:01, 54:01:01 HLA C:
20、1:02:01, 4:01:01 HLA DQB1: 3:01:01, 3:03:02 HLA DRB1: 9:01:02, 11:01:01 祖源分析 SNP 记录分型结果及群体结构 分析 90%东亚, 10%欧洲 7.8 数据储存 基因 身份 证 数据 应存储于有 安全性保障的 数据库或存储于拥 有 不少于 102400个字节内 存 的芯片卡。 DB4403/T 126 2020 8 附 录 A (资料性) DNA 位点 A.1 个体 识别 A.1.1 常染色体 STR 位点 D21S11、 D18S51、 D5S818、 D7S820、 D13S317、 D16S539、 FGA、 D8
21、S1179、 D3S1358、 TPOX、 Penta E、 Penta D、 D2S1338、 D19S433、 D12S391、 D6S1043、 D1S1656、 D2S441、 D3S1744、 D3S3045、 D4S2366、 D5S2500、 D6S477、 D7S1517、 D7S3048、 D8S1132、 D10S1248、 D10S1435、 D10S2325、 D11S2368、 D13S325、 D14S608、 D15S659、 D17S1290、 D18S535、 D19S253、 D21S2055、 D22 GATA198B05。 A.1.2 X染色体 STR
22、位点 DXS6789、 DXS6795、 DXS6803、 DXS6809、 DXS7132、 DXS7133、 DXS7423、 DXS8377、 DXS8378、 DXS9895、 DXS9898、 DXS10101、 DXS10134、 DXS10135、 DXS10074 、 GATA172D05、 HPRTB。 A.1.3 Y染色体 STR 位点 DYS456、 DYS389I、 DYS390、 DYS389II、 DYS458、 DYS19、 DYS385 a/b、 DYS393、 DYS391、 DYS439、 DYS635、 DYS392、 Y GATA H4、 DYS437、
23、 DYS438、 DYS448。 A.1.4 常染色体 SNP位点 A.1.4.1 二等位 SNP 位点 rs740910、 rs1490413、 rs1335873、 rs1979255、 rs1493232、 rs2040411、 rs1528460、 rs717302、 rs251934、 rs8037429、 rs891700、 rs901398、 rs873196、 rs964681、 rs737681、 rs1463729、 rs1360288、 rs1382387、 rs1413212、 rs2056277、 rs2107612、 rs1015250、 rs1005533、 rs
24、729172、 rs10495407、 rs1357617、 rs719366、 rs1031825、 rs733164、 rs938283、 rs2111980、 rs1886510、 rs914165、 rs354439、 rs763869、 rs2076848、 rs1024116、 rs1355366、 rs735155、 rs1454361、 rs727811、 rs917118、 rs2831700、 rs907100、 rs1029047、 rs2046361、 rs722098 、 rs876724、 rs2016276、 rs826472、 rs2830795、 rs1028
25、528。 A.1.4.2 三等位 SNP 位点 rs1630312、 rs3091244、 rs2069945、 rs6001030、 rs140676、 rs356167、 rs941454、 rs10045、 rs3743842、 rs2298556、 rs3816662、 rs2307223、 rs10811897、 rs17287498、 rs385780、 rs11141033、 rs4540055、 rs3812847、 rs2032582、 rs2278786。 A.1.5 X染色体 SNP 位点 DB4403/T 126 2020 9 rs2056688、 rs2128519、
26、 rs1534285、 rs763056、 rs1373592、 rs993010 、 rs1557054、 rs1243792、 rs925178、 rs1207480、 rs1936313、 rs1977719、 rs1372687、 rs1857602、 rs985425、 rs933315、 rs2190288、 rs1991961、 rs1931662、 rs149910 、 rs1573704、 rs1340718、 rs1930674、 rs1339597、 rs1981452。 A.1.6 Y染色体 SNP 位点 rs11096433、 M145、 rs9306845、 rs9
27、786479、 rs17276358、 rs2075640、 M134、 M88、 M95、 rs16980426、 rs17323322、 M122、 rs13447354、 M89、 rs9786707、 M15、 rs16980711、 M9、 rs17316592、 rs17276345。 A.1.7 线粒体 SNP 位点 709、 1719、 1736、 3010、 3394、 3970、 4216、 4883、 5147、 5417、 5460、 6392、 6455、 8584、 8701、 9090、 10397、 10398、 11914、 12705、 13708、 139
28、28、 14318、 14783、 15487、 16519。 注: 在 A.1.7列出的 SNP基础上 , 可增加文献报道且验证的其他 SNP,以提高检 测的系统效能 A.2 种族 溯源 在祖源分析时,区分东亚、欧洲 、非洲 常 用 SNP基因座为 rs2814778、 rs3737576、 rs7554936、 rs10497191、 rs1834619、 rs1876482、 rs260690、 rs3827760、 rs6754311、 rs798443、 rs12498138、 rs1919550、 rs1229984、 rs3811801、 rs4833103、 rs7657799
29、、 rs7722456、 rs870347、 rs16891982、 rs192655、 rs3823159、 rs917115、 rs1462906、 rs1871534、 rs2196051、 rs6990312、 rs3814134、 rs4918664、 rs1079597、 rs174570、 rs2238151、 rs671、 rs1572018、 rs2166624、 rs7326934、 rs7997709、 rs9522149、 rs200354、 rs12439433、 rs1426654、 rs1800414、 rs735480、 rs12913832、 rs459920
30、、 rs11652805、 rs17642714、 rs2593595、 rs4411548、 rs4471745、 rs2042762、 rs3916235、 rs4891825、 rs7226659、 rs7251928、 rs310644、 rs2024566。 注: 在 A.2列出的 SNP基础上 , 可增加文献报道且验证的其他 SNP,以提高 系统的区分能力,比如区分中国的少数民 族人群。 DB4403/T 126 2020 10 附 录 B (资料性) 基因身份证信息采集单 基因身份证信息采集单见图 B.1。 基因身份证信息采集单 送检信息 送检人姓名 _ 送检人联系方式 _ 彩色
31、照片黏贴处 送检人身份证号码 _ 送检人家庭住址 _ 送检人个人信息登记 姓名 性别 民族 身份证号 ABO 血型 Rh 血型 HLA 分型 既往史 1.有无免疫治疗; 2.有无异体输血; 3.有无器官移植 送检样本类型 1.外周血; 2.口腔拭子; 3.血痕; 4.DNA; 5.其他(须注明) 入库 条码 标记 注 1: ABO、 Rh 血型及 HLA 分型不知则填“ ”; 注 2: 彩色照片采集按照 GA/T 461 2019 居民身份证制证用数字相片技术要求; 注 3: 指纹采集按照 GA/T 1012 2019 居民身份证指纹采集和比对技术规范; 注 4: 样本采集参考 GA/T 13
32、80-2018 法庭科学 DNA 数据库人员样本采集规范 。 检测机构人员填写 样本接收日期 _ 接收人 _ 备注(对不符合接收标准的样本描述) _ 图 B.1 基因身份证信息采集单 DB4403/T 126 2020 11 参 考 文 献 1 GB/T 29859 2013 生物信息学术语 2 GB/T 35890 2018 高通量测序数据序列格式规范 3 贾竟 . 生物物证供者种族来源推断的 SNP体系研究 J. 重 庆医科大学 , 2014. 4 Dean, M., et al. Polymorphic admixture typing in human ethnic populatio
33、nsJ. American Journal of Human Genetics. 1994, 55(4): 788 808. 5 Edwards, A., et al. Genetic variation at five trimeric and tetrameric tandem repeat loci in four human population groupsJ. Genomics. 1992, 12(2): 241 253. 6 Holsinger, K. E. and B. S. Weir. Genetics in geographically structured populations: defining, estimating and interpreting FSTJ. Nature Reviews Genetics, 2009, 10(9): 639. _