1、 ICS 13.310 A 92 中 华 人 民 共 和 国 公 共 安 全 行 业 标 准 GA GA/T XXXX XXXX 法庭科学 DNA 二代测序检验规 范 Forensic sciences Specifications for second generation sequencing-based DNA examination 2020-08-01 发布 2021-01-01 实施 中华人民共和国公安部 发 布 GA/T XXXXXXXX 目 次 前 言 . I 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 缩略语 . 4 5 总则 . 4 6 原理
2、. 4 7 检验器材和试剂 . 4 8 检验流程 . 5 9 数据分析 . 6 10 遗传参数计算 . 7 附 录 A( 资料 性附录 ) 法 庭科学 DNA二代测序检验记录表 . 8 GA/T XXXXXXXX 前 言 本标准按照 GB/T 1.1 2009给出 的规 则起草。 请注意本文件的某些内容可能涉及专利 。 本文件的发布机构不承担识别这些专利的责任。 本标准由全国刑事技术标准化技术委员会 法医检验 分 技 术委员会( SAC/TC 179/SC 6) 提出并 归口。 本标准起草单位: 公安部物证鉴定中心 、 四川大学 、 广东省 公安厅 。 本标准主要起草人: 叶健 、 季安全 、
3、 王乐 、 康克莱 、 侯一平 、 张驰 、 李海燕 、 刘开会 、 张广峰 。 GA/T XXXXXXXX 1 法庭科学 DNA 二代测序检验规范 1 范围 本标准规定了利用二代测序技术进行法庭科学人类 DNA遗传标记靶向 测序检验的术语和定义、原 理、检验器材和试剂、检验流程,以及数据 分析、遗传参数计算应遵守的基本要求 。 本标准适用于 针对各类法医学物证检材的 STR、 SNP、 InDel等遗传 标记以及线粒体 DNA进行二代测 序检验分析,为法庭科学实践提供遗传学信息 , 适用于所有从事法庭科学检验的 DNA实验室和产品制 造商 。 2 规范性引用文件 下列文件对于本文件的应用是必
4、不可少的。凡是注日期的引用文件 , 仅 注日期的版本适用于本文 件。凡是不注日期的引用文件 ,其最 新版本(包括所有的修改单)适用于本文件。 GB/T 27025 2019 检测和校准实验室能力的通用要求 GB/T 30989 2014 高通量基因测序技术规程 GB/T 35537 2017 高通量基因测序结果 评价要求 GA/T 383 2014 法庭科学 DNA实验室检验规范 3 术语和定义 下列 术语和定义适用于本文件。 3.1 DNA 测序 DNA sequencing 对 DNA分子的 核苷酸排列顺序的测定,即测定组成核酸分子的腺嘌呤( A)、鸟嘌呤( G)、胞嘧啶 ( C)和胸腺嘧
5、啶( T)的排列顺序。 3.2 二代 测序 second generation sequencing 区别于传统 Sanger(双脱氧法)测序, 能够 一次 并行 对 大量核酸分子进行序列测定的技术 , 通常 一次测序反应能产出不低于 100 Mb的测 序数据。 3.3 靶向测序 targeted sequencing 针对 特定基因集或基因组区域内已知和新型变异 进行测序,有效降低测序成本,提高 测序深度 , 更为有效地研究特定区域的 遗传变异 。 3.4 桥 式 PCR bridge polymerase chain reaction GA/T XXXXXXXX 2 文库 两端的 DNA序
6、列与芯片表面固定的引物序列特异性结合,以文库 DNA为模板,进行桥形扩增。 通过不断 变性和扩增的循环过程使得每个 DNA片段在各自的位置上复制集中成束,生成 DNA簇。每个 DNA 簇 包含成千上万单克隆扩增子,以每个 DNA 单链为模板, 逐个合成 DNA 互补 链,将碱基信号强度 放大,进而达到测序所需信号的强 度。 3.5 乳化 PCR emulsion polymerase chain reaction 将用于 PCR反应的水相体系与油相体 系混合,形成大量油包水的微乳液独立 PCR反应空间,如果 PCR 反应体系中加入的核酸模板数量合适,每个独立反应空间中将只有一个模板分子 。在形
7、成的 独立 反应空 间 中 进 行 相同模板的 平行扩增,即可得到大量相同的扩增结果,实现 基因扩增。 3.6 DNA 纳米球 DNA nanoball 在 二代测序的模板扩增过程中,先将 DNA进行片段化处理,加接头序列和环化,形成单链环状 DNA, 然后通过滚环扩增将单链环状 DNA扩增 2 3个数量级最终产生 的产物。 3.7 单次测序 single run sequencing 测序仪器运行一个测序流程,如一次单向测序或一次双向测序的行为。 GB/T 30989-2014,定义 3.20 3.8 文库 library 通 过生物来源的 、人工合 成的 或克隆技术等所得到的一个重建分子群
8、,如基因组文库、互补 DNA 文库、噬菌体展示肽文库等。 GB/T 30989-2014,定义 3.5 3.9 接 头 adapter 用于标记和固 定待测序片段的一小段已知序列 的 DNA 片 段 。 3.10 标签或 条码 index; barcode 一段特 征性的脱 氧核苷酸短片 段,在多样本混合检测时,充当 识别特定样本来源的唯一标志。 3.11 测序通量 throughput of gene sequencing 单次测序可获 得序列信息的基因片段数量或可测 定的脱氧 核糖核酸 和 核 糖核酸(以 碱基表示)数 量。 GB/T 30989-2014,定义 3.21 3.12 测序
9、读长 read length of gene sequencing GA/T XXXXXXXX 3 测序 能测得的最长 DNA片段的长度,通常以碱基数表示。 GB/T 30989-2014,定义 3.24 3.13 测序深度 depth of sequencing 待测样本中某个指定的核苷酸被检测的次数 。 GB/T 30989-2014,定义 3.31 注 : 对于 STR 的 二代测序, 指 待测样本中某条指定的序列被检测的次数。 3.14 测序准 确率 accuracy of gene sequencing 对已知序列的基因进行测序,获得的正确碱基数占可识别的碱基数比例。 GB/T 30
10、989-2014,定义 3.25 3.15 碱基识别正确 率 accuracy of base calling 单次测序正确碱基数占碱基总数的比例。 GB/T 30989-2014,定义 3.27 3.16 碱基识别错误率 inaccuracy of base calling 单次测序错误碱基数占碱基总数的比例,与碱基识别正确率( 3.15)相对。 GB/T 30989-2014,定义 3.28 3.17 碱基识别质量 quality of base calling 衡量 碱基正确识别的概率,通常以数字值直接表示。 碱基识别质量与碱基识别错误率之间的关系可用式( 1)表示: Q = 10lg
11、P ( 1) 式中: Q 碱 基识别 质量; P 碱基识别错误率。 GB/T 30989-2014,定义 3.29 3.18 等位基 因覆盖 度 比 allele coverage ratio 基因座 分型 为 杂合子 时, 两个等位基因 的 测序 深度 的 较低 值 与 较高 值 的比 值 ( 0 ACR 1) ,常 用 于 评估 基因座内 测序信号的均衡性。 3.19 有效序列 effective read 测 序结果中,所有能比对到参考基因组的目标区域序列数占所有测序序列数的比例。 GA/T XXXXXXXX 4 4 缩略语 下 列 缩 略语适 用于本文件。 ACR:等位基因覆盖度比 (
12、 Allele Coverage Ratio) DNA:脱氧核糖核酸( Deoxyribonucleic Acid) DNB: DNA纳 米球( DNA Nanoball) EPCR: 乳化 PCR( Emulsion Polymerase Chain Reaction) InDel: 插入缺失多态性( Insertion Deletion Polymorphism) PCR:聚合酶链式反应( Polymerase Chain Reaction) SNP:单核苷酸多态性( Single Nucleotide Polymorphism) STR:短串联 重复序列( Short Tandem Re
13、peat) 5 总则 5.1 鉴定人应具有法医 物证鉴定执业资格 ,熟 悉并 掌握基 于 二代 测序进行法 庭科 学遗传标记 检验 的 原理 和方法 ,并能正确使用分析软件对测序结果进行分析与评价。 5.2 实验室应有完 备的文书体系,准确、清晰、完整地记录实验流程和结果, 相关格式 参 见 附录 A。 原始记录、报告等 应 归档留存,保证其具有可追溯性。 5.3 实验室的环境 与设施应符合 GB/T 27025 2019的规定。为了有效 防止 DNA 污染,实验室 应 设置 分隔 独立的工作区域 进 行 PCR扩增前 操作 (试剂配制、 样本制备等) 和后续 PCR扩增、测序分析等检 验 操
14、作, 并标识区分 不同工作区 , 各区间不能直 通 。 所有实验操作 应 在 规 定区域进 行。 6 原理 将生物样 本 制备成待测样品, 通过桥式 PCR、乳化 PCR 或 DNA 纳米球扩增等 PCR 扩增技术,将待 测样品放大收集成库,然后进行平行循环测序。 利用边合成边测序的策略, 加入一种或多种带标记或 不带标记的底物核苷酸,在聚合酶的作用下,按照碱基互补配对原理,进行 DNA链的延伸,延伸一轮 测取一轮底物与模板结合后发出 的信号 , 包 括 荧光信号、电信号 或 半导体芯片检测的 离 子 信号 等, 收 集该信号并确定所测 位点的碱基信息 。 当上一轮测序完成后,重复测序过程,即
15、实现 大规模并行 基因 测序 。 7 检验器材 和 试剂 7.1 通则 7.1.1 对于 采用的 检验器材和 试剂等产品 需 按照 GB/T 27025 2019的要求经方法确认后方可使用于 日常检案。 7.1.2 对 于 采用的商业化或自行开发的法庭科学遗传标记二代测序检测试剂 需 进行质量评价 验证 , 包括但不限于准确性、灵敏度、稳定性、 一致性、均衡性、 种属特异性及遗传标记的群体遗传学参数 调查。 7.2 器材 主 要 检验器材 包括 : GA/T XXXXXXXX 5 a) 二代测序仪 , 基 本 参数要求包括: 碱基识别质量 大于 20, Q值过滤 之 后的准确率 大于等于 99
16、.9%; b) PCR 仪; c)荧光定量 PCR仪 ; d) 离心机; e) 低温 冰箱; f) 移液器。 7.3 试剂 主要检验试剂 包括 : a) DNA 提取试剂,用于释放 、分离 获得各类生物样本中的所有 DNA并进行纯化 ; b) PCR复合扩增试剂 , 用于 大规模平行 复合 扩增 针对 STR、 SNP、 InDel等遗传标记 或线粒体 DNA 的 各 目标位点 靶 序列 ,试剂盒内至少应包含:扩增引物、高效扩增酶 及 缓冲液 ; c) 文库构建试 剂 , 用 于 核 酸样品 的 测序 文库构 建,试 剂盒内至少应包 含: 接头 、 DNA 连接酶 或 DNA聚合酶、缓冲液 ;
17、 d) 测序试剂 , 用于对测序文库进行 二代 测序,试剂盒内至少应包含 :测序引物、高效测序 反应 酶 及 缓冲液 。 8 检验流 程 8.1 通则 检验流程应符合相应试剂说明书和仪器操作规范要求, 并 进行 实验室 内部方法验证 , 制定相应的 作业指导书,内容 至少 包括: a) 检验步骤 : 至少 包括 DNA提取与定量、测序文库 构建 、测序文库 纯化 与 定量 、测序 检验 等 ; b) 质量 控制 :至少包括 DNA 质量和浓度控制、文库 浓度控制、测序 原始 数据质量 控制、 测序 结 果 质量 评价 等 。 8.2 DNA 提取 与纯化 按照 GA/T 383 2014 的方
18、法开展实验 ,并 对 DNA 提取的 质量 和 浓 度 进行质量控制。 宜采用 荧光 定量方 法 对 DNA浓度进行定 量 并记录 。 8.3 目标序列扩增 将 适量的 DNA加至 引物混合液和 PCR反应的预混体系中进行 PCR扩增,扩增后选择合适的 方式 对 PCR 产物进行纯化。 扩增反 应体系及循环参数以 相应 试剂说明书为准。 实验需 设置阳性对照和阴 性对 照 。 8.4 文库构建 主要步骤 包括 添加 接头、文库 纯 化 、 文库质量控制 和标 准化 文库 。 材料和方法以文库构建试剂说 明书为准 ,其它注意事项包括: a) 清晰标记 添加 的 标签接头 ,防止标签之间造成污染
19、; b) 标签接头连接 后采用磁珠法或相关文库纯化试剂对扩增产物进行纯化处理 ; c)文库 质量控 制宜采用 荧光定 量方法 检验文库 浓度 , 可 选择 采 用 生物分析仪 检测文库 片段大小 ; d)符合质 量要求的文库进行均一化和混合, 均一化浓度以测序试剂 和测序 仪器要求为 准。 GA/T XXXXXXXX 6 8.5 模板制备 测序 文库 均一化、 混合 后, 宜采用 桥式 PCR、 乳化 PCR 或 DNA 纳米球扩增 等方法 进行信号放大处 理,使信号 强度 满足 测序识别 要求 。 材料和方法以模板制备试 剂说明书为准。 8.6 测序 测序反应即 加入底物核苷酸,在测序酶的作
20、 用下使底物核苷酸与测序文库中 的待测样 品 进行结 合,同时收集该过程中产生的信号,包括但不限于荧光信号、电信号或离子信号。 材料和方法以 二代 测序 试剂说明书为准 ,其它注意事项包括: a) 实验室应根据采用的检测试剂和二代测序平台摸索确定合适的文库上机浓度 ; b)根据检测的法庭科学遗传标记特性选择合适的读长 以 保 证测 序结 果的准确性和 完整性 ; c) 根 据 不同测序平台的特性 和检测样本量 确定合适 的测序覆 盖度 和 深度 以保证测序结果的准确 性 ,并进行充分验 证 。 9 数据 分析 9.1 通则 9.1.1 软件的分析流程 开放 应选用公开数 据分析流程 、 算法
21、和 数据分析参数 的生物信息学软件,进行 法庭科 学遗传标记二代 测序数据分析 ,确保二代测序实验结果准确、可溯 源 。 9.1.2 测序原始数据质 量控制 9.1.2.1 原 始 数据质量评估 宜评 估的 指标包括 碱基质量 、 序列 质量、 序列 长度、 N( 未测到或不确定碱基)的比例 、接头含 量等 。 9.1.2.2 数据过滤 针对评估结果过滤去除原始数据中 的 接头、低质 量或未检出 的碱基及序列 ,宜过滤的内容包括 (以 下过滤参数应根据检测不同的法庭科学遗传标记或使用不同的二代测序平台进行调 整) : a)检测接头序列并进行剪切; b) 去除含 一定数目 N碱基的序列; c)
22、设定低质量碱基 的判定阈值 ,去除 含一定比例以上 低质量碱基 的 序列 ; d)设定滑动窗口 , 去除序列平均碱基值 低于 阈值 的 序 列 ; e)去除剪切后 低于一定 长 度 的序列; f) 其他 经 过 验证的剪切去除序 列方式。 9.1.3 数据比对分析 采用二代测序平台推荐的商业化分析软件或者 其他适合的 分析软件 ,对过滤后的测序数据中的候 选法庭科学遗传标记进行分型。统计测序通量、测序 深度、遗传标记的等位基因覆盖度比 、有效序列 比例等测序结果质量评价指标。 9.2 STR 分型 9.2.1 二 代测序 STR 数据 分析 软件应支持将 STR 作为序列多态遗传标记进行分型,
23、即长度相同而序 列不同的 STR等位基因可被识别为不同的等位基因。 序列多态分型结果命名 应 与现 有长 度多态 命名 兼 容 , 并 具备序列唯 一性 。 9.2.2 以 GRCh38作为 比对参考序列, 以其正向序列作为 STR序列 比对依据 。 GA/T XXXXXXXX 7 9.2.3 测序读长要足 够覆盖 STR 扩增子长度, 不可通过序列拼接的方式进行 STR 分型,未测通扩增 子 的数据要舍 去。 9.2.4 STR分型可针对不同基因座设定合适 的 测序深度作为分析 阈值。 9.3 SNP 分型 9.3.1 以 GRCh38作 为比对参考序列。 9.3.2 SNP位点的 测序深度
24、 需 大于等于 100。 9.3.3 采 用 dbSNP中 ID号码( rs#) 的方式进行 SNP位点命名 。 9.4 InDel 分型 9.4.1 以 GRCh38作为 比对 参考序列。 9.4.2 InDel位点的测序深度需 大于等于 100。 9.4.3 插入等位基因以 序列信息标示 ,缺失等位基因用“ -”进行 标示。 9.5 线粒体 DNA 测序 以 人类线粒体 DNA参考序列 ( NCBI Reference Sequence: NC_012920.1) 作 为 比对 参 考 序列,进 行序列比对、拼接 和 定位 , 标出与之不同的碱基作为特征点 , 数据 测序深度 需 大于等于
25、 100。 10 遗 传参数计算 10.1 将 STR作为序列多 态性遗 传标 记进行 法庭科学参数和亲权指数计算 , 即长度相同而序列不同的 STR 等位基因是独 立的不同 等位 基因,所采用的人群 频率数据 应是序列多态 STR 等位基因频率统计数 据 。 10.2 在 进行法庭科 学参数 和 亲权指数 计算 过程中,应充分考虑所检遗传标记间 连锁关系 的影响 。 GA/T XXXXXXXX 8 附 录 A ( 资料 性附录) 法庭科学 DNA 二代测序检验记录表 法庭科学 DNA二代测序检验记录表 见表 A.1 表 A.6。 表 A.1 扩增模板 DNA定量结果登记表 DNA 实验室 控
26、制编号: 扩增模板 DNA 定 量结果登 记表 操作人: 扩增模板 DNA 定量时间:自 年 月 日 时 分 至 年 月 日 时 分( 24 小时制) 定量仪器: Qubit 荧光 计 实时荧光定量 PCR 仪 其他 仪器编号: 定量试剂: 试剂一 试剂二 其他 试剂 LOT 号 : 样本编号 浓度 样本编号 浓度 样本编号 浓度 浓度单位默认为 ng/L,若使用其他浓度单位需填写在表格中。 第 页 / 共 页 GA/T XXXXXXXX 9 表 A.2 扩增作业单 DNA 实验室 控制编号: DNA 检 验记录 扩 增作业单 操作人: 扩增时间: 自 年 月 日 时 分 至 年 月 日 时
27、分( 24 小时制) 扩增试剂: 试剂一 试剂二 试剂三 试剂四 其他: 试剂 LOT 号: 扩增仪器编号: 扩增 体系: L 循环 数: 序 号 位 置 样本 编号 模 板 序 号 位 置 样本 编号 模 板 序 号 位 置 样本 编号 模 板 序 号 位 置 样本 编号 模 板 1 A1 25 A4 49 A7 73 A10 2 B1 26 B4 50 B7 74 B10 3 C1 27 C4 51 C7 75 C10 4 D1 28 D4 52 D7 76 D10 5 E1 29 E4 53 E7 77 E10 6 F1 30 F4 54 F7 78 F10 7 G1 31 G4 55
28、G7 79 G10 8 H1 32 H4 56 H7 80 H10 9 A2 33 A5 57 A8 81 A11 10 B2 34 B5 58 B8 82 B11 11 C2 35 C5 59 C8 83 C11 12 D2 36 D5 60 D8 84 D11 13 E2 37 E5 61 E8 85 E11 14 F2 38 F5 62 F8 86 F11 15 G2 39 G5 63 G8 87 G11 16 H2 40 H5 64 H8 88 H11 17 A3 41 A6 65 A9 89 A12 18 B3 42 B6 66 B9 90 B12 19 C3 43 C6 67 C9
29、 91 C12 20 D3 44 D6 68 D9 92 D12 21 E3 45 E6 69 E9 93 E12 22 F3 46 F6 70 F9 94 F12 23 G3 47 G6 71 G9 95 G12 24 H3 48 H6 72 H9 96 H12 模板一栏单位默认为 ng,若使用其他单位需填写在表格中。 第 页 / 共 页 GA/T XXXXXXXX 10 表 A.3 文库构建作业单 DNA 实验室 控制编号: DNA 检验记录 文库 构建 作业单( 测序 平台) 操作人: 建库时间: 自 年 月 日 时 分 至 年 月 日 时 分( 24 小时制) 建库方法: 手动 仪器编
30、号: 建库试剂: 建库 试剂一 建库 试 剂二 其他 试剂 LOT 号: 标签试剂: 标签试剂一 其他 试剂 LOT 号: 纯化试剂: 纯化试剂一 其他 试剂 LOT 号: 样本编号 标签号 样 本 编号 标签号 样本编号 标签号 第 页 / 共 页 GA/T XXXXXXXX 11 表 A.4 文库定量结果登记表 DNA 实验室 控制编号: 文 库定 量结果登记表 操作 人: 文库 定量时间:自 年 月 日 时 分 至 年 月 日 时 分( 24 小时制) 定量仪器: Qubit 荧光 计 实时荧光定量 PCR 仪 其他 仪器编号: 定量试剂: 试剂一 试剂 二 其他 试剂 LOT 号: 样
31、本编号 浓度 样本编号 浓度 样本编号 浓度 浓度单位默认为 ng/L,若使用其他浓度单位需填写在表格中。 第 页 / 共 页 GA/T XXXXXXXX 12 表 A.5 测序作业单 DNA 实 验室 控制编号: DNA 检 验记录 测序作业单 *( 测序平台) 操作人: 模板制备时间: 自 年 月 日 时 分 至 年 月 日 时 分( 24 小时制) 测序芯片: 芯片一 芯片二 芯片三 芯片四 芯片五 芯片编号: 模板制备方法: 手动 工作站 仪器编号: 模版制备 试剂 : 试剂一 试剂 LOT 号 : 试剂二 试剂 LOT 号 : 测序时间: 自 年 月 日 时 分 至 年 月 日 时
32、分( 24 小时制) 测序仪器: 仪器一 仪器二 仪器三 仪器编号: 测序试剂: 试剂一 试剂 LOT 号 : 试 剂二 试剂 LOT 号 : 试剂三 试剂 LOT 号 : 测序参数: DNA 文库 上样浓度 : Flows: 测序 读长 样本编号 标签号 样本编号 标签号 样本编号 标 签号 第 页 / 共 页 * 若模版制备由测序仪器内部完成,则不填相应内容。 GA/T XXXXXXXX 13 表 A.6 DNA 分 型记录 单 DNA 实验室 控制编号: DNA 分型记录 序列多态 STR 分型研判 记录单 样本编 号 : 未获得 STR 分型: ; 获得混合 STR 分型 : ; 获得
33、单一 STR 分型: ; 研判依据 : 基因座 分型 序列信息 注: 1、 “研判依据 ”栏内填写分型 所依据的原 始测序结果 报告 ,以文件名表示。 2、本记录所示混合 STR分型数 据系检验人员的初步 研判,最 终分 型以原始测序结果报告为准。 签名 /日期: _ _ 第 页 / 共 页 GA/T XXXXXXXX 14 DNA 实 验室 控制编号: DNA 分型记录 SNP 分型 *研判记录单 样本编 号: 未获得 SNP 分型: ; 无法明确判读 SNP 分型 : ; 获得单一 SNP 分型: ; 研判依据 : 位点序 号 分型 备注 位点序号 分型 备注 位点序号 分型 备注 注:
34、1、 “研判依据 ”栏内填写分型所依据的原始测序结果报告,以文件名表示。 2、 本记录所示无法明确判读 SNP分型数据系检验人员的初步研 判,最终分型以原始测序结果 报告 为准 。 签 名 /日期: _ _ 第 页 / 共 页 * InDel 分型研判记录单 可参照 该表 格式 。 GA/T XXXXXXXX 15 DNA 实验室 控制编号: DNA 分型记录 线粒体 DNA 测序结果记录单 案件 受理 号: 特征点 样 本编号 注 : 1、参考序列为修订的剑桥参考序列( revised Cambridge reference sequence, rCRS); 2、 “DEL”表 示该 位点相对 rCRS缺失;空白表示某样本不存在特征点; 3、无法明确 判读的核苷酸多态性点描述为:信号较强的碱基 /信号较弱的碱基。 签名 /日期 : _ _ 第 页 / 共 页 _