GA T 1694-2020 序列多态STR等位基因命名规则.pdf
《GA T 1694-2020 序列多态STR等位基因命名规则.pdf》由会员分享,可在线阅读,更多相关《GA T 1694-2020 序列多态STR等位基因命名规则.pdf(18页珍藏版)》请在麦多课文档分享上搜索。
1、 ICS 13.310 A 92 中 华 人 民 共 和 国 公 共 安 全 行 业 标 准 GA GA/T XXXX XXXX 序列多态 STR 等位基因命名规 则 Nomenclature for sequence-based STR alleles 2020-08-01 发布 2021-01-01 实施 中华 人民共和国公安部 发 布 GA/T XXXX XXXX 目 次 前 言 . I 引 言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 缩略语 . 2 5 命名原则 . 2 6 命名规则 . 3 附 录 A( 规范性附录) 法 庭科学 STR 基
2、因座序列信息 . 6 参 考 文 献 . 14 GA/T XXXX XXXX I 前 言 本标准按照 GB/T 1.1 2009 给出的规则起草。 请注意本文件的某些内容可能涉及专利 。 本文件的发布机构不承担识 别 这些专利的责任。 本标准由全国刑事技术标准化技术委员会 法医检验 分技术委员会( SAC/TC 179/SC 6) 提出 并 归口。 本标准起草单位: 公 安 部物证鉴定中心 、 四川大学 、 广州市公安局 、 辽宁省公安厅 、 北京市公安局 、 北京爱普益生物科技有限公司 。 本标准主要起草人: 季安全 、 叶健 、 王乐 、 康克莱 、 王正 、 刘超 、 刘锋 、 焦章平
3、、 张驰 、 周骋 。 GA/T XXXX XXXX II 引 言 STR遗传标记 广泛应用于 法 庭 科 学 、 医疗 诊断 以及 人类学研究 。本 标准面向 STR的应用需求,制订统 一的序列多态 STR等位基因命名规则, 提高 STR的应用价值。 GA/T XXXX XXXX 1 序列多态 STR 等位基因命名规则 1 范围 本标准规定了人类序列多态 STR等位基因命名规则。 本标准 适用于 所有从事 STR测序的 DNA实验室和产品制造商 。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件 , 仅 注日期的版本适用于本文 件。凡是不注日期的引用文件,其最
4、新版本(包括所有的修改单 )适用于本 文件 。 GB/T 37226 2018 法庭科学人类荧光标记 STR复合扩增检测试剂质量基本要求 GA/T 383 2014 法庭科学 DNA实 验室检验规范 3 术语和定义 下列 术语和定义适用于本文件。 3.1 基因座 locus 染色体上基因所占的位置或基因组 DNA 中的一段 。 GB/T 37226 2018,定义 2.2 3.2 等位基因 allele 位于一对 同源染色 体的相同位置上控制 同一 性状的不同形式的基因 。 3.3 基因型 genotype 个体一个或多个基因座上等位基因的组合,是生物体可见 性状的实际基因组成。 3.4 短串
5、联重复序列 short tandem repeat 一类广泛存在于真核生物基因组中的 DNA 串联重复序列。 其 重复单位 通常 由 2 6 个碱基构成, 重复次数通常在 5 60 次 。 3.5 单核苷酸多 态性 single nucleotide polymorphism 在 人类基因组范围内,任何单碱基突变使特异核苷酸位置上出现两种或 两种以上碱基,其中最少 的一种在群体中的频率不少于 1%, 所 形成 的 多态 性 遗传 标记 。 GA/T XXXX XXXX 2 3.6 长度多态性 length polymorphism 同一基因座上,各等 位基因之 间的 DNA 长度 差异构成的多
6、态性。 3.7 序列 多态 性 sequence polymorphism 同一基因座上,因 不同个体 DNA 序 列碱 基差异构成的多态性。 3.8 重复区序列 repeat region sequence STR 中重复单位 串联 组成 的部分, 一般 从第一个重复单位的 5端, 至最后一个重复单位的 3端的 序列。 3.9 侧翼序列 flanking sequence STR 重复区 序列两侧的 DNA 序列。 3.10 重复 单位 repeat unit STR 重复区 序列中 连续 反复出现的 DNA 序列 。 3.11 重复 结构 repeat structure STR 重复区
7、序列中重复 单位 的 组成形式 。 4 缩略语 下 列 缩 略语适 用于本文件。 DNA:脱氧核糖核酸( Deoxyribonucleic Acid) SNP:单核苷酸多态性( Single Nucleotide Polymorphism) STR:短串联 重复序列( Short Tandem Repeat) 5 命名 原则 5.1 以 GRCh38 作 为 比对 参考 序列,以其正向序列作为 STR 序列比对依据,进行序列比对、定 义 重复 结构 、定位 SNP。 5.2 定 义 STR 重复区的起始位置、终止位置和 重复 结构 见 附 录 A, 起始和终止位置是以参考序列描 述的 ,不因碱
8、基插入或缺 失而 改变。 5.3 命名规则 应具备基 因座可拓展性。 5.4 若 发现新的 STR 等位基 因,应可依据本命名规则 进行系统性唯一命名。 5.5 充分利 用 STR 序列 多态信息 。 5.6 与 国际法医遗传 学会 推荐 的 长度 多 态 STR命 名 指南 兼容 。 GA/T XXXX XXXX 3 6 命名 规则 6.1 命名通式 按照以下通式结构进行命名, 命名 细则 按 照 6.2 的 规定 执行。 ( / / ) : 重复区序列中 非重复单位的碱基变异信息 侧 翼 序列的碱基变异信息 重复区序列信息 等位基因的长度多态分型 , 用 阿拉伯数字 表示 6.2 命名细则
9、及示例 6.2.1 重复 结构 中仅包含单一重复 单位 的基因座, 用重复 单位 数目命名该等位基因。 示 例 : TPOX 基因座 重复 结构 为 AATGa, 该 基 因座 某 等位基因 重复区 序列为 AATG8, 侧翼序列与参 考 序列完全 相同, 则该等位基因命名为 8。 6.2.2 重复 结构 中包含 N( N1) 个重复 单位 的基因座,等位基因命名为: 重复 单位 总数目 (第一个 重复 单位 数目 /第二个重复 单位 数目 / /第 N 个重复 单位 数目 )。 示 例 1: D2S1338 基因座重复 结构 为 GGAAaGGCAb, 该基因座 某等位基因 重复区 序 列
10、为 GGAA6GGCA11, 侧 翼序列与参 考 序列完全相同, 则该等位基因命名为 17(6/11)。 示 例 2: D12S391 基因座重复 结构 为 AGATaAGACbAGATc,该基因座某等位基因 重复区 序列 AGAT11AGAC7, 侧翼序列与参 考 序列完全相同,则该等位基因命名为 18(11/7/0)。 示 例 3: D21S11 基因座 重复 结构 为 TCTAaTCTGbTCTAcTATCTAdTCATCTAeTCCATATCTAf, 该基因座 某 等位基因 重复区 序列为 TCTA6TCTG5TCTA3TATCTA3TCATCTA2TCCATATCTA7, 侧翼序列与
11、参 考 序列完全 相同, 则该等位基因命名为 26(6/5/3/3/2/7)。 6.2.3 当等位基因的 重复区 序列 中的重复 单位 存在插入序列时 , 将该插入序列以大写英文字母形式 插入等位基因名称的相应位置, 并 以“ +” 连接 该插 入序列和前后序列 。 在确定插 入的序列 和位置时, 应依次优先考 虑插入序列的 碱基 个数最少和 插入位置 最 靠近 序列 5端 的情况 。 示 例 1: TH01 基因座重复 结构 为 AATGa, 该基因座 某等位基因 重复区 序列为 AATG6ATGAATG3, 侧翼序列与 参 考 序列完全相同, 则该等位基因命名为 9.3(6+ATG+3)。
12、 示 例 2: D6S1043 基因座重复 结构 为 ATCTa, 该基 因座 某等位基因 重复区 序列为 ATCT5ATGTATCT10, 侧翼序 列与参 考 序列完全相同, 则该等位基因命名为 16(5+ATGT+10)。 示 例 3 : VWA 基 因 座 重 复 结构 为 TAGAaCAGAbTAGA , 该 基 因 座 某 等 位 基 因 重复区 序列为 TAGA3TGGATAGA3CAGA4TAGACAGATAGA , 侧翼序列与参 考 序 列 完 全相 同, 则 该 等 位 基 因 命名为 14(3+TGGA+3/4+TAGA+1)。 ( 该序列可能的序列插入 方式 如图 1 所
13、示, 根据上述优先规则, 确定 方式 一 作 为 唯一 序列 插入方式而进行相应命 名 ) 图 1 VWA 基因座 序列插入 方式 示意图(粗体标示的序列即 不同方式 插入序列) GA/T XXXX XXXX 4 6.2.4 当 等位基因的侧翼序列中存在 碱基替换 、插入 、 缺 失 时, 将侧翼序列中的碱基替换、插入、 缺 失信息增加体现在 重复区 序列信息 之后 , 中括号“ ”内 。以 重复区 序列为基准定义碱基 替换、插 入、缺失位 置 ; 以“ -”和“ +”分别表示“上游”和“下游” ; 以“ s”表示“替换”, 并紧 接替 换后的 碱基(序列); 以“ i”表示“插入”, 并紧接
14、 插入 的碱基(序列) ,同时以 连接号 “ ”连接插入的前后 位置,并以 下划线 “ ”标示 ; 以“ d”表示 “缺失 ” 。 当 出 现连续的碱基替换、插入、缺失时,以 “ ”连接碱基替换、插入、缺失的起始和终止位置 ,并以 下划线 “ ”标示位置范围 。当侧翼序列 中多处出现碱基 替换、插入、缺失时,按照“ 上游在下游之 前,位置数值 小的在位置数值大的 之前” 规则依次排列 , 中间用“ /”相连。 示 例 1: TPOX 基因座重复 结 构 为 AATGa, 该基因座 某等位基因 重复区 序列 为 AATG8, 侧翼序列 下游第 15 个碱 基( rs576104845, 参考序列
15、为 C) 替换 为 T, 则该等位基因命名为 8+15sT。 示 例 2: D13S317 基因座重复 结构 为 TATCa, 该 基 因座 某等位基因 重复区 序列 为 TATC8,侧翼序列下游第 1 个碱 基( rs9546005, 参考序列为 A) 替换 为 T, 则 侧翼序列下游起始 4 个碱基与 重 复 单位 同为 TATC, 该等位基因命名为 8+1sT。 示 例 3: Penta D 基因座重复 结构 为 AAAGAa, 该基因座 某等位基因 重复区 序 列 为 AAAGA12,侧翼序列下游第 4 个碱基( rs186259515, 参考序列 为 A) 替换 为 G, 则 侧翼序
16、列下游起始 5 个碱基与 重复单位 同为 AAAGA, 该等位 基因命名为 12+4sG。 示例 4: DYS626 基因座重复 结 构 为 AAAGaAGAAbAGAGGAAGcAAAGd, 该基因座某等位基因 重复区 序列 为 AAAG17AGAA2AGAGGAAG3AAAG3, 侧翼序列 下 游第 39 个碱基 与 第 40 个碱基 之间 插入 4 个碱基 ( AGAA) , 该等位基因命名为 26+3940iAGAA。 示 例 5: Penta D 基因座重复 结构 为 AAAGAa,该基因座某等位基因 重复区 序列 为 AAAGA5,侧翼序列上游第 16 个碱基到第 4 个碱基(参考
17、序列为 AAGAAAGAAAAAA)共 13 个碱基发生缺失,该等位基因命名为 5-164d。 示 例 6: Penta D 基因座重复 结构 为 AAAGAa,该基因座某等位基因 重复区 序列 为 AAAGA12,侧翼序列下游第 14 个碱基到第 20 个碱基 (参考序列 为 AAAAAAA)区 段内 1 个碱 基发生缺失 (该序列为虚构示例 ) ,该等位基因命名 为 12+14d。 6.2.5 当插入序列 位于 重 复 区 序列与侧翼序列之间时,规 定该插入序列计入重复区, 按 照 6.2.3 进 行命名。 示 例 1: D7S820 基因座重复 结构 为 TATCa, 该基因座 某等位基
18、因 重复区 序列 为 TATC9,且在 重复区 序列与上游 侧翼序列之间存 在单碱基 A 插 入, 则将该插入计入重复区 序列 , 该等位基因 命名为 9.1(A+9)。 示 例 2: D2S441 基因座重复 结构 为 TCTAa,该基因座某等位基因 重复 区 序列为 TCTA10TTTATCTA2,且在 重复 区 序列与上游侧翼序列之间 存在单碱基 A 插入,则将 该插入计入重复区 序列 ,该等位 基因命名 为 13.1(A+10+TTTA+2)。 6.2.6 (本条细则所适用的序列在实际人群中出现 的 概率 很 低) 当等位基因的 重复区 序列中 非重复 单位 存在碱基替换、插入、缺失时
19、,在 碱基替换、插入、缺失发生位置的 前一个重复单位数目后以 星 号 “ *”表 示, 并在命名 通式 的 重复区序列中非重复单位的碱基变异信息 部分补充说明碱基替换、插 入、缺失处的完整序列信息,以 冒号 “ :”起始。以 下划线 “ ” 标示替换的碱基,以“ +”连接插入 碱基和 前后序列,以删除 线 标示缺失的 碱基。如果 多处序列存 在碱基替换、插入、缺失, 分别在相 应 位置以 “ *”表示,并 在命名 通式 的 重复区序列中非重复单位的碱基变异信息 部分依次补充说明 ,中 间用 逗号 “ ,”相连 。 如果 以上序列 的碱基 变 异 导致 重复区 序列长度变化, 则 相应调整长度多
20、态分型。 示 例 1: FGA 基因座重复 结构 为 GGAAaGGAGAAAGbAGAAAAAAGAAAc, 该基因座某等位基因 重复区 序列 为 GGAA2GGAGAAAG12AAAAAAGAAA3, 即在最后两个重复单位之间序列存在 2 个碱基的缺失,侧翼序列与参 考 序列完全相同,则该等位基因命 名为 19.2(2/12*/3):AGAAAAAA。 (该基因座的 重复区 序列中 , 非 重 复 单位序 列亦计 入长度多态分型 ) 示 例 2: D19S433 基因座重复 结构 为 CCTTaCCTACCTTbCTTTCCTTc, 该基因座某等位基因 重复区 序列为 GA/T XXXX
21、XXXX 5 CCTT14CCTACCTTTTCCTT,即第二段 非重复单位 序列存在 2 个碱基缺失, 侧翼序列与参 考 序列完全相同,则 该等 位基 因命 名为 15.2(14/1*/1):CTTT。 示 例 3: D21S11 基因座重复 结构 为 TCTAaTCTGbTCTAcTATCTAdTCATCTAeTCCATATCTAf, 该基因座 某等位基因 重复区 序列为 TCTA9TCTG12TCTA3TCATCTA2TCCATATCTA13, 即 第一段非重复单位 序列存在 2 个 碱基的缺失,侧翼序列与参 考 序列完全相同,则该等位基因命名为 38.2(9/12/3*/0/2/13)
22、:TA。 示 例 4: D21S11 基因座重复 结构 为 TCTAaTCTGbTCTAcTATCTAdTCATCTAeTCCATATCTAf, 该基因座 某等位基因 重复区 序列为 TCTA6TCTG5TCTA3TATCTA3TCATCTA2TCCATTTCTA7(该 序 列 为虚构示 例) , 即 在第三段 非重复单位 序列存在碱基替换 ,侧翼序列与参 考 序列完全相同,则该等 位基因命名为 26(6/5/3/3/2*/7):TCCAT T。 示 例 5: D21S11 基因座重复 结构 为 TCTAaTCTGbTCTAcTATCTAdTCATCTAeTCCATATCTAf, 该基因座 某
23、等位基因 重复区 序列为 TCTA6TCTG5TCTA3ATATCTA3TCATCTA2TCCATTTCTA7(该序列为 虚构示例) , 即 在第一 段 非重复单位 序列存在 单 碱基插入,第三段 非重复单位 序 列 存在 碱基替换,侧翼序列与参 考 序列 完全相同,则 该等位 基因命名为 26.1(6/5/3*/3/2*/7):A+TA,TCCATT。 GA/T XXXX XXXX 6 附 录 A ( 规范 性附录) 法庭科学 STR 基因座序列信息 法庭科学 STR基因座序列信息 见表 A.1。 表 A.1 法庭科学 STR基因座序 列信息 序号 基因座 染色体 编号 GRCh38 染色体
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GA 1694-2020 序列多态STR等位基因命名规则 1694 2020 序列 STR 等位基因 命名 规则
