1、 ICS 03.080.99 CCS A 12 23 黑龙江省地方标准 DB23/T 34792023 人工智能数据标注人员培训服务规范 2023-07-05 发布2023-08-04 实施黑龙江省市场监督管理局发 布 DB23/T 34792023 I 目次 前言.II 1 范围.1 2 规范性引用文件.1 3 术语和定义.1 4 培训机构.1 基本要求.1 4.1 培训场地.1 4.2 设施设备.2 4.3 人员.2 4.4 培训教材.2 4.5 培训服务.2 4.6 5 数据标注人员技能等级.2 6 技能要求及培训内容.3 五级/初级工.3 6.1 四级/中级工.3 6.2 三级/高级工
2、.4 6.3 二级/技师.5 6.4 一级/高级技师.5 6.5 7 培训要求.6 需求调查.6 7.1 课程开发.6 7.2 培训方案.7 7.3 招生信息发布.7 7.4 培训服务协议签订.7 7.5 培训管理.7 7.6 结业.7 7.7 档案管理.8 7.8 8 培训评价.8 评价内容.8 8.1 评价类型.8 8.2 评价方法.8 8.3 9 持续改进.8 参考文献.9 DB23/T 34792023 II 前言 本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
3、本文件由黑龙江省工业和信息化厅提出并归口。本文件起草单位:黑龙江湾云计算技术有限公司、哈尔滨市标准化研究院、哈尔滨市特种设备检验研究院、伊春市工业和信息化局中小企业服务中心、七台河职业学院、七台河市工业和信息化局、伊春市湾云云计算技术有限公司、鸡西市湾云网络科技有限公司、哈尔滨理工大学、哈尔滨湾云网络科技有限公司。本文件主要起草人:李彦宝、孟炬、张欣莹、闫明杰、张劲男、董震宇、董隽哲、杜春艳、王润玲、李洋、惠菲菲、李航、孙英浩、张洪菲、郑喜伟、赵海龙、韩柳、张铭、董超、周文婷、冷德瑞、田奇峰、王琳。DB23/T 34792023 1 人工智能数据标注人员培训服务规范 1 范围 本文件规定了人工
4、智能数据标注人员培训的术语和定义、培训机构、数据标注人员技能等级、技能要求及培训内容、培训要求、培训评价和持续改进。本文件适用于教育机构、培训机构、实训基地等对人工智能数据标注从业人员的培训。2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 172421998 投诉处理指南 GB/T 289152012 成人教育培训组织服务通则 GB/T 293592012 非正规教育与培训的学习服务质量要求 总则 3 术语和定义 下列术语和定义适
5、用于本文件。3.1 数据标注 对文本、图像、语音、视频、3D点云等原始数据进行归类、整理、纠错、转录、翻译和添加标签等操作,以生成满足机器学习训练要求的、机器可识别的数据编码。3.2 数据清洗 对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。4 培训机构 基本要求 4.1 4.1.1 取得合法办学资质,能独立承担民事责任。4.1.2 具备健全的教学与管理制度,包括培训服务管理、受训对象管理、培训讲师管理、培训档案管理、财务管理、后勤服务、应急预案等各项制度。4.1.3 具有与培训目标、培训规模相适应的专职管理人员和专(兼)职教师。4.1.4 配备培训、考
6、试、实践所需的场地及设备。4.1.5 建立培训项目日志,做好培训活动的记录并整理归档。4.1.6 编制数据标注基础知识和实践教程,组织培训及考试工作。培训场地 4.2 4.2.1 应设有考培教室、办公室、档案室等,面积满足培训项目要求,并与参训人数相适应。DB23/T 34792023 2 4.2.2 场所的照明和通风良好,远离噪声干扰,温度适宜,并符合安全、消防、卫生等相关规定。4.2.3 应在培训场所设立意见箱,并公布服务电话及电子邮箱。设施设备 4.3 4.3.1 教室、实训场地的设施设备应满足教学、实习需要。4.3.2 设施设备应有专人保管、维护、确保正常使用。人员 4.4 4.4.1
7、 职业素质 4.4.1.1 应熟悉本机构的管理规范和服务标准,熟练掌握其所从事岗位(所任职)的专业基础知识、作业规范和服务技能。4.4.1.2 应诚实守信,不违背公序良俗,具有较强的责任心和良好的职业素养。4.4.2 行为要求 4.4.2.1 按掊训协议(合同)约定的相关内容提供服务,应重承诺、守信用,不应欺骗、误导服务对象。4.4.2.2 工作时间应佩戴胸牌,着装得体,举止大方。为服务对象服务时,应保持良好的精神风貌。4.4.3 培训教师 4.4.3.1 理论培训教师应具有高等教育师资及其他相关专业资质,能胜任理论教学和技能操作教学的要求。4.4.3.2 实训培训教师应具有相关从业经历,实践
8、经验丰富,技能指导有方。4.4.3.3 师资数量应满足招生和教学规模要求,师资条件应与招生宣传内容相符合。培训教材 4.5 4.5.1 应按培训目标及培训大纲的要求选取相应的培训教材。4.5.2 宜结合人工智能数据标注行业现状和发展趋势,选取具有先进性、针对性和实用性的培训教材。培训服务 4.6 培训机构提供的培训服务,包括但不限于:服务对象委托或授权的培训项目;人工智能数据标注行业相关法律、法规和政策;人工智能数据标注行业职业道德及行为规范;专业理论知识;提升个人能力素质;提升管理能力;提升数据采集、数据标注、数据质检技能;人工智能训练师(数据标注)职业技能等级考试的培训和辅导;其他内容的培
9、训。5 数据标注人员技能等级 DB23/T 34792023 3 按人工智能训练师国家职业技能标准(2021年版)的规定,人工智能数据标注人员按技能分为五个技能等级。从低到高分别为:五级/初级工;四级/中级工;三级/高级工;二级/技师;一级/高级技师。6 技能要求及培训内容 五级/初级工 6.1 6.1.1 工作内容 业务数据采集、业务数据处理、原始数据清洗与标注、标注后数据分类与统计等。6.1.2 技能要求 五级/初级工应具备如下技能:利用设备、工具等完成原始业务数据采集;完成数据库内业务数据采集;根据数据处理要求完成业务数据整理、归类、汇总;根据标注规范和要求,完成对文本、视觉、语音的数据
10、清洗;利用分类、统计工具对标注后数据进行分类、统计。6.1.3 培训内容 五级/初级工的培训及考核内容包括但不限于:业务背景知识;数据采集工具使用知识;数据库数据采集方法;数据整理规范和方法;数据汇总规范和方法;数据清洗工具使用知识;数据标注工具使用知识;数据分类工具使用知识;数据统计工具使用知识;智能系统基础知识;智能系统使用知识。四级/中级工 6.2 6.2.1 工作内容 业务数据质量检测、数据处理方法优化、数据归类和定义、标注数据审核等。6.2.2 技能要求 DB23/T 34792023 4 四级/中级工应具备如下技能:对预处理后业务数据进行审核;结合人工智能技术要求,梳理业务数据采集
11、规范;对业务数据采集流程提出优化建议;运用工具,对杂乱数据进行分析,输出内在关联及特征;根据数据内在关联和特征进行数据归类及定义;完成对标注数据准确性和完整性审核,输出审核报告;对审核过程中发现的错误进行纠正;根据审核结果完成数据筛选。6.2.3 培训内容 四级/中级工的培训及考核内容包括但不限于:业务数据质量要求和标准;业务数据采集规范和方法;业务数据处理规范和方法;数据采集知识;数据处理知识;数据聚类工具知识;数据归纳方法;数据定义知识。三级/高级工 6.3 6.3.1 工作内容 业务流程设计、业务模块效果优化、数据处理规范制定、算法测试、智能系统监控和优化、人机交互流程设计、培训指导等。
12、6.3.2 技能要求 三级/高级工应具备如下技能:结合人工智能技术要求和业务特征,设计整套业务数据采集、处理、审核流程;结合业务知识,识别业务流程中单一模块的问题;结合人工智能技术设计业务模块优化方案并推动实现;结合人工智能技术要求和业务特征,设计数据清洗和标注流程及规范;维护日常训练集与测试集;使用测试工具对人工智能产品的使用进行测试;对测试结果进行分析,编写测试报告;运用工具,分析算法中错误案例产生的原因并进行纠正;对单一智能产品使用的数据进行全面分析,输出分析报告,提出优化需求及应用设计智能解决方案;编写初级培训讲义,对五级/初级工、四级/中级工开展技术培训;指导五级/初级工、四级/中级
13、工解决数据标注问题。6.3.3 培训内容 DB23/T 34792023 5 三级/高级工的培训及考核内容包括但不限于:业务数据相关流程设计知识;智能训练数据处理知识;智能训练数据处理工具原理和应用方法;人工智能测试工具使用方法;培训讲义编写知识;培训教学知识;实践教学方法;技术指导方法。二级/技师 6.4 6.4.1 工作内容 业务架构与流程设计、业务场景挖掘、算法测试、智能训练流程优化、智能产品应用解决方案设计、产品功能设计以及实现、培训指导等。6.4.2 技能要求 二级/技师应具备如下技能:综合业务流程及重难点,结合人工智能技术构建合理的业务框架及流程;在业务中挖掘智能系统应用的潜在机会
14、点及隐藏价值;结合人工智能技术对新业务场景提出解决方法;结合业务特征,构建算法的高质量训练集,并成为算法的核心竞争力;根据日常算法模型的训练,提出训练产品优化需求并推动实现;基于某一业务领域情况,结合多个智能产品设计新的全链路智能应用流程;推动产品功能需求实现并达成项目目标;编写培训计划;对三级/高级工及以下级别人员开展技术培训,制定业务指导方案,评估培训学习效果。6.4.3 培训内容 二级/技师的培训及考核内容包括但不限于:数据分析方法;数据运营方法;人工智能算法基础知识;算法训练方法;优化方法;业务领域知识;产品需求梳理方法;项目管理知识;培训计划编制知识;进阶培训教学知识;效果评估方法。
15、一级/高级技师 6.5 DB23/T 34792023 6 6.5.1 工作内容 业务设计、业务创新、算法测试、智能训练流程优化与产品优化、智能产品应用解决方案设计、平台化推广、培训指导等。6.5.2 技能要求 一级/高级技师应具备如下技能:根据对复杂业务场景和跨业务单元场景的深入理解,搭建业务分析框架;结合人工智能技术为所负责的业务线提出具有前瞻性的业务发展规划建议;利用人工智能技术,对现有业务流程重构,提高业务在行业领域竞争力;结合先进的人工智能技术,在业务流程中发现创新点,并整合推动业务的创新;根据对算法的前瞻性,制定智能训练的整体产品能力矩阵及整体迭代优化方案;制定训练集以及测试集的标
16、准;独立统筹并推动项目进行,推动多个智能产品的一系列运营,实现项目目标;制定培训体系规划;对二级/技师及以下级别人员开展管理方法培训并进行业务指导。6.5.3 培训内容 一级/高级技师的培训及考核内容包括但不限于:业务指标定义知识;业务指标的管理;业务发展规划设计;人工智能技术相关知识;人工智能技术创新;产品运营;培训体系构建;管理培训知识;业务指导策略体系编制;人工智能训练前沿理论知识。7 培训要求 需求调查 7.1 培训前应开展专题需求调查,根据服务对象和市场需求提供相应的培训内容。课程开发 7.2 培训机构应根据培训需求分析结果及学员意见,研发或定制不同教学形式(如录播视频课程、直播课程
17、、实操课程等)的课程方案、确定课程主题、课时、课程内容、师资、教材、应用案例及参考资料等。培训课程开发内容应包括但不限于:课程设计大纲;课程教学大纲;课程课件及讲义;考评大纲;DB23/T 34792023 7 考评标准(理论知识考核及实操技能考核);考评题库。培训方案 7.3 根据培训任务要求、服务对象需求和基础水平编制培训方案,内容包括但不限于:目的与内容;对象与规模;方式与方法;实施工具与辅助手段;阶段目标任务;进度安排;师资选聘;时间与地点;考核方式。招生信息发布 7.4 符合GB/T 289152012中5.3.4的规定。培训服务协议签订 7.5 符合GB/T 293592012第7
18、章的规定。培训管理 7.6 7.6.1 培训机构应按签订的服务协议提供培训服务。7.6.2 培训机构应严格依照培训计划及教学大纲组织培训。7.6.3 培训因故变更或取消应及时通知学员及相关人员,并按协议处理相关事宜。7.6.4 培训机构应对培训全过程及从业人员进行管理与控制。7.6.5 培训机构宜为学员提供食宿,宿舍面积、床位设置应与寄宿学员规模相适应,宿舍安全、整洁、卫生。7.6.6 培训过程中,授课教师应遵守课程方案,选用合适的教学手段,合理组织教学。7.6.7 培训过程中,应注重理论知识与实践相结合,在模拟环境或实操环境下提高学员实操技能。7.6.8 培训机构应依据培训方案,针对培训内容
19、,组织学员进行考核。7.6.9 培训结束前,培训机构应组织学员就课程设置、教师教学、实践操作、设施设备、培训管理、后勤服务等内容进行满意度调查。7.6.10 培训结束后,培训机构应对本次培训的计划实施情况、教师授课反馈及学员培训内容的掌握情况进行总结。结业 7.7 7.7.1 培训结束后应对学员进行考核测试,颁发人工智能数据标注人员培训合格证书。7.7.2 培训机构对服务对象有职业技能鉴定或资格考试约定和承诺的,应按有关规定组织受训学员参加职业技能鉴定机构认证。7.7.3 应为培训合格的学员提供就业指导及咨询等服务。7.7.4 培训前已签订推荐就业协议的,应按照约定,向培训学员提供就业推荐服务
20、。DB23/T 34792023 8 档案管理 7.8 7.8.1 培训机构根据服务协议约定,应对培训过程中所产生的相关材料留存、归档。7.8.2 归档保管的资料包括课程资料、服务过程资料及考核评估资料,其中:课程资料包括:学员提交的资料、培训需求分析报告、课程研发资料及培训方案等;服务过程资料包括:服务协议、培训课程实施资料、学员培训记录、项目日志及教学记录等;考核评估资料包括:学员考评结果(含考卷)、调查问卷及相应评价报告等。8 培训评价 评价内容 8.1 建立培训质量评价机制,开展服务质量评价工作,评价内容包括但不限于:培训内容与课程安排;培训质量与效果;完成培训工作的效率;工作人员服务
21、质量;教师授课质量;满意度评价。评价类型 8.2 评价类型包括但不限于:自我评价;委托培训客户对培训效果进行评价;学员对授课教师及培训内容进行评价。评价方法 8.3 评价可采用访谈、座谈会或调查问卷等方式。9 持续改进 培训机构应定期收集、分析服务对象的意见和建议,并进行相应改进。9.1 培训机构应建立投诉处理机制,投诉处理程序应按照 GB/T 172421998 中第 6 章的规定执行。9.2 培训机构应自觉接受社会及相关部门的监督。9.3 DB23/T 34792023 9 参考文献 1 GB/T 5271.312006 信息技术词汇第31部分:人工智能机器学习 2 GB/T 352732020 信息安全技术 个人信息安全规范 3 GB/T 379642019 信息安全技术 个人信息去标识化指南 4 GB/T 38548.12020 内容资源数字化加工 5 人工智能训练师国家职业技能标准(2021年版)