GB T 18790-2010 联机手写汉字识别系统技术要求与测试规程.pdf
《GB T 18790-2010 联机手写汉字识别系统技术要求与测试规程.pdf》由会员分享,可在线阅读,更多相关《GB T 18790-2010 联机手写汉字识别系统技术要求与测试规程.pdf(10页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 35.240.20 L 67 道昌中华人民圭七和国国家标准G/T 18790-2010 代替GB/T18790-2002 联机手写汉字识别系统技术要求与测试规程Requirements and test procedure of on-line handwriting Chinese character recognition system 2011-01-14发布2011-05-01实施数码防伪中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会发布目。吕本标准代替GB/T18790-2002(联机手写汉字识别技术要求与测试规程。本标准与GB/T18790-2002的主要差
2、别如下:一一扩大了识别字符集的范围;-一一增加了识别系统应具备的功能;删除了GB/T18790-2002的附录C。本标准的附录A和附录B是规范性附录。本标准由全国信息技术标准化技术委员会提出并归口。本标准主要起草单位:汉王科技股份有限公司、中国电子技术标准化研究所。本标准主要起草人:刘迎建、陈静、钮兴旦、王欣、李鑫梅。本标准所代替标准的历次版本发布情况为:-GB/T 18790-20020 G/T 18790-2010 I GB/T 18790-2010 1 范围联机手写汉字识别系统技术要求与测试规程本标准规定了联机手写汉字识别系统的技术要求和测试规程。本标准适用于微型计算机、手持式信息处理设
3、备等数字化设备中使用的联机手写汉字识别系统。2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB 18030一2005信息技术中文编码字符集3 术语和定义下列术语和定义适用于本标准。3. 1 联机手写数据采集设备on-Iine handwriting device 可将人们书写的汉字及字符轨迹实时转换成坐标点序列并形成电子数据的设备,如手写板、触摸屏、鼠标等。3.2 联机手
4、写汉字识别系统on-Iine handwriting Chinese character recognition system 运行于微型计算机、手持式信息处理设备等具有计算能力的系统中,可将联机手写数据采集设备采集的汉字手写数据进行处理与辨识,输出相应的汉字标准字符的软件系统。3.3 3.4 3.5 3.6 3. 7 样本sample 一个完整的、由联机手写数据采集设备采集的、符合附录B规定数据格式的数据称为一个样本。样本文件sample file 由多个样本按附录B规定的数据格式组成的文件。样本库Iibrary of sample files 多个同类型样本文件组成的文件集合。工整样本库I
5、ibrary of printed-handwriting sample 由书写者使用联机手写数据采集设备、在工整书写提示下自然书写的汉字样本组成的样本库。乱笔顺样本库Iibrary of random-stroke-order sample 以随机方式打乱了笔划顺序的汉字样本组成的样本库。1 G/T 18790-2010 3.8 自由手写体样本库Iibrary of cursive-handwriting sample 由书写者使用联机手写数据采集设备、在自由书写提示下按照自身书写习惯自然书写的汉字样本组成的样本库。3.9 平均首选识别率average accuracy of hit-in
6、1 首选正确的样本数与样本库中样本总数的比值。注:测试过程中,如识别系统对被测样本给出的首个候选字是正确结果,则该样本为首选正确的样本。3.10 平均十选识别率average acc町acyof hit-in 10 十选正确的样本数与样本库中样本总数的比值。注:测试过程中,如识别系统对被测样本给出的前10个候选字中包含正确结果,则该样本为十选正确的样本。4 技术要求4. 1 识别字符集的范围4. 1. 1 汉字字符联机手写识别系统识别的汉字字符集应为GB18030-2005中的全部汉字,或至少包括GB 180302005强制性部分中的全部汉字。4. 1. 2 非汉字字符联机手写汉字识别系统识别
7、的非汉字字符应包括数字、拉丁字母、西文标点和符号、中文标点和符号,以及手写控制符,见附录Ao4.2 识别率4.2.1 对工整样本库的识别要求a) 对GB18030一2005中强制性部分汉字的平均首选识别率应大于95%;b) 对附录A中的非汉字字符的平均首选识别率应大于80%; c) 对支持GB18030-2005中的全部汉字字符的产品,平均首选识别率应大于85%。4.2.2 自由手写体库识别要求对自由手写体样本库的平均十选识别率应大于90%。4.2.3 对乱笔顺样本库的识别要求对乱笔顺样本库的平均十选识别率应大于80%。4.3 功能要求4.3.1 候选字联机手写识别系统应具备候选宇功能。4.3
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 18790 2010 联机 手写 汉字 识别 系统 技术 要求 测试 规程
