GB T 18790-2002 联机手写汉字识别技术要求与测试规程.pdf
《GB T 18790-2002 联机手写汉字识别技术要求与测试规程.pdf》由会员分享,可在线阅读,更多相关《GB T 18790-2002 联机手写汉字识别技术要求与测试规程.pdf(8页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 35.240.30L 67中华人民共和国国家标准Gs/T 18790-2002联机手写汉字识别技术要求与测试规程Requirements and test procedure ofon-line handwriting Chinese ideogram recognition2002一07一18发布2002一12一01实施中华国家质人民共和国量监督检验检疫总局发布ca/T 18790-2002前言本标准规定了联机手写汉字识别系统的汉字识别技术要求、测试规程该标准的制定和实施将规范联机手写汉字识别系统的研究、开发和应用。本标准的附录A和附录B是标准的附录,附录C是提示的附录。本标准由中华
2、人民共和国信息产业部提出。本标准由中国电子技术标准化研究所归口。本标准起草单位:中国电子技术标准化研究所、北京汉王科技有限公司、清华大学电子工程系。本标准主要起草人:刘迎建、王立建、张立清、刘长松、钮兴显、王宝艾。中华人民共和国国家标准联机手写汉字识别技术要求与测试规程GB/T 18790-2002Requirements and test procedure ofon-line handwriting Chinese ideogram recognition范围1.,本标准规定了联机手写汉字识别系统的汉字识别技术要求和测试规程。1.2本标准适用于微型计算机、手持式信息处理设备和数字化电器配置
3、的联机手写汉字识别系统。2引用标准下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所有版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。GB 2312-198。信息交换用汉字编码字符集基本集GB 12345-199。信息交换用汉字编码字符集辅助集GB 13000. 1-1993信息技术通用多八位编码字符集(UCS)第1部分:体系结构(idt ISO/IEC 10646:1993)GB 18030- 2000信息技术信息交换用汉字编码字符集基本集的扩充3定义本标准采用下列定义。3.1联机手写数据采集设备on-line handwri
4、ting data capture device是指鼠标、手写板、触摸屏等具备实时地将人们书写的汉字及字符轨迹转换成坐标点序列、形成电子数据的设备。3.2联机手写汉字识别系统on-line handwriting Chinese ideogram recognition system是指使用微型计算机或具有计算能力的系统,对联机手写电子数据采集设备采集的手写电子数据进行处理与辨识,获得相应的标准内码的系统。3.3样本sample一个完整的、山联机手写电子数据采集设备采集的、符合第4章中的汉字或字符的电子数据称为一个样本。3.4样本文件sample file是指由多个样本按附录B数据格式组成的文
5、件,称为样本文件3.5样本库library of sample file多个同类型样本文件组成的文件集合称为样本库。4识别字符集的范围联机手写汉字识别系统识别的最小字符集应是GB 2312中全部汉字字符(包括偏旁部首)以及附录A中的非汉字字符。字符扩展时,联机手写汉字识别系统应识别GB 12345,或GB 18030,或GB中华人民共和国国家质f监督检验检疫总局2002-07-18批准2002-12-01实施tGB/T 18790-200213000.1字符集中的全部汉字。识别技术要求5.1识别率5.1.1对工整样本库的识别要求a)对GB 2312中所有汉字的识别率应大于9400;b)对附录A
6、中的非汉字字符的识别率应大于80%;c)若厂商声明支持GB 12345,或GB 13000. 1,或GB 1803。字符集,则以上字符集的识别率应大于850o0山对任何字符集而言,单字识别率应大于50%.5.1.2对乱笔顺样本库的识别要求对乱笔顺样本库,识别率应大于600005.2识别速度在测试软件运行的平台上,识别速度应优干1. 5 s/字。6测试规程6门标准测试样本库的建立a)由信息处理产品标准符合性检测中心分别用压力式手写板、电磁感应手写板等设备各采集由一定数量的人、在工整书写提示下自然书写的汉字样本,经整理后,建成标准测试样本库;b)标准测试样本库中包括两部分样本,其中一部分是工整书写
7、的样本,称为工整样本库;少部分是人工方式处理的、打乱了笔划顺序的工整样本,称为乱笔顺样本库。6.2由信息处理产品标准符合性检测中心提供标准测试样本文件的数据格式及结果文件格式,并提供至少一个样本文件,供参测单位调试测试程序。6.3参测单位向标准符合性测试机构提交联机手写汉字识别技术的测试软件,由信息处理产品标准符合性检测中心测试.并提供测试结果。非微型计算机平台上的参测单位,除测试软件外,还应提供能完成测试工作的运行平台。6.4测试结果计算6.4.1识别速度识别速度测试结果按下式计算;识别速度=TIN式中:N一测试样本库中样本总数;T识别系统从开始读取测试数据至将识别结果记录到媒体上所用的时间
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 18790 2002 联机 手写 汉字 识别 技术 要求 测试 规程
