SJ Z 9079-1987 光学字符识别打印规范.pdf
《SJ Z 9079-1987 光学字符识别打印规范.pdf》由会员分享,可在线阅读,更多相关《SJ Z 9079-1987 光学字符识别打印规范.pdf(51页珍藏版)》请在麦多课文档分享上搜索。
1、中华人民共和国电工子业推荐标光学字符识到打印规范Prlnting 5pecifications for oPtical chl racter recoqnition o 5 制定本标准的目的纸和打印的工业标字符识别(OCR)系统以及,并帮助在这类系统中加以贯彻和使用。5JjZ 9079 87 150 1831 1980 飞是文件互换所用的本标准规寇了有关识别和测量方法,制定了这些参数的规范并给出了使用它们的指南。0.1 标准说明打印系统定义为一种单斗的设备,包括打印机、打印纸和色带后者只有在打印过程中才需要。产生用于OCR的打印材料的打印系统,称作OCR打印系统。本标准的涵义适用于OCR打印材
2、料,而不涉及打印系统、字体(OCRA、OCR B)以及特殊应用。对打印图象的尺寸和光学特性给出了三个质量等级。每个参数的公差极限都有规定。这些极限值至少都应达到,并且所有参数都应保持在极限以内。如呆这些参数当中某些参数发生统计性的变化,偏离规寇的极限,为减少这些变化的数量和等级,可采用特别的预防措施,诸如精选OCR打印系统的元器件,较频繁的维护打印机,降低打印速度,以及缩短色带的使用期限等。如呆任光学字符识别系统的性能发生统计性的变化,并且如果在不超过公差极限的情况下,去生字符被拒认或识错,同样为减少这些变化的数量和等级,可采用特别的预防措施,诸如较频繁的维护识别系统等。0.2 标准的使用本标
3、准给出了在应用。CR中所使用的测量方法以及各种。由于打印和识别系统两者所引起的统计性质的偏差,而不能远续、完全地达到这些数值,则可能去生字符的拒认和识错。拒认和识错所允许的数量取决于OCR应用的目的,并且应以统计项目的形式,在用户、打印系统供方和识别系统供方之间协商队。在打印系统的保证书中,打印系统的生产方有权规定打印系统的维护周期和所采用的易耗品如打印纸和包带。在识别系统的保证书中,识别系统的供货方有权规定环境条件温度、温度、照明度、机械振动和电磁干扰的最大数值等),并制定读出器的维护等级。依靠特性检验,统计抽样方案可用来检查这些保证书是否被遵守,如果这些方案是量控制中通常使用的那些方案相关
4、的,一且抽样方案被确定,样品的尺寸即受试字符或文本的数量就由方案规定了。中华人民共和国电子工业部198711一27批准 1 SJ/Z 9079 87 考虑到对打印系统进行检测,本标准给出了被测打印材料的有关参数和测量方怯。当对识别系统进行检验时,只允许使用符合本标准规定指标的打印材料,或者按照协议,也可以使用通过的有代表性的试样。在后-种情况,应必需按照本标准来评价拒认0.3 附录附录不是本标准的组成部分,只是给出了附加资料。1 适用范围本标准包括OCR用纸和打印材料的基本定义、测试要求、规范和建议。本标准适用于OCR媒体的打印文件包括毛个主要参数,即$O. 用纸的光学性能zb. 生成OCR字
5、符的油墨的光学与形状性能,C. 关于OCR字符在纸面上排列的基本3町、。每个区域与OCR有关的主要因素都已指出,给出了这些项目的意义,并确立了量的基础。规定了适用于所有OCR材料的基本规范,并且制寇了具体贯彻于某一个OCR系统议。2 有关150216 书写纸和打印资料的某些种类一-裁切尺寸-A和B系列。1501073/1 (光学识别字母数字字符集-一第一部分:OCR A字符集,打印固的形状与尺寸。1501073/2 (光学识别字母数字字符集一一第二部分:OCR B字符集,打印形状的图象与尺寸。1502471(纸和纸板一一不透明庭的测定纸底衬一一漫反射法。CIE出版物15(E1.3. 1) 19
6、71一一比色试验一一政府推荐。5光3.1 概述本章规定了与OCR应用范围有关的光谱频带。对光谱频带必需乍规定是因为字符读出机工作在特意的光谱区域内,并且考虑到用纸和油墨的特性随波长而变化。3.2 光谱频带本条中给出的-组频带被规定为用纸和打印图象规范的基准频带。这一组光谱频带的使用和测量程序在纸的反射系数、纸的不透明庭和PC5测量等条中作了规定。 2 SJ/Z 9079 87 表1 带峰徨辛苦宽nm nm 50份水平B425 425士550或低于B460 460士560或低于飞B490 490:于560或低于-.一-一一一B530 530士560或低于8570 570士10100或低于B620
7、 020士10100或低于-一一一一一-B680 680士10120或低于一一一B900 900士10400或低于-一一一一带B42S.-.B900表示整套测试仪器先源、泼、旅器、检波器所要求的光谱响应。频带的晌应特性应是平滑的曲线,不应出现两次峰值,并且除了规定的50%的水平之外,响应曲线不应再出现较突出部分。波长短于400nm的照应能量不应届过所考虑的特别频带的5%。4 OCR用纸规范4.1 概注OCR应用领域里所使用的纸应注:臼鱼(见附录A).低先译和高不透明庭见附录A)。应iai兔有引起反射系数变化的因素诸如污物、不平整的结构、水泣痕迹,荧光添加物。在特殊的OCR应jjj领域里,纸的某
8、些机械性能(诸如扰拉强庄、多孔结构,抗强庭以及平整皮等可能非常重要。建议使用特殊纸,根据。CR系统的用户与生产厂之间的协议,规定用纸的光学和机械性能。4.2 纸的先照反射系数Ro反射系统应使用I502469规寇的反射计逃行测量,或使用经上边反射计技准的仪器量。量反射系数应该使用理想的温反射体反射系数100%),但在实践中使用硫钢(BaSO,)代替就能满足精度要求。在不能满足精应要求的情况下,应该佳用理想的提反射体逃行测量。4.2.1 斤。的寇义 3 SJjZ 9079 87 一照度反射系数R。就是利用以黑色为衬底从单页纸上得到的反射系数,亦即被测样品应以反射系数不超过0.5%的黑色为衬底。反射
9、系数是-个用百分比表达的比卒,即在同样条件下从物体上得到的辐射反射与从理想混反射体上得到的辐射反射之比。4.2.2 恻量RoRo应采用和1502471规寇相-致的方法选行测量,但要使用如下所述的适当的滤波器。4.2.3 光谱R。在425,-500nm区域内应大于60%,在500-700nm区域内应大于70%。对于白色或者浅色但必需是单颜色的纸,用下述两种滤波器选行测量完全可以满足需求。B425, CIEjY滤波器或者波峰在530-570nm之间,并且带宽不大于100nm的任-洁、披器。在对测量结果去生怀疑的情况下,应通过观测光谱选行测量,例如采用3.2条所描述的B425,-_ B680的滤波阳
10、。注z如果使用中等不透明度的统(见4.4.3.2) Ro值应分别用50惕和60%代替.4.2.4 近似纽外线当考虑近似纽外线光CIR)光谱时,R 0值在900nmat应不低于70%。注z如果使用中等不透明度的纸(见4.4.3.坊.Rot直应用60份代替.4.3 纸的污染纸面上局部夹杂外来的灰尘颗校,会相应发生无反射,因为这类局部尺寸内无反射,可能引起OCR扫描器误认为是油墨区域,因此外来污物的数量和尺寸要小是非常的。以下介绍两种评价纸巧染的方毯。方法A可以进行快速评价,而方法B适用于较具体的研究。两种方法的光照明条件均应符合CIE出版物15的规定。4.3.1 方法A网格检寇怯4.3.1.1 设
11、备应包括下列设备z网格1m x 1m C3 .28ft x 3.28ft)的框架用细金属丝分成100个方格。工作台放置用纸和摇架并能允许从0.5mC1.64ft)左右的距照明设备。照明设备应严格接近于IEC推荐的光源D65。推荐的照皮级为750,-1500Lx清洁器或真空吸尘器用来清洁,悻品表面上的污物或尘埃。 , 4 SJ/Z 9079 87 计时器能指示0.5min或1min 。计记录含有尘埃的方格数目。4.3.1.2 抽样及测试面积以总面积为6m2(64.58ft2)的试样来代表-卷或-叠纸。卷纸应在两端抽取6x 1 m (3.28ft)的试样,其宽度就是出广原纸的宽度必要时可在上述卷纸
12、中以原纸生产的次序从其外端抽样。叠纸应在足够多的纸片中从六个位置取样。4.3.1.3 测试步从最顶边展开样品。清除散蓓在纸面上的活物和尘埃。把网格放在样品上、启动计时器,在1min内按I荫序扫描所有的方格。用计数器-次性的记录下发现有尘埃粒子或颗粒的方格数目。重复测量其余的5x 1m2 (53.82ft2) ,记录下6m2中(64.58ft2)含有尘埃颗粒的方格数目。这一数目不得也过200。注s为了比较不同单元的结果,被评定的样品应在各组观测值之问进仔互换校对.由于交换测试,观察员之间的差异可能会引起超过偏差值,可以用对被试品进行比较并舍去过高或过低的数值来选择观察值.观员的比较应司期地进行.
13、4.3.2 方法B一一污物计数污物的分布应当用超过寇尺寸的表面能吸收光线的所有颗位数来确定。当20份试样中每份试样的直径大于O.lnm(0.004in)颗位的算术平均数少于每平方米(10.76ft2) 250个,以及其中19份试样的直径大于0.2mm(0.008in)的颗粒数最多为每平方米25个时,这种纸才算满足本标准的要求。试样最好等于1m2(10.76H2) ,但也可以小于1m2,但不得小于0.125rnz(1.345ft2) ,即IS0216规寇的A3尺寸。这些纸应当是相互无关的,并且对所有被测纸型具有统计的代表性。4.4 纸的不透明皮纸的不透明度应使用IS02469所规定的反射计选行测
14、量,或者使用被上述反射计选行校准过的仪器选行侧且。4.4.1 纸的不透明皮定义纸的不透明度纸的背景是个用百分比表达的比值,即以黑色为背景的单页纸的光照反射系数Ro与同纸样品的固有光照反射系数R之比。(该定义与IS02471相一致。4.4.2 纸不透明度的测量纸的不透明度应使用IS02471描述的方法选行测量。应使用与基本仪器的光学特性相一致的滤波器,所有的晌应特性与3.2条所描述的光谱特性相符。4.4.3 不透明度的级别 5 5J/Z 9079 87 4.4.3.1 高不透明度纸高不透明度纸,其不透明度应大于85%。4.4.3.2 中不透明度纸中不透明皮纸,其不透明度应大于10%但低于85%。
15、4.5 用纸反射系数的偏差反射系数的测量是用很小的光阑在纸表面的许多位置上完成的,因而所得的会有偏差。这种偏差不得超过给寇的极限。由于反射系数的统计性质,用纸反射系数的偏差极限规定以O.2mmCO.008in)直径的光阑测量:所得的允诗偏差系统为依归。用纸反射系数的偏差规定有两个等级。对于高不透明度的纸s标准偏差1&0内1 i咱水平脚线字体AI二二二:?工工-.芒丰工-;w! 一 图5切边极限线SJjZ 9079 87 因7b带切边极限线的罔字符调整 12 长方形的尺寸如表4所示,I喝字体和尺寸大小不同而异。带切边极限线的样板举例切边量tj;:COL最小COL周7a不带切边极15良线的字符调整
16、国6-ili!l 一一 ill-SJjZ 9079 87 表4 高宽字体尺寸 mm 1n mm 1n A.B 2.40 0.094 1. 40 0.055 A.B E 3.20 0.126 1. 52 0.060 人N 3.80 O. 150 2.04 0.080 B N 3.60 0.142 2.10 0.083 注s上述对切边极限线所规定的长方形,对于最小COL字符不应有切边.长方形的水平线的位置应该对准字体A字符的垂直中心线,并且对准字体B宇符的垂直基准线。长方形的垂直位置由长方形的基准线与字符水平基准线之间的距离dv规定(见图5)。距离dv的尺寸如表5所示。表5距离dv字体尺寸mm 1
17、n 0.00 0.00 A E 0.00 0.00 N 0.00 0.00 0.13 0.005 B E 0.18 0.008 N 0.20 0.008 在测量样板中,字符的切边极限只规定最大COL的内边,如图6所示。对于那些受切边影响的笔划,对切边中心线的规定如下z切边中心线是在切边极限与不超出最小COL内部线之间画出的一条所有圆心的几何轨迹。在切边极限线与样板笔划单元最小COL的交点上,该切边中心线必须与样板中心线相吻合。5.4 参数测量 13 5J/Z 9079 87 5.4.1 为使用机器识别打印图象,所有部分的打印对比信号CPCS)应足够高,即应该。为了从背景中辨别出图象,必需有很高
18、的打印对比信号。为使读出能获最佳的可靠性能,字符的主要部分应具有较高的PCS值,应高于规范所允许的任特小面积部分最小值。随打印质量不均句以及读出字符的增多,会导敦降低诙出可靠性。5.4.2 测量;方法本标准规寇有三种测量方法z目测站,仪表机械法,计算机辅助站。这三种方法按顺序排列,后种方法比前一种更加完善精益求精。目拥IJr.去旨在大面积应用中使用,对字符进行快速和简略地检查。用目测怯不以下所规寇的所有参数。仪表机械法需要有反射计,这种仪器能测量打印对比度。实践中使用第二种方法能获得满意的结果,但需要寇的测试时间。计算机辅助法要求有高分辨率的扫描装置,以及为了运算各种测量值和参数值需要有专门的
19、程序和计算机。采用计算机测量的结果可靠性能高,当然也要求A寇的时间。经过寇努力,使用目测法、仪表机械法和计算机辅助法之间,可以获得接近一敦的测量结果。实际上采用不同的测量方法,相互间所得的结果不可能总是一a致,当选行时总会发生某些差异。在两种测量方法所得结果去生矛盾的情况下,应相信较完的测量;技术。打印区域Z中列出的要求和测量数值,只有采用计算机辅助法。5.4.3 各种参数的般寇义以下给出的打印图象各种参数的般义是针对般测量项目给出的。比较准确的寇义应根据每种测量方法连同测试捍序说明加以规寇。应当指出,用目测法不能测量以下PCS 字符内部PCSPCSmax PCSmin CVR 5.4.3.1
20、 打印对比度z字符反射系数与打印字符用纸的反射系数之差。5.4.3.2 打印对比信号CPCS):这是个比值,即打印对比度除以打印有字符的纸面的反射系5.4.3.3 最佳配合z字符上面COL样板的位置使字符尽可能多地充满最小COL,同时尽可能少地;m出最大COL。5.4.3.4 字符内部打印对比信号=沿中心线测量的PCS值。5.4.3.5 PCSmau沿中心线字符最黑部分的增益。5.4.3.6 PCSmirk沿中心线字符最亮部分的增益。 14 SJ/Z 9079 87 5.4.3.7 字符内部对比度变化率(CVR): PCSmax除以PCSmin之比闹。5.4.3.8 空白z最小COL内部某些与
21、其余区域相比明显地发亮的区域。5.4.3.9 笔划边缘z在笔划附近区域与背景之间,其反射系数的变化值近似为-半的那一组点定义为笔划边啡。5.4.3.10.边缘不规则性z部分的笔划边缘延伸至最小COL以内或者超出最大COL之外。5.4.3.11 斑点z最大COL外但IJ某些与背景之间存在对比度的区域。5.4.4 目测法5.4.4.1 仪器泪量仪器包括与字符表相符合的COL样板组,以及适当的光学放大器例如玻璃放大镜。5.4.4.2 扫.印对比庭打印对比度(PC)表示打印有字符的纸面与字符本身的反射系数之差。5.4.4.3 最佳配合最佳配合应在要检查的字符上面移动样板,用目测的方法获得。字符的最佳配
22、合是字符应尽可能多边充满最小COL,同时尽可能少地不超出最大COL5.4.4.4 空白见图9)最大COL+COL 国8样板处于最佳配合空臼是指最小COL内部某些与打印图象相比浓度明显较低的区域。可允许与不能允许的空白之间的差别,应根据测量它们的尺寸与距离的大小而定。 15 一可允诲的空白、C/3阪iU;11t/5J/Z 9079 87 不能允许的空白llmm 空白圈9空白段大COL蜒4、E飞II如呆空白组括整个直径为0.2mm(0.008in)的检验园,以及空白的总面积小于1/3的检验圆面积,有这样一个或多个空白是允许的。如果空i司的总面积大于1/击的检验圆面积,但是空白包括在整个检验圆以内,
23、而且空臼圆心与检验困直径。.2日1m,0.008in)的圆心之间的距离覆盖最近的空白或一组类似的空白,所具有的总面积大于1/3的检验固,员Ij该距离至少应大于1mm (0.04 n)。5.4.4.5 边缘不规则性(见图10)最大COL最小COL最小COL放大COL0.-3 不能允许的边缘不规则怜先诗篇边缘不规则性划边gt主:O. 3 国10边缘不规则性字符超出最大COL外侧,在最小COL内恤1存在着字符部分缺陷,则生成了边 16 SJ/Z 9079 87 缘不规则性。如果沿最大COL测量字符突出部分,或沿最小COL测量字符凹陷部分,均不超过0.3mm1/3圆面积允lmm 最大COL小COL图1
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SJ 9079 1987 光学 字符 识别 打印 规范
