著录项信息
专利名称 | 联机手写字符识别装置 |
申请号 | CN89106539.3 | 申请日期 | 1989-08-17 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 1990-03-14 | 公开/公告号 | CN1040447 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 索尼公司 | 申请人地址 | 日本东京都
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 索尼公司 | 当前权利人 | 索尼公司 |
发明人 | 吉田公义;田守宽文;板野秋夫;茶谷公之 |
代理机构 | 中国专利代理(香港)有限公司 | 代理人 | 何耀煌;叶凯东 |
摘要
本发明用于联机手写字符的识别并且具有较好的识别精度。联机手写字符识别装置包含有:字符基本结构元素即预先定义好的多个模板信息,可分别计算出输入笔划信息与所述模板信息的近似度的电路,存有每个字符中对各笔划的限定语的特征词典存储器和评价时,用所述限定语限定所述近似度并且改变字符判定程度来进行评价的评价电路。
1、一种联机手写字符识别装置,配备有:包含座标输入装置以及用折线去近似由所述座标输入装置输入的每一个输入笔迹的折线压缩电路的手写输入电路,预先存储好与字符基本结构元素相对应的多个模板信息的规则存储电路,
预先存储好各字符、及与其各笔划最相近的模块信息、以及表示近似程度的限度的特征词典存储器,
所述联机手写字符识别装置的特征在于还包含:
用于分别算出从上述手写输入电路提供的各个笔划信息与上述规则存储电路中存储的多个模板信息的近似度计算电路,
根据上述近似度计算电路计算出的各笔划的近似度,参照上述特征词典存储器,对手写字符进行评价,并在评价时通过用所述限定语限定所述近似度从而改变字符判定程度来进行评价的评价电路。
本发明涉及联机手写字符的识别装置。\n本发明的联机手写字符识别装置中,求出输入笔划与预先定义的字符基本结构元素的近似度,并以这近似度作为特征矢量的成分,据此用模糊性评价输入字符,提高其识别的各种特性。\n先有技术联机手写字符的识别方法如图6所示,\n1.用输入笔迹上取样点P0,P1,…Pn及其时间序列信息构成的折线(图6B)去近似手写的一笔划的输入笔迹。(图6A)\n2.将预先定义的笔迹的基本形状、即“基本笔划类型”与第1项的折线比较进行“笔划识别”。\n3.根据第2项的结果,将输入的笔划变换为最接近的基本笔划类型的代码号。\n4.对一个字符的所有笔划,重复1-3项。\n5.参照词典,将按笔划顺序持有第3项代码号的字符判断为被输入的字符。\n上述方法一直被广泛使用着。\n如果使用这种方法,由于用一种基本笔化类型置换输入的笔划,在基本输入笔迹取样点P0,P1,…Pn信息中,除了以后识别过程所必需的数据,几乎都可舍去,因此即使存储容量较小的装置也可能用作字符识别。又,由于词典的基本笔划类型的代码号按各字 符笔划顺序排列,用它与输入字符的基本笔划类型的代码号顺序作比较,可进行输入字符的识别,因此,既可使词典小型化,又可缩短比较所需要的时间。\n文献:“日经”1983年12月5日号\n但是,在使用这种方法的场合下,由于输入噪声、手写者输入缺点使输入笔迹的基本形发生变化乃至变形时,在第2项笔划识别中就会产生差错,其结果使识别精度大幅度下降。例如,书写“一”或一横时,如图7A中○内所表示,如有“起笔处”,则其基本笔划类型会被识别成图7B所示。\n为此,以前用“笔划s的代号码C1、C2、…Cn”那样的并行描述来处理词典中那些“易于误识别的笔划类型”代码。\n但是,如果这样做,既增大了词典尺寸,又延长了检索时间。而且用户要在词典中追加未登录的字符时,由于不能只从输入笔划来确定登录所必需的笔划类型代码,所以实现这样的追加登录是非常困难的。\n本发明的目的是解决如上的问题。\n为此,在本发明中,求出输入的笔划信息与预先定义的字符基本结构元素的近似度,变换以该近似度构成特征矢量的信息里,输入的笔划信息,根据评价中的限定语改变评价度。\n用模糊性进行字符识别,不会降低识别率,可实现词典尺寸的小型化和检索高速化等。\n首先,就本发明及其实施例的概要加以说明。\n即在本发明中:\n1.准备妥例如图2所示的模板式样(基本笔划类型)T1-T26;\n2.将手写输入的每个字符中第ⅰ个笔划信息Si与模板T1-T26顺序比较,并算出与各模板Tj(j=1-26)的近似度Eij。\n例如,如果输入字符为片假名“ ”,那么它的第一笔划s为“丿”,由于与模板T1,T2,T3等的近似度较高,与模板T7等的近似度较低,所以得到E101=90%,E102=80%,E103=95%,…E107=0%,…E126=0%。同样地,由于第二笔划S为“丶”,所以得到E201=5%,E202=0%,E203=0%,…E207=95%,…E226=0%,(数值是为说明而假定的大小)。\n3、对于各字符,在各个笔划Si上,将第2项的结果作为特征矢量Vi,Vi=(Ei01,Ei02,…Ei26)存储起来。\n如在上例“ ”的情形下,特征矢量为:\nV=(90,80,95,…,0,…0)\nV=(5,0,0,…,95,…,0)。\n4、当片假名“ ”字符书写正确时,其第一笔划S1与模板T3“大体”一致,第二笔划S2与模板T7“确实”一致。\n因此,词典里如果字符“ ”,则“ ”的日本工业标准代码(JIS)描述其字符的代码为T3=大体,T7=确定。\n即,对每一个字符,描述该字符代码号、与该字符第i笔化Si最接近的模板号Tj以及表示这种近似(一致)程度的限定语。又,该模板号Tj及限定语,仅仅按笔划顺序描述其笔划数。\n再根据每一个字符的总笔划数将这些字符分类。\n5、再准备好如图3所示的具有模糊性的函数图表。\n6、根据第4项的字符数据内,从输入字符的总笔划数项中取出第一项字符的字符数据。\n在上例中,“ ”字符的总笔划数为2,所以从2笔划项中取出第一项字符数据。\n7、为简单起见,第6项中取得的字符数据为“ ”字符的字符数据 的话,由于第1笔划S1的T3=“大体”,那么随着选择图3中“大体”的函数曲线,就可从第3项求出的特征矢量V1的近似度里,取出相对于模板T3的近似度95%(=E103)。\n然后,根据图3中“大体”的函数曲线,变化该近似度95%为合格率G1,例如G1=96%。\n同样,由于第二笔划S2,T7=“确定”,所以随着选择图3中“确定”的函数曲线,就可从特征矢量V2的近似度里,取出相对于模板T7的近似度95%(=E207),将其变换为合格率G2,例如,G2=98%。\n即,在第6项取出字符数据的同时,既要对每一笔划Si选择图4的函数曲线,又要将特征矢量Vi对应的近似值Eij变换为由所选的函数曲线限定的合格度Gi。\n8、将第7项求得的合格度Gi内的最小合格率作为该字符数据所表示代码号的字符合格度Gm。\n在上例中,由于G1=96%,G2=98%,所以相对于输入字符“ ”字的合格度Gm为96%(=G1)。\n9、其后,对符合笔划数的所有字符数据,重复执行7、8项。\n10、如果第9项执行结束,在所得到的合格度Gm(这只得到字符数据的个数)里,将其中给予合格度G最高的字符作为输入字符的第一候选,输出其代码号。\n接着,模板式样T1-T26是考虑以下几点确定的,即:\n1、汉字的结构元素有“横笔划”,“竖笔划”,“撇”,“弯”等,其种类有限定。\n2、即使看似相同的笔划,也会由于运笔的不同出现“撇”“弯”等变形的写法的差异。又,对“撇”等笔划,由于没有规定原来的长度和角度,在可能产生不同变形的笔划中,例如模板式样T1-T3,仅仅 是为区分变形类型而准备的另一些模板。\n3、由于非常复杂的基本形状在所有汉字中出现频率极低,所以不定义模板,而用其它识别方法来处理。\n还有,模板式样T1-T26中用点线表示的笔划部分在求近似度Eij时,表示可减少或忽略它们的评价。\n下面说明本发明的一个结构实例。\n图1是本发明的一个实施例的系统图。\n图2至图7是其说明图。\n在图1中,(1)表示图形输入板等的座标输入手段,由这个输入手段(1)输入一个笔划部分的座标序列Po-Pn,将这个座标序列Po-Pn送到折线压缩电路(2),对折线信息及其端点信息的序列进行压缩变换。即,例如,如果输入的笔划(座标序列)预处理呈图4B所示的折线#1-#4的话,那么该笔划,其每条折线#1-#4既如图4A所示的角度(方向)按8个方向数量化,又对该折线#1-#4的长度和各始点及终点的座标值进行变换,得到如图4C所示那样的数据。\n而且,该数据的一个笔划部分通过缓冲存储器(3),送至近似度计算电路(401)-(426),计算模板式样T1-T26的近似度Eij。(前述第2项)再,进行该近似度Eij计算是根据规则存储电路(501-(526)中所描述的算法,独立而且并行地对各模板式样Tj计算求得的。\n然后,将算出的近似度Eij送至特征矢量缓冲存储器(6)。图中,模型地表示了该缓冲存储器(6)的结构,既有与模板式样T1-T26对应行方向的26个存储区,又有与识别字符最大笔划数K对应列方向的K个存储区。因此,在这个缓冲存储器(6)中,就一个字符来说其各笔划S的特征矢量Vi,存储在每一个笔划Si里。(前述第 3项)\n而且,该一个字符的特征矢量Vi和来自特征词典(7)的字符代码(前述第4项)在评价电路(8)中按前述第5-10项进行处理,将对于输入字符合格度最高代码号加以输出。\n图5表示在近似度计算电路(401)中,计算输入笔划Si对模板T1的近似度Ei01的规则实例。\n即,在图5A中,夸张表示了“右”、“五”等字中所含的“丿”,对于这个笔划“丿”,在模板T1的时刻,如图5B所示,是通过测量长度L1-L4,Lh,Lw,计算出来的。\nEiol=(aLh-bLw-cL1+dL4+eL3)/L2\n但是,当Ei01>1时 Ei01=1\n当Ei01<0时 Ei01=0\na-e为求出的常数,(在这里用小数表示近似值Ei01)。\n而且,这时在模板T1中,由于点线笔划部分的权为0乃至小于0,所以对于值L3,L4的常数e,d,比其它常数a-c小。\n又,在计算电路(402)-(426)中,也按对应模块T2-T26的近似度Ei02-Ei26的计算公式,将各自定义的近似度计算出来。\n若根据如上的本发明,进行联机手写字符的识别,这时,特别是如果根据本发明,求出输入笔划Si和预先定义好的模板T1-T26的近似度Eij,并以该近似度Eij及限定语为基础进行字符识别,那么对笔迹的自然变化乃至变形的识别率都不会降低。由于模板Tj象T1-T3那样的处理,即对部分变形也作了处理,从而提高了识别率,加强了对笔迹变化乃至变形的识别能力。\n又,由于词典(7)可以基本上只有1组与笔划Si对应的代表性的模板Tj及其限定语,那么,既可使词典(7)小型化,又可使词典(7)的检索高速化。\n又可用这样一种方法实现未定义字符的登录,即由用户每输入一个笔划,一方面由图象表示近似度最高的模板的形状,同时可用会话形式确认该模板是否为正确的形状。
法律信息
- 2009-10-14
专利权的终止(未缴年费专利权终止)
专利权的终止(未缴年费专利权终止)授权公告日:1993.3.31
- 2002-04-24
- 1993-03-31
- 1991-11-13
实质审查请求已生效的专利申请
实质审查请求已生效的专利申请
- 1990-03-14
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |