[发明专利]手写汉字自动分割和识别方法以及使用该方法的系统有效
申请号: | 99100938.X | 申请日: | 1999-01-13 |
公开(公告)号: | CN1260524A | 公开(公告)日: | 2000-07-19 |
发明(设计)人: | 唐道南;苏辉;王茜莺 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F3/00 | 分类号: | G06F3/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写 汉字 自动 分割 识别 方法 以及 使用 系统 | ||
1.一种在手写汉字信息处理系统中自动分割和识别用户连续输入的手写汉字串的方法,其中所述手写汉字信息处理系统按笔画和相关时序信息记录用户连续输入的手写汉字串,所述方法的特征在于以下步骤:
建立描述手写汉字串中笔画序列几何特征的几何模型和描述汉语中字(词)依赖关系的语言模型;
基于所述相关时序信息和几何模型找出连续输入的手写汉字串中所有的潜在分割方案;
对于每一种分割方案,对任意两个分割点之间的笔画组进行识别,并计算出表征识别结果正确性的概率;
用语言模型修正上述表征识别结果正确性的概率;和
选择对应于概率值最大的识别结果和该识别结果所对应的分割方案作为对用户连续输入的手写汉字串的分割和识别结果。
2.根据权利要求1的手写汉字自动分割和识别方法,其特征在于所述几何模型包括间距模型G,使用两相邻笔画之间的间隔来描述所述两相邻笔画中后一笔画为一个潜在分割点的可能性,所述两相邻笔画按相关时序信息分为前一笔画和后一笔画。
3.根据权利要求2的手写汉字自动分割和识别方法,其特征在于所述G模型为一单调上升函数,其中自变量为两相邻笔画之间的间隔,因变量描述后一笔画为一个潜在分割点的可能性。
4.根据权利要求1的手写汉字自动分割和识别方法,其特征在于所述几何模型包括分布模型D,使用当前笔画与前一个已确定为潜在分割点的笔画之间的距离来描述当前笔画和潜在的分割点之间的笔画为一个字的可能性。
5.根据权利要求4的手写体汉字自动分割和识别方法,其特征在于所述D模型为一个类正态分布函数,其中自变量为当前笔画与前一个已确定为潜在分割点的笔画之间的距离,因变量描述当前笔画和潜在分割点之间的笔画为一个字的可能性,当自变量在于某一连续的值域内时该类正态分布函数值较大,而当自变量落在所述值域外时该类正态分布函数值较小。
6.根据权利要求1的手写汉字自动分割和识别方法,其特征在于对所述任意两个分割点之间的笔画组的识别结果可以是偏旁部首、单字词或多字词。
7.根据权利要求1的手写汉字自动分割和识别方法,其特征在于在书写方向为水平方向时,当识别结果为一左右结构的汉字时使用字宽度模型D’来修正表征识别结果正确性的概率值,字宽度模型D’使用即可以为左右结构汉字中的一个组成部分又可以为单个汉字的成分的宽度来描述在该宽度下该成分为左右结构汉字中一个组成部分的可能性或为单个汉字的可能性。
8.根据权利要求1的手写汉字自动分割和识别方法,其特征在于在书写方向为垂直方向时,当识别结果为一上下结构的汉字时使用字高度模型D’来修正表征识别结果正确性的概率值,字高度模型D’使用即可以为上下结构汉字中的一个组成部分又可以为单个汉字的成分的高度来描述在该高度下该成分为上下结构汉字中一个组成部分的可能性或为单个汉字的可能性。
9.根据权利要求1-8中任何一项权利要求的手写汉字自动分割和识别方法,其特征在于在寻找潜在的分割方案时使用树状结构。
10.根据权利要求9的手写汉字自动分割和识别方法,其特征在于所述树状结构为二叉树,其中根节点代表最初确定的潜在的分割点,左分枝表示不接受前一个潜在的分割点,右分枝表示接受前一个潜在的分割点,每当产生新的潜在分割点时,树就向下产生分枝。
11.根据权利要求10的手写汉字自动分割和识别方法,其特征在于使用G模型、D模型和识别结果对所述二叉树进行修剪。
12.一种用于对连续输入的手写汉字串进行自动分割和识别的系统,包括:
输入装置,用于接收用户连续输入的手写汉字串,并按笔画和相关时序记录用户的手写输入;
模型存储装置,用于存储描述手写汉字串中笔画序列几何特征的几何模型和描述汉语中字(词)依赖关系的语言模型;
分割装置,基于所述相关时序信息和几何模型找出连续输入的手写汉字串中所有的潜在分割方案;
识别装置,对于每一种分割方案,对任意两个分割点之间的笔画组进行识别,并计算出表征识别结果正确性的概率;
仲裁装置,用语言模型修正上述表征识别结果正确性的概率,选择对应于概率值最大的识别结果和该识别结果所对应的分割方案作为对用户连续输入的手写汉字串的分割和识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99100938.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:全密封防伪塑料包装桶
- 下一篇:无公害多功能无磷洗衣粉