[发明专利]词语识别方法及装置有效
申请号: | 201210551755.1 | 申请日: | 2012-11-29 |
公开(公告)号: | CN103854021A | 公开(公告)日: | 2014-06-11 |
发明(设计)人: | 郑大念 | 申请(专利权)人: | 北京千橡网景科技发展有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 100041 北京市石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词语 识别 方法 装置 | ||
1.一种词语识别方法,包括:
从文本行中分离出词语;
将该词语作为一个整体,提取该词语的字符特征;
使用具有词库的分类器识别该词语的字符特征,若该字符特征与词库中的词语匹配,则输出词库中对应的该词语。
2.根据权利要求1所述的方法,其中,通过估计词语的识别置信度来判断该字符特征与词库中的词语的匹配程度。
3.根据权利要求1所述的方法,其中,使用标点符号或空格来从文本行中分离出词语。
4.根据权利要求1所述的方法,其中,该字符特征是该词语的梯度方向直方图。
5.根据权利要求1-4任一项所述的方法,其中,当该字符特征与词库中的所有词语都不匹配时,将该词语切分为单个字符进行识别。
6.一种词语识别装置,包括:
词语分离单元,用于从文本行中分离出词语;
字符特征提取单元,用于将该词语作为一个整体,提取该词语的字符特征;
词语分类器单元,其具有词库,用于识别该词语的字符特征,若该字符特征与词库中的词语匹配,则输出词库中对应的该词语。
7.根据权利要求6所述的装置,其中,词语分类器单元通过估计词语的识别置信度来判断该字符特征与词库中的词语的匹配程度。
8.根据权利要求6所述的装置,其中,词语分离单元使用标点符号或空格来从文本行中分离出词语。
9.根据权利要求6所述的装置,其中,该字符特征是该词语的梯度方向直方图。
10.根据权利要求6-9任一项所述的装置,其中,还包括单字符识别单元,当该字符特征与词库中的所有词语都不匹配时,单字符识别单元将该词语切分为单个字符进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京千橡网景科技发展有限公司,未经北京千橡网景科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210551755.1/1.html,转载请声明来源钻瓜专利网。