[发明专利]一种姓名识别方法及系统有效
申请号: | 201710532671.6 | 申请日: | 2017-07-03 |
公开(公告)号: | CN107247708B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 施懿;金鼎立 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/237;G06F16/903 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 姓名 识别 方法 系统 | ||
本发明公开了一种姓名识别方法及系统,建立汉语拼音词库,将待检词汇中的字符串与汉语拼音词库中的拼音字段进行匹配,确定待检词汇中的字符串包括的所有拼音字段,待检词汇中的字符串包括的所有拼音字段中包括至少两个拼音字段,按照该至少两个拼音字段中的字符顺序能够组成待检词汇中的字符串时,待检词汇为中文拼音词汇,即确定了待检词汇为中文姓名。本方案通过建立汉语拼音词库,并将待检词汇与汉语拼音词库进行匹配,从而确定待检词汇是否为中文拼音词汇,实现了将待检词汇明确为中文词汇还是英文词汇,避免了模糊匹配造成的不准确性。
技术领域
本发明涉及识别领域,尤其涉及一种姓名识别方法及系统。
背景技术
中国人的姓名通常为两个字或三个字,用汉语拼音的形式可以有多重排列组合的情况。当中国人姓名通过汉语拼音来表示的情况下,在不能明确待检词汇是英文词汇还是中文姓名的时候,无法确认待检词汇中是否包含中文姓名。
发明内容
有鉴于此,本发明提供一种姓名识别方法及系统,以解决现有技术中在不能明确待检词汇是英文词汇还是中文姓名的时候,无法确认待检词汇中是否包含中文姓名的问题,其具体方案如下:
一种姓名识别方法,包括:
建立汉语拼音词库;
将待检词汇中的字符串与所述汉语拼音词库中的拼音字段进行匹配,确定所述待检词汇中的字符串包括的所有拼音字段;
当所述待检词汇中的字符串包括的所有拼音字段中包括至少两个拼音字段,按照所述至少两个拼音字段中的字符顺序组成所述待检词汇中的字符串时,所述待检词汇为中文拼音词汇。
进一步的,还包括:
确定待检词汇,去掉所述待检词汇的字符串中的无意义字符,所述无意义字符包括:特殊字符及空格。
进一步的,所述确定所述待检词汇中的字符串包括的所有拼音字段,包括:
确定所述待检词汇中的字符串包括的所有拼音字段,标记所述字符串包括的所有拼音字段中每一个拼音字段的第一个字符在所述待检词汇的字符串中的位置,及所述每一个拼音字段包括的字符数。
进一步的,所述按照所述至少两个拼音字段中的字符顺序组成所述待检词汇中的字符串,包括:
按照所述至少两个拼音字段中每一个拼音字段第一个字符在所述待检词汇的字符串中的位置及每一个拼音字段包括的字符数进行顺序排列,得到所述待检词汇中的字符串。
进一步的,所述按照所述至少两个拼音字段中的字符顺序组成所述待检词汇中的字符串,包括:
通过管道函数,确定按照所述至少两个拼音字段中的字符顺序组成所述待检词汇中的字符串。
一种姓名识别系统,包括:建立单元,与所述建立单元相连的匹配单元,与所述匹配单元相连的确定单元,其中:
所述建立单元用于建立汉语拼音词库;
所述匹配单元用于将待检词汇中的字符串与所述汉语拼音词库中的拼音字段进行匹配,确定所述待检词汇中的字符串包括的所有拼音字段;
所述确定单元用于当所述待检词汇中的字符串包括的所有拼音字段中包括至少两个拼音字段,按照所述至少两个拼音字段中的字符顺序组成所述待检词汇中的字符串时,将所述待检词汇确定为中文拼音词汇。
进一步的,还包括:处理单元,其中:
所述处理单元用于确定待检词汇,去掉所述待检词汇的字符串中的无意义字符,所述无意义字符包括:特殊字符及空格。
进一步的,所述匹配单元确定所述待检词汇中的字符串包括的所有拼音字段,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710532671.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:填空字补齐系统
- 下一篇:一种百科词条标签的优化方法及系统