[发明专利]一种匹配方法及电子设备有效
申请号: | 201710676586.7 | 申请日: | 2017-08-09 |
公开(公告)号: | CN107609032B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 张惠亮;赵晓庆;刘胜;吴锋海 | 申请(专利权)人: | 联动优势科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 100082 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 匹配 方法 电子设备 | ||
本发明实施例提供一种匹配方法和电子设备,用于解决现有技术中电子设备使用字典对文本信息进行匹配时的匹配效果较差的技术问题。该方法包括:获取待匹配信息,待匹配信息为来自至少一个应用的通知信息,通知信息包括特殊字符,特殊字符包括字母和/或数字;根据字典树对待匹配信息进行匹配,确定待匹配信息中匹配成功的至少一个分词;其中,字典树为将多个词典格式按照链表格式输出形成的树,字典树中每个节点对应于词典格式中的特殊字符或固定字符,且每个节点的结束标识用于指示节点对应的字符是否为词典格式中的结尾字符,映射表用于指示每个节点的子节点;根据至少一个分词,输出与待匹配信息对应的包含至少两个切分标记的切分信息。
技术领域
本发明涉及电子技术领域,特别涉及一种匹配方法及电子设备。
背景技术
在随着移动互联网的迅猛发展,其产生的信息量正在飞速增加,如何从这些信息中提取我们感兴趣的部分,正是自然语言处理(Neuro-Linguistic Programming,NLP)需要研究的内容。特别是对于移动互联网的入口——手机,已经成为众多互联网公司必争之地。因此,通过对这些应用类文本进行正确解析,可为用户提供更为优质的服务。
文本解析包括文本切分和语义分析两个阶段,对于手机上各类公司企业的应用文本信息,一般结构都较为规整,文字信息量充分,模板变化频度比较小,很适合在第一步文本切分阶段采用字典法。传统字典法都是采用固定词汇的方式定义属性,但是在公司应用信息中,会包含很多数字,英文、特殊含义标示等,传统字典无法完整覆盖这些信息并且准确对原文进行切分。
传统的字符串匹配方法都是针对固定字符串匹配的,其需要在字典中预存较多的固定字符串。例如,若产品名称为:“每天盈201708号,合同为ht089888号”,则相应设置的固定字符串可能为“RMB”,“每天盈”,“合同”,等等,然而在匹配过程中会导致整个语句被切分的非常琐碎,例如会导致与数字或字母有关的特殊变量不能被完整切分,从而破坏语义的完整性,不利于后期语义分析阶段的处理。
综上可知,现有技术中采用传统的字典对文本信息匹配时,匹配效果较差。
发明内容
本发明实施例提供一种匹配方法和电子设备,用于解决现有技术中电子设备使用字典对文本信息进行匹配时的匹配效果较差的技术问题。
第一方面,本发明实施例提供一种匹配方法,应用于电子设备,包括以下步骤:
获取待匹配信息,所述待匹配信息为来自至少一个应用的通知信息,所述通知信息包括特殊字符,所述特殊字符包括字母和/或数字;
根据字典树对所述待匹配信息进行匹配,确定所述待匹配信息中匹配成功的至少一个分词;其中,所述至少一个分词为包含所述特殊字符的字符串,所述字典树为将多个词典格式按照链表格式输出形成的树,所述多个词典格式中每个词典格式用于表征特殊字符在字符串中的分布,所述字典树中每个节点对应于所述词典格式中的特殊字符或固定字符,且每个节点包括结束标识和映射表,所述结束标识用于指示节点对应的字符是否为词典格式中的结尾字符,所述映射表用于指示每个节点的子节点;
根据所述至少一个分词,输出与所述待匹配信息对应的包含至少两个切分标记的切分信息。
可选的,根据字典树对所述待匹配信息进行匹配,确定所述待匹配信息中匹配成功的至少一个分词,包括:
按照排列次序,将所述待匹配信息中的第一字符与所述字典树中的节点进行匹配;
若确定所述字典树中包括与所述第一字符对应的第一节点,将与所述第一字符相邻的第二字符与所述第一节点的映射表指示的多个子节点进行匹配;
若匹配到包含结束标识的结束节点,将所述待匹配信息中由所述第一字符至与所述结束节点匹配的字符所形成的字符串确定为一个分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联动优势科技有限公司,未经联动优势科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710676586.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动问答方法及系统
- 下一篇:基于自适应协同进化算法的信息核提取方法