[发明专利]模板检验方法及装置有效
申请号: | 201611100661.7 | 申请日: | 2016-12-02 |
公开(公告)号: | CN106598945B | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 陈信吉;赵建凯;牛坤;赵振海 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/24 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 林锦澜 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模板 检验 方法 装置 | ||
1.一种模板检验方法,其特征在于,所述方法包括:
获取提取模板对应的关键信息项集合,所述提取模板是用于从通信消息中提取关键信息项的模板,所述关键信息项集合包括所述提取模板提取的至少一个所述关键信息项;
获取属于预定分类的通信消息的有效分词集合,所述预定分类是与所述提取模板对应的通信消息分类,所述有效分词集合包括从所述通信消息的分词结果中筛选出的至少一个有效分词;
检测所述有效分词在关键信息项集合中是否存在匹配的所述关键信息项;
若不存在匹配的所述关键信息项,则确定所述提取模板存在遗漏的关键信息项,
所述获取属于预定分类的通信消息的有效分词集合,包括:
获取属于所述预定分类的至少一条通信消息;
将所述通信消息进行分词,得到全量分词集合;
使用所述提取模板对所述通信消息进行提取,得到提取词语集合;
将所述全量分词集合与所述提取词语集合相减,得到差集;
将所述差集中的分词进行过滤,得到所述有效分词集合。
2.根据权利要求1所述的方法,其特征在于,所述将所述差集中的分词进行过滤,得到所述有效分词集合,包括:
将所述差集中符合预设词性的词语进行滤除,得到所述有效滤除集合;
和/或,
将所述差集中符合预设过滤词的词语进行滤除,得到所述有效分词集合;
其中,所述预设词性是无效分词对应的词性,所述预设过滤词是预先为所述预定分类所设置的过滤词。
3.根据权利要求1至2任一所述的方法,其特征在于,所述检测所述有效分词在所述关键信息项集合中是否存在匹配的所述关键信息项,包括:
检测所述关键信息项集合中是否存在第一关键信息项,所述第一关键信息项与所述有效分词的字符串相同;
和/或,
检测所述关键信息项集合中是否存在第二关键信息项,所述第二关键信息项与所述有效分词的字符串不同但语义相同。
4.根据权利要求1至2任一所述的方法,其特征在于,所述检测所述有效分词在所述关键信息项集合中是否存在匹配的所述关键信息项之后,包括:
若全部的所述有效分词均存在匹配的所述关键信息项,则确定所述提取模板符合预设要求。
5.一种模板检验装置,其特征在于,所述装置包括:
第一获取模块,被配置为获取提取模板对应的关键信息项集合,所述提取模板是用于从通信消息中提取关键信息项的模板,所述关键信息项集合包括所述提取模板提取的至少一个所述关键信息项;
第二获取模块,被配置为获取属于预定分类的通信消息的有效分词集合,所述预定分类是与所述提取模板对应的通信消息分类,所述有效分词集合包括从所述通信消息的分词结果中筛选出的至少一个有效分词;
检测模块,被配置为检测所述有效分词在关键信息项集合中是否存在匹配的所述关键信息项;
确定模块,被配置为当不存在匹配的所述关键信息项时,确定所述提取模板存在遗漏的关键信息项,
所述第二获取模块,包括:获取子模块、分词子模块、提取子模块、差集子模块和过滤子模块;
所述获取子模块,被配置为获取属于所述预定分类的通信消息库,所述通信消息库包括至少一条通信消息;
所述分词子模块,被配置为将所述通信消息库中的所述通信消息进行分词,得到全量分词集合;
所述提取子模块,被配置为使用所述提取模板对所述通信消息进行提取,得到提取词语集合;
所述差集子模块,被配置为将所述全量分词集合与所述提取词语集合相减,得到差集;
所述过滤子模块,被配置为将所述差集中的分词进行过滤,得到所述有效分词集合。
6.根据权利要求5所述的装置,其特征在于,
所述过滤子模块,被配置为将所述差集中符合预设词性的词语进行滤除,得到所述有效滤除集合;
和/或,
所述过滤子模块,被配置为将所述差集中符合预设过滤词的词语进行滤除,得到所述有效分词集合;
其中,所述预设词性是无效分词对应的词性,所述预设过滤词是预先为所述预定分类所设置的过滤词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611100661.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种民航安保舆情情感分析方法
- 下一篇:一种内容提取方法及装置