[发明专利]模板构建方法、信息提取方法及装置有效
申请号: | 201510498399.5 | 申请日: | 2015-08-13 |
公开(公告)号: | CN105183721B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 汪平仄;陈志军;龙飞 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开揭示了一种模板构建方法、信息提取方法及装置,属于自然语言处理领域。所述方法包括:获取原始信息样本集,原始信息样本集包括至少一条原始信息;对于每条原始信息,构建与原始信息的特征所对应的提取模板;按照每个提取模板所匹配的原始信息集合之间的集合关系对提取模板进行优先级排序,得到与原始信息的特征所对应的提取模板组;使用该提取模板组进行信息项提取。本公开解决了在短信携带的信息项较为密集时,从短信中提取出各个信息项时的准确性较差的问题;达到了匹配较为精准的提取模板在提取模板组中的优先级较高,优先采用匹配较为精准的提取模板对原始信息进行匹配和提取,能够提高提取信息项时的准确性的效果。 | ||
搜索关键词: | 原始信息 匹配 模板组 信息项 模板构建 信息提取 样本集 短信 集合 自然语言处理 优先级排序 提取信息 构建 携带 | ||
【主权项】:
1.一种模板构建方法,其特征在于,所述方法包括:获取原始信息样本集,所述原始信息样本集包括至少一条原始信息;对于每条所述原始信息,构建与所述原始信息的特征所对应的提取模板,不同的所述原始信息具有相同或不同的特征;在与所述原始信息的特征所对应的所述提取模板为至少两个时,按照每个所述提取模板所匹配的原始信息集合之间的集合关系对所述提取模板进行优先级排序,得到与所述原始信息的特征所对应的提取模板组。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510498399.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据分页方法及装置
- 下一篇:寻找相近语义汉字对的方法和装置