[发明专利]从目标文本中确定关键词的方法和装置有效
申请号: | 201410257533.8 | 申请日: | 2014-06-11 |
公开(公告)号: | CN104008186B | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 陈海勇;牟川;邢志峰 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06Q30/02 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 刘光明;陆锦华 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种从目标文本中确定关键词的方法和装置,能够基于语义从文本中识别词语,应用于电子商务领域中能够提高从文本中识别商品名称及品牌名称的准确性。该方法包括:在预选的文本集合中匹配预定的一个或多个关键词,每篇文本和每个关键词带有附加信息;从匹配到的关键词的预设范围的上下文中取多个对应于该关键词的语义关联词,并为取到的语义关联词设置正向的权重值和负向的权重值;在目标文本中匹配所述一个或多个关键词,从匹配到的关键词的预设范围的上下文中匹配该关键词对应的语义关联词,计算这些语义关联词的所有权重值的和,在该和大于设定值的情况下输出提示信息。 | ||
搜索关键词: | 目标 文本 确定 关键词 方法 装置 | ||
【主权项】:
1.一种从目标文本中确定关键词的方法,其特征在于,包括:在预选的文本集合中匹配预定的一个或多个关键词,每篇文本和每个关键词带有标签;其中,所述文本集合的文本为包括至少一个所述关键词的原始文本;所述标签用于标识所述关键词在所述文本中的实际语义;从匹配到的关键词的预设范围的上下文中取多个对应于该关键词的语义关联词,并为取到的语义关联词设置正向的权重值和负向的权重值,其中,若匹配命中的关键词的标签与该关键词所在文本的标签具有交集,该关键词对应的语义关联词的权重值为正向,反之为负向;在目标文本中匹配所述一个或多个关键词,从匹配到的关键词的预设范围的上下文中匹配该关键词对应的语义关联词,计算这些语义关联词的所有权重值的和,在该和大于设定值的情况下输出提示信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410257533.8/,转载请声明来源钻瓜专利网。