[发明专利]关键词和答案的确定方法、装置和计算机可读存储介质有效
申请号: | 201810399625.8 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108681564B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 梁仕强 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 王莉莉 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及一种关键词的确定方法、装置和计算机可读存储介质,涉及自然语言处理技术领域。该方法包括:将语料中的句子划分为多个单词;根据多个单词建立第一词列表,第一词列表中包括各单词及其在语料中的出现频率,第一词列表中的各单词按照其出现频率排序;根据划分得到的单词生成各合成词,合成词由N个单词组成,N大于等于2;根据各合成词建立第二词列表,第二词列表包括各合成词及其在所述语料中的出现频率,第二词列表中的各合成词按照其出现频率排序;根据第一词列表中各单词的出现频率和排序情况,以及第二词列表中包含各单词的合成词的出现频率和排序情况,确定各关键词。本公开的技术方案能够提高用户体验。 | ||
搜索关键词: | 关键词 答案 确定 方法 装置 计算机 可读 存储 介质 | ||
【主权项】:
1.一种关键词的确定方法,包括:将语料中的句子划分为多个单词;根据所述多个单词建立第一词列表,所述第一词列表中包括各单词及其在所述语料中的出现频率,所述第一词列表中的各单词按照其出现频率排序;根据划分得到的单词生成各合成词,所述合成词由N个单词组成,N大于等于2;根据所述各合成词建立第二词列表,所述第二词列表包括所述各合成词及其在所述语料中的出现频率,所述第二词列表中的各合成词按照其出现频率排序;根据所述第一词列表中各单词的出现频率和排序情况,以及所述第二词列表中包含所述各单词的合成词的出现频率和排序情况,确定各关键词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810399625.8/,转载请声明来源钻瓜专利网。