[发明专利]一种提取中心词的方法、终端以及设备有效
申请号: | 201710458910.8 | 申请日: | 2017-06-16 |
公开(公告)号: | CN107665189B | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 吕梓燊;韦邕;赵清源;徐亮;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/33 |
代理公司: | 44242 深圳市精英专利事务所 | 代理人: | 林燕云 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种提取中心词的方法、终端以及设备,其中方法包括:获取用户输入的文本信息,文本信息包括一个或者多个搜索词;确定每个搜索词的出边权重;根据出边权重计算针对文本信息中所有搜索词的链接矩阵;根据预设文档库计算针对每个搜索词的先验分数;根据先验分数确定文本信息中所有搜索词的随机跳转向量;根据链接矩阵以及随机跳转向量计算每个搜索词的第一初步分数;根据预设的词性配置规则确定每个搜索词的第二初步分数;根据第一初步分数以及第二初步分数确定每个搜索词的最终程度分数;根据最终程度分数提取文本信息中的中心词。本发明利用文本本身的特征进行中心词提取,提高了提取的效果,并满足应用上中心词的提取要求。 | ||
搜索关键词: | 一种 提取 中心词 方法 终端 以及 设备 | ||
【主权项】:
1.一种提取中心词的方法,其特征在于,所述方法包括:/n获取用户输入的文本信息,所述文本信息包括一个或者多个搜索词;/n确定所述每个搜索词的出边权重,所述出边权重为一个搜索词到另一个搜索词之间的重要程度;/n根据所述出边权重计算针对所述文本信息中所有搜索词的链接矩阵,其中,所述链接矩阵的计算方法为:将不同输入窗口中搜索词的出边权重以矩阵的形式进行呈现,设文本信息中有m个词,那么该链接矩阵的维度则为m×m,其第i行第j列表示从第i个词依据链接跳转到第j个词的概率;/n根据预设文档库计算针对每个搜索词的先验分数;/n根据所述先验分数确定所述文本信息中所有搜索词的随机跳转向量;/n根据所述链接矩阵以及所述随机跳转向量计算每个搜索词的第一初步分数;/n根据预设的词性配置规则确定每个搜索词的第二初步分数;/n根据所述第一初步分数以及所述第二初步分数确定每个搜索词的最终程度分数;/n根据所述最终程度分数提取所述文本信息中的中心词。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710458910.8/,转载请声明来源钻瓜专利网。