[发明专利]一种基于知识库的词汇关系链分析方法、系统及装置有效
申请号: | 201710948034.7 | 申请日: | 2017-10-12 |
公开(公告)号: | CN107844526B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 张毅 | 申请(专利权)人: | 广州艾媒数聚信息咨询股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F16/36;G06F40/284 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 510006 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识库 词汇 关系 分析 方法 系统 装置 | ||
1.一种基于知识库的词汇关系链分析方法,其特征在于,包括以下步骤:
根据需分析词汇,搜索知识库中对应的资讯文章,建立得到对应的关联词列表和关联组合列表;
根据需分析词汇,在各百科平台搜索库中进行搜索,建立得到对应的百科搜索关联词列表;
根据关联词列表、关联组合列表和百科搜索关联词列表,得到需分析词汇的关系链分析结果;
其中,所述的根据需分析词汇,在各百科平台搜索库中进行搜索,建立得到对应的百科搜索关联词列表,这一步骤具体包括:
根据需分析词汇,在各百科平台搜索库中进行搜索,得到各百科平台的搜索结果;
对得到的各百科平台的搜索结果进行切词处理,得到搜索结果中的词汇,进而得到搜索结果中除去需分析词汇以外的词汇作为搜索关联词;
对搜索关联词进行哈希值计算,并分别统计各百科平台的搜索关联词的词频;
将各百科平台的搜索关联词的种类进行交集处理,得到取交集后的搜索关联词;
根据取交集后的搜索关联词,对其词频进行平均数计算,进而建立得到对应的百科搜索关联词列表。
2.根据权利要求1所述的一种基于知识库的词汇关系链分析方法,其特征在于:所述的根据需分析词汇,搜索知识库中对应的资讯文章,建立得到对应的关联词列表和关联组合列表,这一步骤具体包括:
根据需分析词汇,在知识库中搜索得到对应的资讯文章;
对得到的资讯文章进行切词处理,生成得到资讯文章的标签,进而得到资讯文章中除去需分析词汇以外的标签作为关联词;
对需分析词汇和关联词进行哈希值计算,并统计需分析词汇和关联词的词频,进而建立得到对应的关联词列表;
将关联词进行两两组合,并统计关联词组合后的出现次数,进而建立得到对应的关联组合列表。
3.根据权利要求1或2所述的一种基于知识库的词汇关系链分析方法,其特征在于:所述的哈希值计算具体为:
通过HMAC-SHA1算法计算后,再转成十六进制,最后转化为长整型。
4.一种基于知识库的词汇关系链分析系统,其特征在于,包括:
资讯分析单元,用于根据需分析词汇,搜索知识库中对应的资讯文章,建立得到对应的关联词列表和关联组合列表;
百科分析单元,用于根据需分析词汇,在各百科平台搜索库中进行搜索,建立得到对应的百科搜索关联词列表;
结果汇总单元,用于根据关联词列表、关联组合列表和百科搜索关联词列表,得到需分析词汇的关系链分析结果;
其中,所述的百科分析单元包括:
搜索单元,用于根据需分析词汇,在各百科平台搜索库中进行搜索,得到各百科平台的搜索结果;
百科切词处理单元,用于对得到的各百科平台的搜索结果进行切词处理,得到搜索结果中的词汇,进而得到搜索结果中除去需分析词汇以外的词汇作为搜索关联词;
百科统计单元,用于对搜索关联词进行哈希值计算,并分别统计各百科平台的搜索关联词的词频;
交集处理单元,用于将各百科平台的搜索关联词的种类进行交集处理,得到取交集后的搜索关联词;
平均计算单元,用于根据取交集后的搜索关联词,对其词频进行平均数计算,进而建立得到对应的百科搜索关联词列表。
5.根据权利要求4所述的一种基于知识库的词汇关系链分析系统,其特征在于:所述的资讯分析单元包括:
文章查找单元,用于根据需分析词汇,在知识库中搜索得到对应的资讯文章;资讯切词处理单元,用于对得到的资讯文章进行切词处理,生成得到资讯文章的标签,进而得到资讯文章中除去需分析词汇以外的标签作为关联词;
资讯统计单元,用于对需分析词汇和关联词进行哈希值计算,并统计需分析词汇和关联词的词频,进而建立得到对应的关联词列表;
关联词组合单元,用于将关联词进行两两组合,并统计关联词组合后的出现次数,进而建立得到对应的关联组合列表。
6.根据权利要求4或5所述的一种基于知识库的词汇关系链分析系统,其特征在于:所述的哈希值计算具体为:
通过HMAC-SHA1算法计算后,再转成十六进制,最后转化为长整型。
7.一种基于知识库的词汇关系链分析装置,其特征在于,包括:
存储器,用于存放程序;
处理器,用于执行所述程序,所述程序使得所述处理器执行如权利要求1~3任一项所述的基于知识库的词汇关系链分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州艾媒数聚信息咨询股份有限公司,未经广州艾媒数聚信息咨询股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710948034.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电车控制装置
- 下一篇:包括至少两个相互铰接连接的汽车部分的汽车