[发明专利]数据的处理方法及装置、知识图谱有效
申请号: | 201610200663.7 | 申请日: | 2016-03-31 |
公开(公告)号: | CN105893551B | 公开(公告)日: | 2019-03-05 |
发明(设计)人: | 白杨;刘焱;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张凤伟;吴敏 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种数据的处理方法及装置、知识图谱。所述方法包括:通过关键词筛选操作从所有领域语料数据对应的词语中筛选出一个或多个第一级关键词,并将每条所述领域语料数据匹配到所述第一级关键词;通过关键词筛选操作从每个第一级关键词对应的领域语料数据中筛选出一个或多个第二级关键词,并将所述领域语料数据匹配到所述第二级关键词;不断重复上述筛选及匹配的过程,直至筛选出第M级关键词,并将所述领域语料数据匹配到所述第M级关键词,M大于或等于2;将所述第M级关键词对应的领域语料数据按照语义进行文本聚类。应用所述方法对数据进行处理,从处理后的数据中可以更加快速、准确地查找到用户需要的内容。 | ||
搜索关键词: | 领域语料 数据匹配 第一级 筛选 关键词筛选 图谱 数据对应 文本聚类 用户需要 语义 匹配 词语 重复 应用 | ||
【主权项】:
1.一种数据的处理方法,其特征在于,包括:获取原始语料数据;对所述原始语料数据执行过滤操作,以得到与目标领域相关的领域语料数据;对所述领域语料数据执行分词操作,以得到与每条领域语料数据对应的一个或多个词语;通过关键词筛选操作从所有领域语料数据对应的词语中筛选出一个或多个第一级关键词,并将每条所述领域语料数据匹配到所述第一级关键词;通过关键词筛选操作从每个第一级关键词对应的领域语料数据中筛选出一个或多个第二级关键词,并将所述领域语料数据匹配到所述第二级关键词;不断重复上述筛选及匹配的过程,直至筛选出第M级关键词,并将所述领域语料数据匹配到所述第M级关键词,M大于或等于2;将所述第M级关键词对应的领域语料数据按照语义进行文本聚类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610200663.7/,转载请声明来源钻瓜专利网。
- 上一篇:举升机旋转管柱固定卡瓦装置
- 下一篇:一种改善电路板通盲不匹配的制作方法