[发明专利]一种基于文本聚类的语义相似度分析方法在审
申请号: | 201911100265.8 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110825877A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 唐昱润;宫法明;马玉辉;司朋举;李昕 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06F40/247;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于文本聚类的语义相似度分析方法,该方法包含:以未处理的文本数据作为输入,对通过数据预处理的文本进行词频统计,并将词频统计信息作为先验知识加入文本聚类,提出后验判别准则,也可以将词频统计作为分类器再次基础上进行无监督的聚类方法提高文本聚类结果的准确性和时效性;对处理过的文本进行同义词消除歧义、在进行语义角色标注后,生成融合上下文特征的语义向量,采用结构、参数完全相同的两个LSTM处理文本序列,并加入结果的乘积和方差,放大文本的相同点和差异性,计算得到相似度分析的最终结果。本发明的方法能够应用于多种不同领域的文本相似度分析的实际场景中,可以很好地处理类型不同的文本数据。 | ||
搜索关键词: | 一种 基于 文本 语义 相似 分析 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911100265.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种磨刀口可移动的磨刀器
- 下一篇:触控模组、触控显示装置及电子设备