[发明专利]一种确定相似文本的数据处理系统有效
申请号: | 202210935521.0 | 申请日: | 2022-08-05 |
公开(公告)号: | CN115017269B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 刘羽;傅晓航;林方;常鸿宇 | 申请(专利权)人: | 中科雨辰科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 安娜 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种确定相似文本的数据处理系统,系统包括:数据库、处理器和存储有计算机程序的存储器,其中,数据库中包括预设实体向量集合和初始文本列表,当计算机程序被处理器执行时,实现以下步骤:获取目标文本对应的第一文本编码向量和第一实体编码向量列表,获取关键文本对应的第二文本编码向量和第二实体编码向量列表,分别对第一实体编码向量列表和第二实体编码向量列表进行处理获取第一目标编码向量列表和第二目标编码向量列表,获取目标文本对应的相似度,确定目标文本与关键文本列表中的文本是否为相似文本。本发明提供了一种确定文本相似度的新方法,能够避免因语义重复造成不清楚的问题,使得获取的文本相似度的准确度较高。 | ||
搜索关键词: | 一种 确定 相似 文本 数据处理系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科雨辰科技有限公司,未经中科雨辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210935521.0/,转载请声明来源钻瓜专利网。