[发明专利]基于词性对齐的文本相似度计算方法有效
| 申请号: | 202010887857.5 | 申请日: | 2020-08-28 |
| 公开(公告)号: | CN112016306B | 公开(公告)日: | 2023-10-20 |
| 发明(设计)人: | 覃勋辉;杜若;唐成友 | 申请(专利权)人: | 重庆邂智科技有限公司 |
| 主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/284;G06F40/289 |
| 代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 蒙捷 |
| 地址: | 400000 重庆市渝北区金开大道*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及自然语言处理技术领域,具体为基于词性对齐的文本相似度计算方法,包括:S100:对第一语句和第二语句进行分词和词性标注;S300:计算第一语句的分词和第二语句的分词之间的同义词关系,得到同义词矩阵;S400:依次对每一种词性执行步骤S401至步骤S404;S401:从第一语句和第二语句中提取当前词性对应的分词,得到第一分词序列和第二分词序列;S403:判断第一分词序列与第二分词序列的各个分词之间的对应关系,得到第一语句和第二语句的对齐结果;S404:根据对齐结果统计当前词性的对齐特征;S500:根据统计的对齐特征,计算文本相似度。本申请的基于词性对齐的文本相似度计算方法,能够解决现有算法存在的训练数据量大、计算复杂、准确率低的问题。 | ||
| 搜索关键词: | 基于 词性 对齐 文本 相似 计算方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邂智科技有限公司,未经重庆邂智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010887857.5/,转载请声明来源钻瓜专利网。
- 上一篇:康复运动的自适应训练方法、装置、介质及康复机器人
- 下一篇:集成化保洁车





