[发明专利]一种数据库相似语句筛选的方法和装置有效
申请号: | 201910092111.2 | 申请日: | 2019-01-30 |
公开(公告)号: | CN109829051B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 黄永江;邱志国;庄纪军;张毅;赵乾 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/30;G06Q30/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种数据库相似语句筛选的方法和装置,该方法包括:利用目标标准语句的多个目标扩展语句的语义向量和语义向量预期筛选各个目标扩展语句得到待质检扩展语句;计算每个待质检扩展语句的语义向量与数据库中每个其他扩展语句的语义向量的相似度;其中,语义向量是通过语义度量模型得到的;基于相似度和第一预设筛选条件筛选各个待质检扩展语句和各个其他扩展语句,得到相似待质检扩展语句和对应的相似其他扩展语句。可见,仅筛选需质检的目标扩展语句作为待质检扩展语句,减小待质检扩展语句数量;该自动相似语句筛选相较于人工筛选得到的筛选结果更加完善、准确,且节省人力、节约时间,提高筛选效率。 | ||
搜索关键词: | 一种 数据库 相似 语句 筛选 方法 装置 | ||
【主权项】:
1.一种数据库相似语句筛选的方法,其特征在于,包括:基于目标标准语句的多个目标扩展语句的语义向量和语义向量预期,从多个所述目标扩展语句中筛选获得待质检扩展语句;获得每个所述待质检扩展语句的语义向量与数据库中每个其他扩展语句的语义向量的相似度;基于所述相似度和第一预设筛选条件,从各个所述待质检扩展语句和各个所述其他扩展语句中筛选获得相似待质检扩展语句和对应的相似其他扩展语句。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910092111.2/,转载请声明来源钻瓜专利网。