[发明专利]改进用于基于相似性的工业组件模型请求系统的无监督嵌入方法在审

专利信息
申请号: 202111224371.4 申请日: 2021-10-19
公开(公告)号: CN114386214A 公开(公告)日: 2022-04-22
发明(设计)人: X·格勒昂;B·杜瓦尔;S·塔米宁 申请(专利权)人: 达索系统公司
主分类号: G06F30/20 分类号: G06F30/20;G06F40/247;G06F40/284
代理公司: 永新专利商标代理有限公司 72002 代理人: 戴开良
地址: 法国韦利济*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 改进 用于 基于 相似性 工业 组件 模型 请求 系统 监督 嵌入 方法
【权利要求书】:

1.一种用于比较用于基于相似性的工业组件模型请求系统的无监督嵌入方法的计算机实现的方法,包括:

a)提供与工业组件模型相关的文本语料库(200)和测试词列表,

b)通过改变所述测试词列表中每个测试词的出现中的一些出现来修改所述文本语料库(220),对于每个测试词,经修改的文本语料库因此包含每个测试词的第一版本的出现、以及每个测试词的第二版本的出现,

c)在经修改的文本语料库上运行无监督嵌入方法(260),并获得经修改的文本语料库的词的向量表示;

d)针对所述测试词中的至少一些测试词,通过比较这些测试词的所述第一版本的向量表示和这些测试词的所述第二版本的向量表示,确定与所述无监督嵌入方法相关联的评分值(270);

e)在利用另一种无监督嵌入方法的情况下,使用步骤a)的所述文本语料库和所述测试词列表运行步骤b)到d),并返回相应的评分值。

2.根据权利要求1所述的计算机实现的方法,其中,通过改变每个测试词的出现中的至少一半出现来修改所述文本语料库(220)的步骤b)包括:将所述测试词的出现中的基本上一半的出现修改为所述文本语料库中不存在的选定别名,并保留其它出现不变。

3.根据权利要求1或2所述的计算机实现的方法,其中,通过改变每个测试词的出现中的至少一半出现来修改所述文本语料库(220)的步骤b)包括:将所述测试词的出现中的基本上一半的出现修改为所述文本语料库中不存在的选定别名,并将其他出现修改为所述文本语料库中不存在的另一个选定别名。

4.根据前述权利要求中的一个权利要求所述的计算机实现的方法;其中,所述测试词列表是预先确定的。

5.根据权利要求1至3所述的计算机实现的方法,其中,通过确定所述文本语料库内的所述词的对数频率分布,并通过选择在所述对数频率分布中均匀间隔的词,来获得所述测试词列表。

6.根据前述权利要求中的一个权利要求所述的计算机实现的方法,其中,步骤d)包括:基于测试词的所述第一版本的嵌入与所述测试词的所述第二版本的嵌入之间的相似性距离,来确定所述测试词的评分值。

7.根据前述权利要求中的一个权利要求所述的计算机实现的方法;其中,步骤d)包括:通过确定测试词的所述第一版本的嵌入与所有其它词的嵌入之间的相似性距离、所述测试词的所述第二版本的嵌入与所有其它词的嵌入之间的相似性距离来确定所述测试词的评分值,并返回以下各项中的一项:

-与所述测试词的所述第二版本的嵌入相比,嵌入更接近所述测试词的所述第一版本的嵌入的词的数量,

-与所述测试词的所述第一版本的嵌入相比,嵌入更接近所述测试词的所述第二版本的嵌入的词的数量,以及

-以下数量之和:与所述测试词的所述第二版本的嵌入相比,嵌入更接近所述测试词的所述第一版本的嵌入的词的数量;与所述测试词的所述第一版本的嵌入相比,嵌入更接近所述测试词的所述第二版本的嵌入的词的数量。

8.根据前述权利要求中的一个权利要求所述的计算机实现的方法;其中,步骤d)包括:通过对所述测试词中的至少一些测试词的评分值进行平均,来确定评分值分数。

9.根据前述权利要求中的一个权利要求所述的计算机实现的方法;其中,步骤d)包括:通过返回所述测试词和对应测试词的分数值中的至少一些的评分值,来确定评分值分数。

10.一种计算机程序,其包括用于执行前述权利要求中的任何权利要求所述的方法的指令。

11.一种数据存储介质,其上记录有根据权利要求10所述的计算机程序。

12.一种计算机系统,其包括耦合到存储器(4)的处理器,所述存储器(4)上记录有根据权利要求10所述的计算机程序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达索系统公司,未经达索系统公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111224371.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top