[发明专利]矢量获取方法、矢量获取装置以及记录介质在审

专利信息
申请号: 202210248213.0 申请日: 2022-03-14
公开(公告)号: CN115081638A 公开(公告)日: 2022-09-20
发明(设计)人: 梅原光规;粕渊清孝;吉田明子;寺田万理;角谷祐辉 申请(专利权)人: 株式会社斯库林集团
主分类号: G06N20/00 分类号: G06N20/00;G06K9/62;G06F40/205
代理公司: 隆天知识产权代理有限公司 72003 代理人: 宋晓宝
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 矢量 获取 方法 装置 以及 记录 介质
【说明书】:

本申请提供一种矢量获取方法、矢量获取装置以及记录介质,能够提高与单词对应的矢量的分类精度。矢量获取方法将能够分割成多个单词的单词作为复合词,并包括:将包含从复合词分割出的单词中的至少两个的至少一个语句输入到学习完毕模型中的工序;从学习完毕模型输出与输入的语句中的、从复合词分割出的单词中的至少一个对应的调整矢量的工序;使用从学习完毕模型输出的调整矢量,获取与复合词对应的矢量即复合矢量的工序。

技术领域

本申请说明书所公开的技术涉及与单词对应的矢量的获取。

背景技术

以往,已知有分配与单词对应的矢量,进而使用该矢量计算单词之间的相似度的技术(例如,参照专利文献1)。

专利文献1:日本特开2020-74205号公报。

如上所述,在计算单词之间的相似度的情况下,能够利用预先保存在学习完毕模型中的与各个单词对应的矢量。

学习完毕模型由于使用大量的语句进行学习并生成上述的矢量,因此若使用预先保存的上述矢量,则能够容易地计算单词之间的相似度。

另一方面,针对对应的矢量未被保存在学习完毕模型中的单词或者保存在学习完毕模型中的矢量的分类精度不足的单词,可能无法高精度地计算单词之间的相似度。

发明内容

本申请说明书所公开的技术是鉴于以上记载的问题而完成的,其是用于提高与单词对应的矢量的分类精度的技术。

本申请说明书所公开的技术的第一方式的矢量获取方法是使用学习完毕模型的矢量获取方法,该学习完毕模型保存与多个单词中的每个单词对应地预先学习的矢量即初始矢量,并且能够针对由多个所述单词构成的所述语句的输入,与所述语句中的各个所述单词对应地输出调整矢量,该调整矢量是调整了所述初始矢量的所述矢量,其中,将能够分割成多个所述单词的所述单词作为复合词,该矢量获取方法包括:将包含从所述复合词分割出的所述单词中的至少两个的至少一个所述语句输入到所述学习完毕模型中的工序;从所述学习完毕模型中输出与所输入的所述语句中的从所述复合词分割出的所述单词中的至少一个对应的所述调整矢量的工序;以及使用从所述学习完毕模型输出的所述调整矢量,获取与所述复合词对应的所述矢量即复合矢量的工序。

本申请说明书所公开的技术的第二方式的矢量获取方法与第一方式的矢量获取方法相关联,将所述语句输入到所述学习完毕模型中的工序是将包含从在所述学习完毕模型中没有保存对应的所述初始矢量的所述复合词分割出的所述单词的所述语句输入到所述学习完毕模型中的工序。

本申请说明书所公开的技术的第三方式的矢量获取方法与第一或第二方式的矢量获取方法相关联,该矢量获取方法还包括:使用包含使用所述调整矢量而获取的所述复合矢量的与多个所述单词中的每个单词对应的所述矢量,计算包含所述复合词的多个所述单词之间的相似度的工序。

本申请说明书所公开的技术的第四方式的矢量获取方法与第一至第三方式中的任一方式的矢量获取方法相关联,获取所述复合矢量的工序是与使用分别包含在多个所述语句中的、从所述复合词分割出的同一所述单词对应的所述调整矢量的平均值,获取所述复合矢量的工序。

本申请说明书所公开的技术的第五方式的矢量获取方法与第一至第四方式中的任一方式的矢量获取方法相关联,获取所述复合矢量的工序是通过对与从所述复合词分割出的各个所述单词对应的所述矢量进行平均,获取所述复合矢量的工序。

本申请说明书所公开的技术的第六方式的矢量获取方法与第一至第五方式中的任一方式的矢量获取方法相关联,所述学习完毕模型是基于转换器的语言编码模型。

本申请说明书所公开的技术的第七方式的矢量获取方法与第一至第六方式中的任一方式的矢量获取方法相关联,将所述语句输入到所述学习完毕模型中的工序是将包含所述复合词的所述语句输入到所述学习完毕模型中的工序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社斯库林集团,未经株式会社斯库林集团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210248213.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top