[发明专利]特征确定模型的训练方法、语义分析方法、装置及电子设备有效

专利信息
申请号: 202110746978.2 申请日: 2021-06-30
公开(公告)号: CN113361712B 公开(公告)日: 2023-07-21
发明(设计)人: 尚骏远;王硕寰;丁思宇 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N3/0442;G06N3/0455;G06F18/213;G06F40/30
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 纪雯
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 特征 确定 模型 训练 方法 语义 分析 装置 电子设备
【权利要求书】:

1.一种对特征确定模型进行预训练的方法,所述特征确定模型包括多级特征确定层,所述方法包括:

由多级特征确定层确定预训练文本包括的多个片段中的每个片段的特征向量;以及

根据所述特征向量执行对所述特征确定模型的预训练,

其中,所述由多级特征确定层确定预训练文本包括的多个片段中的每个片段的特征向量包括:由当前级特征确定层针对多个片段中的一个片段,

根据由所述当前级特征确定层针对所述一个片段的在前片段确定的在前片段特征向量和由所述当前级特征确定层的在前级特征确定层针对所述一个片段确定的在前级特征向量,确定针对所述一个片段的当前级特征向量,

其中,所述特征确定模型还包括多个参数化模型,其中通过循环神经网络RNN模型或transformer模型来实现各参数化模型,

其中,所述确定针对所述一个片段的当前级特征向量包括:

由所述多个参数化模型中的至少一个对在前片段特征向量进行参数化,以得到在前片段特征向量的参数化结果;以及

根据所述参数化结果和在前级特征向量,确定针对所述一个片段的当前级特征向量,

其中,所述方法还包括:

在由所述多级特征确定层确定所述多个片段中的第一个片段的特征向量之前,插入虚拟片段;以及

由所述多级特征确定层确定所述虚拟片段的特征向量,并且,

其中,所述由所述多级特征确定层确定所述多个片段中的第一个片段的特征向量包括:由当前级特征确定层,根据由所述当前级特征确定层针对所述虚拟片段确定的虚拟片段特征向量和由所述在前级特征确定层针对所述第一个片段确定的在前级特征向量,确定针对所述第一个片段的当前级特征向量,

其中,所述多个参数化模型包括针对较低级特征确定层的第一参数化模型和针对较高级特征确定层的第二参数化模型,其中,所述第一参数化模型和所述第二参数化模型是不同配置的,所述第一参数化模型被配置为具有较少的参数,且所述第二参数化模型被配置为具有比所述第一参数化模型更多的参数。

2.根据权利要求1所述的方法,其中,所述确定针对所述一个片段的当前级特征向量包括:

由第q级特征确定层针对第p个片段,根据由第q级特征确定层针对第p-1个片段确定的在前片段特征向量和由第q-1级特征确定层针对第p个片段确定的在前级特征向量,确定第p个片段的当前级特征向量,其中1<p≤M且1<q≤N,M为多个片段的数目,N为特征确定层的数目。

3.根据权利要求1所述的方法,其中,所述多个片段是顺序排列的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110746978.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top