[发明专利]文本语义理解方法、装置和系统有效
| 申请号: | 201710112693.7 | 申请日: | 2017-02-28 |
| 公开(公告)号: | CN106897268B | 公开(公告)日: | 2020-06-02 |
| 发明(设计)人: | 刘也宽;胡加学;孙胜杰;王震 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 语义 理解 方法 装置 系统 | ||
1.一种文本语义理解方法,其特征在于,包括:
接收待语义理解的文本;
根据预先构建的深度残差网络模型,对所述待语义理解的文本进行语义理解,得到语义理解结果,其中,所述深度残差网络模型的拓扑结构中包括:辅助输入层,所述辅助输入层用于输入先验信息。
2.根据权利要求1所述的方法,其特征在于,对所述待语义理解的文本进行语义理解之前,所述方法还包括:
对所述待语义理解的文本进行预处理。
3.根据权利要求2所述的方法,其特征在于,还包括:构建深度残差网络模型,所述构建深度残差网络模型,包括:
收集训练文本,并对所述训练文本进行预处理,以及,获取所述训练文本的标注信息,所述标注信息包括语义理解结果;
确定深度残差网络模型的拓扑结构;
基于预处理后的训练文本、所述标注信息和所述拓扑结构进行模型训练,构建得到深度残差网络模型。
4.根据权利要求3所述的方法,其特征在于,当存在多任务时,所述模型训练基于多任务同步处理机制进行。
5.根据权利要求4所述的方法,其特征在于,所述模型训练时,通过对整体损失函数进行最小化确定模型参数,其中,所述整体损失函数为各个任务的损失函数的线性加权函数。
6.根据权利要求1所述的方法,其特征在于,所述辅助输入层包括:
输入部分,用于输入先验信息,并对先验信息进行向量化;
变换部分,用于对向量化后的先验信息进行向量变换。
7.根据权利要求1所述的方法,其特征在于,所述深度残差网络模型的拓扑结构中包括:注意力层,所述注意力层包括:
非线性变换部分,用于对输入矩阵进行非线性变换,得到非线性变换后的矩阵,所述输入矩阵由各个词组的词向量组成;
权重控制部分,用于采用预设向量分别与非线性变换后的矩阵中的各个词组的词向量做内积,得到控制向量;
权重分配部分,用于对所述控制向量进行权重分配,得到权重向量;
组合部分,用于采用所述权重向量对所述输入矩阵中不同词组的词向量进行线性组合,得到注意力层的输出。
8.根据权利要求1所述的方法,其特征在于,所述深度残差网络模型的拓扑结构中包括:残差单元层,所述残差单元层包括卷积层级联部分和捷径部分,所述卷积层级联部分包括多个相互级联的卷积层,所述捷径部分用于将输入直接或对输入进行线性变换后与卷积层级联部分的输出相加,再对相加后的值进行激活。
9.一种文本语义理解装置,其特征在于,包括:
接收模块,用于接收待语义理解的文本;
语义理解模块,用于根据预先构建的深度残差网络模型,对所述待语义理解的文本进行语义理解,得到语义理解结果,其中,所述语义理解模块采用的深度残差网络模型的拓扑结构中包括:辅助输入层,所述辅助输入层用于输入先验信息。
10.根据权利要求9所述的装置,其特征在于,还包括:
预处理模块,用于对所述待语义理解的文本进行预处理。
11.根据权利要求10所述的装置,其特征在于,还包括:用于构建深度残差网络模型的构建模块,所述构建模块具体用于:
收集训练文本,并对所述训练文本进行预处理,以及,获取所述训练文本的标注信息,所述标注信息包括语义理解结果;
确定深度残差网络模型的拓扑结构;
基于预处理后的训练文本、所述标注信息和所述拓扑结构进行模型训练,构建得到深度残差网络模型。
12.根据权利要求11所述的装置,其特征在于,所述构建模块在存在多任务时,基于多任务同步处理机制进行模型训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710112693.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文章缩略文意生成方法、装置及服务器
- 下一篇:一种论文价值评估方法





