[发明专利]一种信息识别方法及装置在审
申请号: | 202110334254.7 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113204972A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 张东海;卓雷 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/205;G06F40/295 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 周伟 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息 识别 方法 装置 | ||
1.一种信息处理方法,所述方法包括:
接收待处理信息;
对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;
根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;
基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;
根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。
2.根据权利要求1所述的方法,基于所述目标意图信息和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:
根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量;
对所述输入特征向量进行槽位信息提取,得到所述第二槽位集。
3.根据权利要求2所述的方法,所述输入特征向量包括所述待处理信息包括的字的字向量、位置向量和槽位标签向量;
相应的,所述根据所述第一槽位集,对所述待处理信息进行特征提取,得到第二次槽位特征提取的输入特征向量,包括:
根据所述第一槽位集包括的第一槽位标签信息,确定所述待处理信息包括的字的槽位标签向量;
确定所述待处理信息的字的字向量和位置向量;
其中,所述位置向量用于示出所述待处理信息中的每一个字在所述待处理信息中的位置。
4.根据权利要求2所述的方法,对所述输入特征向量进行槽位信息提取,得到所述待处理信息包括的第二槽位集,包括:
对所述输入特征向量进行拼接,得到拼接向量;
对所述拼接向量进行降维处理,得到编码向量;
对所述待处理信息进行语义分析,得到语义分析结果;
根据所述语义分析结果,确定所述待处理信息的字的语义向量
根据所述目标意图,确定所述待处理信息的字的意图向量;
对所述编码向量、所述语义向量和所述意图向量进行归一化处理,得到所述待处理信息包括的第二槽位集。
5.根据权利要求4所述的方法,所述对所述待处理信息进行语义分析,得到语义分析结果,包括:
对所述待处理信息进行句法构造和依存关系分析中的至少之一,得到所述语义分析结果。
6.根据权利要求1所述的方法,在基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取之前,所述方法还包括:
获取若干个训练语料,所述训练语料包括语句内容、所述语句内容的意图信息和槽位标签信息;
根据所述语句内容、所述意图信息和所述槽位标签信息,训练第一槽位信息提取模型,以对所述待处理信息进行第一次槽位信息提取。
7.根据权利要求6所述的方法,所述方法还包括:
对所述槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果;
根据所述语句内容、所述意图标注结果和所述槽位标注结果,训练第二槽位信息提取模型,以对所述待处理信息进行第二次槽位信息提取。
8.根据权利要求7所述的方法,对所述槽位标签信息的至少部分槽位标签进行模糊化处理,得到槽位标注结果,包括:
采用随机抽取的方式,对所述槽位标签信息中的至少部分标签进行掩蔽处理,得到所述槽位标注结果。
9.根据权利要求1-8中任一项所述的方法,所述根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果,包括:
对所述第一槽位集和所述槽位集进行合并,得到槽位标签集合和槽位词汇集合;
对所述槽位标签集合和所述槽位词汇集合进行去重处理,得到所述信息识别结果。
10.一种信息识别装置,所述装置包括:
接收模块,用于接收待处理信息;
意图识别模块,用于对所述待处理信息进行意图识别,得到所述待处理信息的目标意图;
第一提取模块,用于根据所述目标意图,对所述待处理信息进行第一次槽位信息提取,得到所述待处理信息包括的第一槽位集;
第二提取模块,用于基于所述目标意图和所述第一槽位集,对所述待处理信息进行第二次槽位信息提取,得到所述待处理信息包括的第二槽位集;
信息处理模块,用于根据所述第一槽位集和所述第二槽位集,确定所述待处理信息的信息识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110334254.7/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置