[发明专利]信息处理方法及装置在审

专利信息
申请号: 202110693581.1 申请日: 2021-06-22
公开(公告)号: CN113515946A 公开(公告)日: 2021-10-19
发明(设计)人: 宋寒风;黄海荣;李林峰 申请(专利权)人: 湖北亿咖通科技有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/216;G06F16/35;G06N3/04
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 张文华
地址: 310000 浙江省杭州市滨江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息处理 方法 装置
【说明书】:

本申请公开了一种信息处理方法及装置。其中,该方法包括:获取待处理文本信息;将文本信息转换为词向量,并依据词向量确定隐藏状态特征向量;依据隐藏状态特征向量确定文本信息中每个字对应的意图标签,依据每个字对应的意图标签确定文本信息对应的至少一个意图;依据隐藏状态特征向量确定文本信息中每个字对应的命名实体标签,依据每个字对应的命名实体标签确定文本信息中的命名实体;依据至少一个意图及命名实体确定文本信息所表达的内容。本申请解决了相关技术中处理存在多个意图的信息时需要引入额外的断句网络,会浪费存储空间和运行内存且存在处理延时的技术问题。

技术领域

本申请涉及计算机技术领域,具体而言,涉及一种信息处理方法及装置。

背景技术

在车机NLP(Natural Language Processing,自然语言处理)中,一般采用神经网络分类模型和NER(Named Entity Recognition,命名实体识别)模型对输入的文本信息进行相关处理,通常,分类模型和NER模型是两个独立的模型,其中,分类模型用于意图识别,NER模型通过词槽提取实现命名实体识别。

当一句话中存在多个意图时,现有方案是通过引入具有断句功能的神经网络,先将这句话分成多段独立的句子,然后分别对每段句子进行意图识别和命名实体识别,但由于处理时增加了网络尺寸,就需要更大的存储空间和运行内存,同时还增加了处理延时。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种信息处理方法及装置,以至少解决相关技术中处理存在多个意图的信息时需要引入额外的断句网络,会浪费存储空间和运行内存且存在处理延时的技术问题。

根据本申请实施例的一个方面,提供了一种信息处理方法,包括:获取待处理文本信息;将所述文本信息转换为词向量,并依据所述词向量确定隐藏状态特征向量;依据所述隐藏状态特征向量确定所述文本信息中每个字对应的意图标签,依据所述每个字对应的意图标签确定所述文本信息对应的至少一个意图;依据所述隐藏状态特征向量确定所述文本信息中每个字对应的命名实体标签,依据所述每个字对应的命名实体标签确定所述文本信息中的命名实体;依据所述至少一个意图及所述命名实体确定所述文本信息所表达的内容。

可选地,将所述文本信息输入目标信息处理模型中的特征提取网络;通过所述特征提取网络中的输入层将所述文本信息中的每个字进行独热编码处理,得到预设长度的第一数组,所述第一数组中的元素表示所述文本信息中各个字的索引;将所述第一数组输入所述特征提取网络中的字嵌入层,由所述字嵌入层输出得到所述词向量;将所述词向量输入所述特征提取网络中的双向长短期记忆网络,由所述双向长短期记忆网络输出得到所述隐藏状态特征向量,所述隐藏状态特征向量用于确定所述文本信息中每个字对应的标签信息,其中,所述标签信息包括所述意图标签及所述命名实体标签。

可选地,将所述隐藏状态特征向量输入目标信息处理模型中的意图识别网络;通过所述意图识别网络中的第一全连接层输出得到第一向量,所述第一向量用于表示所述文本信息中每个字映射到多种意图标签的概率信息;将所述第一向量输入所述意图识别网络中的第一条件随机场,由所述第一条件随机场通过维特比解码算法将所述第一向量转换为第二数组,所述第二数组用于表示所述文本信息中每个字对应的意图标签。

可选地,通过所述第一条件随机场确定所述第一向量对应的多条链路,其中,每条链路由多个节点组成,每个所述节点表示所述文本信息中一个字映射为一种意图标签时的概率值;由所述维特比解码算法依据状态转移矩阵确定所述多条链路中值最大的目标链路,并依据所述目标链路确定所述第二数组。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北亿咖通科技有限公司,未经湖北亿咖通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110693581.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top