[发明专利]一种话语意图识别方法、装置、设备及存储介质在审
申请号: | 201711458034.5 | 申请日: | 2017-12-28 |
公开(公告)号: | CN110019734A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 唐诗睿;吴东华;徐爽;高磊;刘志欣 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06N3/04 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 赵奕 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图识别 话语 语义向量 词向量 存储介质 记忆网络 用户话语 输出 申请 | ||
本申请公开了一种话语意图识别方法及装置。所述方法包括:包括:将用户话语转变为词向量;将所述词向量逐一输入长短期记忆网络(简称LSTM)模型中,生成中间语义向量;通过softmax函数对所述中间语义向量进行变换,得到话语意图识别结果并输出。该方法能够准确高效地对话语意图进行识别。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种话语意图识别方法及装置。
背景技术
在物流领域中,每天客服需要处理大量重复的客户问题,存在人力成本的极大浪费。但目前,自然语言识别的研究大多用于人工智能,例如聊天机器人等领域,尚未有针对物流行业的能够将大量重复的客户问题进行分类、归纳并读取的快速有效的方法。为了降低企业的人力成本,开发一种自然语言识别方法十分必要。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种快速有效的话语意图识别方法及装置。
第一方面,本申请实施例提供了一种话语意图识别方法,包括:将用户话语转变为词向量;将所述词向量逐一输入长短期记忆网络(简称LSTM)模型中,生成中间语义向量;通过softmax函数对所述中间语义向量进行变换,得到话语意图识别结果并输出。
第二方面,本申请实施例提供了一种用于话语意图识别的装置,包括:用户话语转变单元,配置用于将用户话语转变为词向量;中间语义生成单元,配置用于将所述词向量逐一输入长短期记忆网络(简称LSTM)模型中,生成中间语义向量;话语意图识别单元,配置用于通过softmax函数对所述中间语义向量进行变换,得到话语意图识别结果并输出。
本申请实施例提供的话语意图识别方案,通过将输入的字符转化为词向量传入LSTM模型,通过特定函数计算得到语义表示函数,再通过Softmax将语义表示函数变换得到话语意图函数。根据预先设定的话语意图种类对大量自然语言进行高效准确的识别、归纳。此外,本申请还利用attention模型对词向量的注意力大小进行分配,从而使整个话语意图识别过程不再需要将完整的原文句子编码为固定长度的向量,可以允许解码器在每一步输出时“参与(attend)”到原文的不同部分,大大提高了长句话语意图识别的准确性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了根据本申请实施例的用于话语意图识别的示例性流程图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
诚如背景技术所述的,目前对自然语言识别领域的研究还没有提出解决物流行业客服处理大量重复的问题的行之有效的技术方案。针对这一问题,本申请实施例提供了一种话语意图识别方案,通过使用LSTM+attention算法对用户话语数据进行建模,以识别用户话语意图。
整体的LSTM+attention算法模型的具体算法原理如下:
首先输入向量逐一传入到LSTM模型中,根据如下公式计算得出下一节点值.ht
ht=f(Wn,ht-1)
其中,Wn为生成的词向量;
f为流程函数,具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711458034.5/2.html,转载请声明来源钻瓜专利网。