[发明专利]一种融合了主题信息的多意图识别方法和系统在审
申请号: | 202111465255.1 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114154492A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 饶璐;孙锐;展华益 | 申请(专利权)人: | 四川启睿克科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/216;G06F40/151;G06F40/30;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 吴中伟 |
地址: | 610000 四川省成都市中国(四川)*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 主题 信息 意图 识别 方法 系统 | ||
本发明涉及自然语言处理和深度学习技术领域,为了提高多意图识别的准确度,提供了一种融合了主题信息的多意图识别方法,包括:1、获取用户的输入文本并对其进行规范化处理得到处理文本;2、获取处理文本中基于句子的主题信息和基于词的主题信息;3、将处理文本与所述基于句子的主题信息进行融合;4、将步骤3中融合后的文本及基于词的主题信息分别转化为向量表示;5、构建意图识别模型并训练;6、将步骤4中转化得到的向量表示输入意图识别模型,得到意图分类结果。一种融合了主题信息的多意图识别系统,包括:文本获取单元、主题获取单元、主题融合单元、向量转换单元及意图分类单元。采用上述结构提高了多意图识别的准确度。
技术领域
本发明涉及自然语言处理和深度学习技术领域,具体是一种融合了主题信息的多意图识别方法和系统。
背景技术
意图识别一直以来都是自然语言理解任务中至关重要的一个环节,随着人工智能技术在自然语言领域的不断发展和应用,越来越多的研究人员开始关注意图识别模块的性能提升。意图识别的定义是让机器理解用户的意图,帮助用户完成特定任务,为用户带来个性化的服务体验。在搜索引擎中,意图识别被用于识别用户输入内容的搜索意图,系统再根据搜索意图优先返回用户想要的结果,此场景下往往是单意图识别任务。在自动对话系统当中,意图识别被用于识别用户的对话目的,对话系统在了解了用户意图后,将匹配相应的子模型来进行处理,此场景下用户通常会表达多种意图。足以见得,意图识别模块在各种应用场景中都是一个不可或缺的上游任务,这个上游任务的准确性直接影响到后续任务甚至整个系统的性能效果。
早期的意图识别任务采用较简单的词表穷举法,通过将句子中的单词与词表进行匹配的方式来获取用户意图,但是这种方法需要大量的人工参与工作,对词表容量和更新速度要求较高,很难实现自动化预测。其次,比较简单的方法叫规则解析法,通过规则来判断句子的意图,这类方法对查询语句的规范化要求较高,且需要大量人工参与规则的制定。
基于统计的意图识别方法在一定程度上缓解了传统方法需要较多人工参与的问题,不过对数据量的要求较高,数据量越大,预测效果越好。深度学习模型的出现让意图识别任务的准确率有了进一步的提升,但是深度学习模型对数据标注的准确性要求较高。
综上所述,现有意图识别模型存在以下几点问题:
1、大部分意图识别模型对训练样本的语义规范性要求较高,但实际的对话过程中,用户的表达往往由于过于口语化导致用语不规范的问题。
2、目前效果较好的意图识别模型多用于识别单意图,当运用到多标签意图识别任务上的时候效果就会变差。
3、大多数意图识别模型都比较依赖庞大的训练数据和准确的标注结果,一旦训练数据不足,模型效果将会有明显下降,数据标签的准确性也对模型的训练有很大的影响。
发明内容
为了提高多意图识别的准确度,本申请提供了一种融合了主题信息的多意图识别方法和系统。
本发明解决上述问题所采用的技术方案是:
一种融合了主题信息的多意图识别方法,包括:
步骤1、获取用户的输入文本并对其进行规范化处理得到处理文本;
步骤2、获取处理文本中基于句子的主题信息和基于词的主题信息;
步骤3、将处理文本与所述基于句子的主题信息进行融合;
步骤4、将步骤3中融合后的文本及基于词的主题信息分别转化为向量表示;
步骤5、构建意图识别模型并训练;
步骤6、将步骤4中转化得到的向量表示输入意图识别模型,得到意图分类结果。
进一步地,所述步骤2具体为:
步骤21、构建主题模型并训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川启睿克科技有限公司,未经四川启睿克科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111465255.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置