[发明专利]一种文本意图分类方法有效
申请号: | 201710665483.0 | 申请日: | 2017-08-07 |
公开(公告)号: | CN109388705B | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 陈见耸;王昊;沈磊;高鹏 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30 |
代理公司: | 北京中原华和知识产权代理有限责任公司 11019 | 代理人: | 寿宁 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 意图 分类 方法 | ||
本发明公开了一种文本意图分类方法,属于语义理解技术领域;包括预先根据训练集训练得到一关键信息抽取器;预先根据关键信息抽取器和训练语句训练得到一意图分类器;文本意图分类方法还包括:获取一待分类的真实语句;采用关键信息抽取器抽取真实语句中的关键信息;根据抽取的关键信息依照真实语句中的每个字生成对应的标签特征;将真实语句与标签特征送入意图分类器中处理得到一意图分类结果;根据文本意图进行后续的语义理解过程。上述技术方案的有益效果是:弥补短文本信息不足的问题,能够根据句子结构分析出句子中的关键信息,并以此为特征缓解分类空间的复杂度问题,从而提升文本意图分类的准确率。
技术领域
本发明涉及语义理解技术领域,尤其涉及一种文本意图分类方法。
背景技术
人机交互技术是一种使用某种对话语言,以一定的交互方式,完成确定任务的人与计算机之间的信息交换技术。随着科技的发展,人机交互技术越来越多地被应用到日常的工作和生活中。
传统的人机交互技术是通过人机交互界面实现的,传统的人机交互界面通常仍然采用最常见的交互指令输入方式来进行,即键鼠输入方式。用户通过键盘和鼠标等常用的输入设备输入交互指令来命令计算机执行相应的操作。
随着语音识别技术的发展,越来越多的人机交互技术采用语音交互的方式进行。用户通过语音输入设备(例如麦克风)输入语音,经过语音识别技术转换成相应的交互指令来命令计算机执行相应的操作。由于自然语言交互天然的友好性和便捷性,基于口语自然语言的人机对话交互方式逐渐成为人机交互技术的主流趋势。
对于上述人机对话交互方式而言,语义理解技术是其中的核心技术,其负责将用户的自然语言转换为计算机可理解的结构化数据。语义理解技术需要先检测用户自然语言的意图,再在用户的意图下进行语义理解和识别才能得到较好的识别效果。现有技术的语义理解技术中,对于用户语言意图的检测通常并不准确,因此会出现后续语义识别不准确导致无法转换形成正确的控制指令的问题,导致人机对话交互无法顺畅进行。
发明内容
根据现有技术中存在的上述问题,现提供一种文本意图分类方法的技术方案,旨在弥补短文本信息不足的问题,能够根据句子结构分析出句子中的关键信息,并以此为特征缓解分类空间的复杂度问题,从而提升文本意图分类的准确率。
上述技术方案具体包括:
一种文本意图分类方法,适用于语义理解过程中;其中,预先设置多个包括不同的文本意图的语言意图领域,并预先确定每个所述语言意图领域中的关键信息,以及针对不同的语言意图领域分别预先设置包括多个训练语句的训练集;
预先根据所述训练集训练得到一关键信息抽取器,所述关键信息抽取器用于抽取每个所述训练语句中的所述关键信息;以及
预先根据所述关键信息抽取器和所述训练语句训练得到一意图分类器;
所述文本意图分类方法还包括:
步骤S1,获取一待分类的真实语句;
步骤S2,采用训练好的所述关键信息抽取器抽取所述真实语句中的所述关键信息;
步骤S3,根据抽取的所述关键信息,依照所述真实语句中的每个字分别生成对应的标签特征;
步骤S4,将所述真实语句与所有所述标签特征送入训练好的所述意图分类器中处理得到一意图分类结果,所述意图分类结果用于表示所述真实语句的所述文本意图;
步骤S5,根据所述文本意图进行后续的所述语义理解过程。
优选的,该文本意图分类方法,其中,在预先确定每个所述语言意图领域中的关键信息后,分别在所述训练集中的每个所述训练语句中预先标注出每个所述关键信息的位置;
则预先训练所述关键信息抽取器的步骤具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710665483.0/2.html,转载请声明来源钻瓜专利网。