[发明专利]一种文本意图分类方法有效
申请号: | 201710665483.0 | 申请日: | 2017-08-07 |
公开(公告)号: | CN109388705B | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 陈见耸;王昊;沈磊;高鹏 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30 |
代理公司: | 北京中原华和知识产权代理有限责任公司 11019 | 代理人: | 寿宁 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本意图分类方法,属于语义理解技术领域;包括预先根据训练集训练得到一关键信息抽取器;预先根据关键信息抽取器和训练语句训练得到一意图分类器;文本意图分类方法还包括:获取一待分类的真实语句;采用关键信息抽取器抽取真实语句中的关键信息;根据抽取的关键信息依照真实语句中的每个字生成对应的标签特征;将真实语句与标签特征送入意图分类器中处理得到一意图分类结果;根据文本意图进行后续的语义理解过程。上述技术方案的有益效果是:弥补短文本信息不足的问题,能够根据句子结构分析出句子中的关键信息,并以此为特征缓解分类空间的复杂度问题,从而提升文本意图分类的准确率。 | ||
搜索关键词: | 一种 文本 意图 分类 方法 | ||
【主权项】:
1.一种文本意图分类方法,适用于语义理解过程中;其特征在于,预先设置多个包括不同的文本意图的语言意图领域,并预先确定每个所述语言意图领域中的关键信息,以及针对不同的语言意图领域分别预先设置包括多个训练语句的训练集;预先根据所述训练集训练得到一关键信息抽取器,所述关键信息抽取器用于抽取每个所述训练语句中的所述关键信息;以及预先根据所述关键信息抽取器和所述训练语句训练得到一意图分类器;所述文本意图分类方法还包括:步骤S1,获取一待分类的真实语句;步骤S2,采用训练好的所述关键信息抽取器抽取所述真实语句中的所述关键信息;步骤S3,根据抽取的所述关键信息,依照所述真实语句中的每个字分别生成对应的标签特征;步骤S4,将所述真实语句与所有所述标签特征送入训练好的所述意图分类器中处理得到一意图分类结果,所述意图分类结果用于表示所述真实语句的所述文本意图;步骤S5,根据所述文本意图进行后续的所述语义理解过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710665483.0/,转载请声明来源钻瓜专利网。