[发明专利]基于改进XGBoost算法的意图识别方法及装置有效

申请号：	201910487948.7	申请日：	2019-06-05
公开（公告）号：	CN110222339B	公开（公告）日：	2023-04-28
发明（设计）人：	姜伟敏	申请（专利权）人：	深圳市思迪信息技术股份有限公司
主分类号：	G06F40/30	分类号：	G06F40/30;G06F40/289;G06F16/35
代理公司：	深圳市欣亚知识产权代理事务所(普通合伙) 44621	代理人：	葛勤;程光慧
地址：	518000 广东省深圳市南山区粤海***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于改进XGBoost算法的意图识别方法，采用Scikit‑learn算法中CountVectorizer和TfidfVectorizer类提取文本特征，然后生成训练集；待对训练样本完成训练之后，保存训练模型参数countVectorizer和tfidfVectorizer，作为中间件存储于本地，然后将训练后的样本信息输送至XGBoost模型进行意图训练，直至达到损失函数条件，终止模型训练，最终将XGBoost训练后模型自动存储于本地；将训练好模型对用户的语句进行意图识别。本发明将训练countVectorizer和tfidfVectorizer中间件存储于本地，便于程序本地化加载运行，根据训练文本数据特征间相互关联关系，直接对用户数据进行处理，从而降低系统开销，提高运行效率；将XGBoost训练后模型自动存储于本地，便于运行加载训练好的模型，复用率高。
搜索关键词：	基于改进 xgboost 算法意图识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于改进XGBoost算法的意图识别方法，其特征在于：包括以下步骤，S10、通过自定义词库对原始文本数据进行分词，分词结果通过停用词词库进行过滤，得到初始化数据；S20、对Scikit‑learn算法中的CountVectorizer函数和TfidfVectorizer函数通过输入初始化数据进行训练；S30、将训练后的特征函数countVectorizer和tfidfVectorizer进行本地化存储，形成本地中间件，保留文本数据特征间相互关联关系，形成XGBoost模型初始数据；S40、将XGBoost模型初始数据，经过XGBoost模型中梯度增强算法进行模型训练，得到基于XGBoost与Scikit‑learn算法意图识别模型；S50、将训练后的XGBoost模型进行本地化存储；S60、基于XGBoost与Scikit‑learn算法意图识别模型，对用户输入的语句进行意图识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市思迪信息技术股份有限公司，未经深圳市思迪信息技术股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910487948.7/，转载请声明来源钻瓜专利网。

上一篇：一种机构名实体识别方法
下一篇：书籍人物姓名识别模型的训练方法、电子设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于改进XGBoost算法的意图识别方法及装置有效

专利文献下载