[发明专利]一种使用Boosting训练集成SVM的方法、装置、终端及存储介质在审

申请号：	202010684266.8	申请日：	2020-07-16
公开（公告）号：	CN111860635A	公开（公告）日：	2020-10-30
发明（设计）人：	苑晓龙;张峻旗;刘牧	申请（专利权）人：	浪潮云信息技术股份公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	济南信达专利事务所有限公司 37100	代理人：	冯春连
地址：	250100 山东省济南市高***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种使用 boosting 训练集成 svm 方法装置终端存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种使用Boosting训练集成SVM的方法，其特征在于,该方法使用Boosting，对训练数据集包含的多个训练子集进行依次取样，利用标准形式的SVM进行多次迭代，以对分类错误的样本加大权重，同时完成标准SVM中参数W和B的更新，在权重达到设定阈值，标准SVM基于训练数据集包含的多个训练子集进行多次迭代后，得到具有更新参数W和B的集成SVM。

2.根据权利要求1所述的一种使用Boosting训练集成SVM的方法，其特征在于，该方法的实现流程包括：

步骤S10、获取训练数据集D，将训练数据集D随机均分为多个训练子集，每个训练子集的大小为M；

步骤S20、用均匀分布初始化一个长度为N的概率向量P，同时，初始化迭代次数iter，初始化标准形式的SVM所包含的参数W和B，使迭代次数iter、参数W和B三者均等于0；

步骤S30、按照逐次加1的方式更新迭代次数iter；

步骤S40、从训练数据集D中取样大小为M的训练子集，并获取所取样训练子集在训练数据集D中的索引S；

步骤S50、针对所取样的训练子集，利用标准形式的SVM计算本次迭代过程的参数W_i和B_i；

步骤S60、基于训练数据集D、训练子集的大小M、训练子集在训练数据集D中的索引S、概率向量P，以及本次迭代得到的参数W_i和B_i，计算本次迭代过程的权重α_i；

步骤S70、以W＝W_i+α_iW_i，B＝B_i+α_iB_i的方式更新标准SVM中的参数W和B；

步骤S80、使用参数W和B对所取样训练子集进行分类，根据分类结果更新概率向量P；

步骤S90、判断步骤S60计算得到的权重α_i是否小于设定数值0.5，若是，则返回步骤S30继续迭代，若否，则输出W和B，该W和B为集成SVM的参数。

3.根据权利要求2所述的一种使用Boosting训练集成SVM的方法，其特征在于，步骤S10中获取的训练数据集D包含N个d维向量x_j，还包含与d维向量x_j相对应的标签y_j；

N个d维向量x_j随机均分到多个训练子集中，P[j]表示d维向量x_j从训练数据集D中被取样的概率，其中，j表示取值范围内的任意一个自然数。