[发明专利]一种应用于移动设备的样本训练方法及装置无效
申请号: | 201310230812.0 | 申请日: | 2013-06-09 |
公开(公告)号: | CN103324610A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 李寿山;高伟;周国栋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 移动 设备 样本 训练 方法 装置 | ||
技术领域
本发明涉及信息处理领域,特别是一种应用于移动设备的样本训练方法及装置。
背景技术
随着互联网的迅猛发展,人们越来越习惯于在网络上表达自己的观点,从而使网络上涌现出大量带情感的文本。这些倾向性文本往往以商品评论、论坛评论和博客的形式存在。这些文本往往是关键文本,或者是用户感兴趣的文本。
所谓文本倾向性分析,就是对说话人的态度(或称观点、情感)进行分析,也就是对文本中的主观性信息进行分析。情感分类(Sentiment Classification)是情感分析中的一个基本任务。该任务旨在将文本按照情感倾向进行褒贬分类。与传统基于主题的文本分类相比,情感分类被认为更具有挑战性。该任务具体是指将文本分为正面文本或者负面文本的任务。例如:“我很喜欢这部电影”,通过情感分类,这句话将被分为正面文本,而“这个电影很差劲”,被分类为负面文本。
目前,利用机器学习的监督分类方法中的训练过程,往往需要人工标注一定规模的正负样本。这种方法的分类准确率比较高,但是随着训练样本数目的增加,特征数目也随之大幅度地提高,分类过程中需要占用大量的内存空间,对于移动终端设备往往受到内存容量的限制,很难进行文本分类的任务。
发明内容
本发明提供一种应用于移动设备的样本训练方法及装置,以解决现有技术中由于移动设备内存小,而无法进行文本分类的问题。
具体技术方案如下:
一种应用于移动设备的样本训练方法,所述方法包括:
提取预设样本中的全部特征值;
按照预设规则将所述全部特征值进行分解,得到至少一个特征值子空间;
对每个所述特征值子空间进行机器学习分类方法的训练,得到每个所述特征值子空间对应的基分类器。
优选地,还包括:
利用所述基分类器对待分类样本进行分类,得到每个所述基分类器对应的分类结果,其中,所述分类结果可以是褒义性质的第一分类结果和贬义性质第二分类结果;
将所述褒义性质的第一分类结果和所述贬义性质第二分类结果分别利用融合规则进行融合,得到褒义性质第一融合结果和贬义性质第二融合结果;
判断所述褒义性质第一融合结果是否大于所述贬义性质第二融合结果,如果是,则得到所述待分类样本为褒义的结果,如果否,则得到所述待分类样本为贬义的结果。
优选地,所述提取预设样本中的全部特征值的过程包括:
使用特征值提取方法提取出预设样本中的全部特征值。
优选地,所述按照预设规则将所述全部特征值进行分解,得到至少一个特征值子空间的过程包括:
采用平均划分或者随机提取的方式将所述全部特征值进行分解,得到至少一个特征值子空间。
优选地,所述对每个所述特征值子空间进行机器学习分类方法的训练,得到每个所述特征值子空间对应的基分类器的过程包括:
对每个所述特征值子空间使用相同的机器学习分类方法或者是不同的机器学习分类方法进行训练,得到每个所述特征值子空间对应的基分类器。
优选地,所述将所述褒义性质第一分类结果和所述贬义性质第二分类结果分别利用融合规则进行融合,得到褒义性质第一融合结果和贬义性质第二融合结果的过程包括:
将所述褒义性质第一分类结果和所述贬义性质第二分类结果分别利用贝叶斯融合规则进行融合,得到褒义性质第一融合结果和贬义性质第二融合结果。
一种应用于移动设备的样本训练装置,所述装置包括:提取模块、分解模块和训练模块;
其中,所述提取模块用于,提取预设样本中的全部特征值;
所述分解模块用于,按照预设规则将所述全部特征值进行分解,得到至少一个特征值子空间;
所述训练模块用于,对每个所述特征值子空间进行机器学习分类方法的训练,得到每个所述特征值子空间对应的基分类器。
优选地,还包括:分类模块、融合模块和判断模块;
其中,所述分类模块用于,利用所述基分类器对待分类样本进行分类,得到每个所述基分类器对应的分类结果,其中,所述分类结果可以是褒义性质第一分类结果和贬义性质第二分类结果;
所述融合模块用于,将所述褒义性质第一分类结果和所述贬义性质第二分类结果分别利用融合规则进行融合,得到褒义性质第一融合结果和贬义性质第二融合结果;
所述判断模块用于,判断所述褒义性质第一融合结果是否大于所述贬义性质第二融合结果,如果是,则得到所述待分类样本为褒义的结果,如果否,则得到所述待分类样本为贬义的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310230812.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于电子印迹的视频检测方法及系统
- 下一篇:清理内存的方法和移动终端