[发明专利]文本分类方法、装置及处理器有效
申请号: | 201310308226.3 | 申请日: | 2013-07-22 |
公开(公告)号: | CN103345525A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 李寿山;高伟;周国栋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 方法 装置 处理器 | ||
1.一种文本分类方法,其特征在于,包括:
获取分类器,所述分类器包括:情感分类器和情绪分类器;
获取待分类文本的情感测试样本和情绪测试样本,根据所述分类器,对所述情感测试样本和情绪测试样本进行分类,并获取所述情感测试样本和情绪测试样本分别属于各个情感类别和各个情绪类别的初始概率;
选取情感测试样本和情绪测试样本作为共同样本,并获取所述共同样本的联合概率,所述联合概率包括:情感联合概率,和/或情绪联合概率,其中,所述情感联合概率p(si|ej)表示:某个样本的情绪类别为ej的情况下,其情感类别为si的概率,所述情绪联合概率p(ei|sj)表示:某个样本的情感类别为sj的情况下,其情绪类别为ei的概率;
对所述初始概率和联合概率进行加权求和,并根据加权求和的结果获取待分类文本所属的情感类别,和/或情绪类别。
2.根据权利要求1所述的方法,其特征在于,对所述初始概率和联合概率进行加权求和,并根据加权求和的结果获取待分类文本所属的情感类别,包括:
根据所述共同样本的初始概率和情感联合概率,获取各个共同样本的情感转移概率,其中,获取所述情感转移概率的算法为:
其中,p(ej|X)为共同样本X属于各类情绪类别的初始概率,p(si|ej)为情感联合概率,即为某个共同样本的情绪类别为ej时,情感类别为si的概率,Ne为情绪分类的情绪类别个数,ptransfer(si|X)为样本X的情感转移概率;
根据所述情感转移概率,获取各个共同样本的最终情感概率,其中,获取所述最终情感概率的算法为:
pjoint(si|X)=(1-λ)p(si|X)+λptransfer(si|X);
其中,p(si|X)为样本X属于各类情感类别的概率,ptransfer(si|X)为样本X的情感转移概率,λ为设定的权重参数,pjoint(si|X)为最终情感概率;
获取所述共同样本中,最终情感概率的值最大的共同样本,将其作为情感标定样本,并确定所述情感标定样本所属的情感类别为所述待分类文本所属的情感类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310308226.3/1.html,转载请声明来源钻瓜专利网。