[发明专利]文档情感的判断方法和装置有效
| 申请号: | 201611256003.7 | 申请日: | 2016-12-29 |
| 公开(公告)号: | CN108255803B | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 赵钰 | 申请(专利权)人: | 北京国双科技有限公司 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/216;G06F16/35 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
| 地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 情感 判断 方法 装置 | ||
1.一种文档情感的判断方法,其特征在于,包括:
对文档进行语句识别,得到多条语句;
提取出多条所述语句中包括的所有评价对象,其中,所述评价对象为所述文档内容的主体对象;
基于每条所述语句包括的所有所述评价对象以及该条语句中每个所述评价对象对应的情感词,得到该条语句对应于其包括的每个所述评价对象的分值;
基于每条所述语句对应于其包括的每个所述评价对象的分值得到所述文档对应于每个所述评价对象的情感类型,其中,所述情感类型至少包括如下之一:正面情感、中立情感,负面情感;
其中,所述基于每条所述语句对应于其包括的每个所述评价对象的分值得到所述文档对应于每个所述评价对象的情感类型包括:
对每条所述语句对应于其包括的每个所述评价对象的分值进行加权,并对加权后的每条所述语句对应于其包括的每个所述评价对象的分值进行累加,得到所述文档对应于每个所述评价对象的总分值;
基于所述文档中每个所述评价对象的总分值以及预先设置的分值范围与情感类型间的对应关系,确定出所述文档对应于每个所述评价对象的情感类型;
其中,所述基于每条所述语句包括的所有所述评价对象以及该条语句中每个所述评价对象对应的情感词,得到该条语句对应于其包括的每个所述评价对象的分值包括:
判断每条所述语句是否包含至少一个所述评价对象;
若包含,则提取该条语句中每个所述评价对象对应的所有情感词;
根据该条语句中每个所述评价对象对应的每个所述情感词的情感类型,得到该条语句对应于每个所述评价对象的分值;
所述根据该条语句中每个所述评价对象对应的每个所述情感词的情感类型,得到该条语句对应于每个所述评价对象的分值包括:
根据该条语句中每个所述评价对象对应的每个所述情感词的情感类型,得到该条语句中每个所述评价对象对应于每个所述情感词的分值;
对该条语句中每个所述评价对象对应的所有所述情感词的分值进行累加,得到该语句对应于每个所述评价对象的分值。
2.根据权利要求1所述的方法,其特征在于,所述根据该条语句中每个所述评价对象对应的每个所述情感词的情感类型,得到该条语句中每个所述评价对象对应于每个所述情感词的分值包括:
如果该条语句中每个所述评价对象对应的每个所述情感词的情感类型为所述正面情感,则确定该条语句中每个所述评价对象对应于该情感词的分值为第一预设值;
如果该条语句中每个所述评价对象对应的每个所述情感词的情感类型为所述中立情感,则确定该条语句中每个所述评价对象对应于该情感词的分值为第二预设值;
如果该条语句中每个所述评价对象对应的每个所述情感词的情感类型为所述负面情感,则确定该语句中每个所述评价对象对应于该情感词的分值为第三预设值。
3.根据权利要求1所述的方法,其特征在于,如果任意一条所述语句不包含任意一个所述评价对象,则确定该语句对应于其包括的每个所述评价对象的分值为第四预设值。
4.根据权利要求1所述的方法,其特征在于,所述基于所述文档中每个所述评价对象的总分值以及预先设置的分值范围与情感类型间的对应关系,确定出所述文档对应于每个所述评价对象的情感类型包括:
基于每个所述评价对象的总分值以及该评价对象对应的所有情感词的个数,确定该评价对象的平均分值;
确定每个所述评价对象的平均分值所处的分值范围;
根据所述预先设置的分值范围与情感类型间的对应关系以及每个所述评价对象的平均分值所处的分值范围,确定出每个所述评价对象对应的情感类型;
将每个所述评价对象对应的情感类型作为所述文档对应于每个所述评价对象的情感类型。
5.一种文档情感的判断装置,其特征在于,包括:
识别单元,用于对文档进行语句识别,得到多条语句;
提取单元,用于提取出多条所述语句中包括的所有评价对象,其中,所述评价对象为所述文档内容的主体对象;
第一处理单元,用于基于每条所述语句包括的所有所述评价对象以及该条语句中每个所述评价对象对应的情感词,得到该条语句对应于其包括的每个所述评价对象的分值;
第二处理单元,用于基于每条所述语句对应于其包括的每个所述评价对象的分值得到所述文档对应于每个所述评价对象的情感类型,其中,所述情感类型包括如下之一:正面情感、中立情感,负面情感;
其中,所述第二处理单元还用于对每条所述语句对应于其包括的每个所述评价对象的分值进行加权,并对加权后的每条所述语句对应于其包括的每个所述评价对象的分值进行累加,得到所述文档对应于每个所述评价对象的总分值;
用于基于所述文档中每个所述评价对象的总分值以及预先设置的分值范围与情感类型间的对应关系,确定出所述文档对应于每个所述评价对象的情感类型;
其中,所述第一处理单元包括:
判断模块,用于判断每条所述语句是否包含至少一个评价对象;
提取模块,用于若包含,则提取该条语句中每个所述评价对象对应的所有情感词;
处理模块,用于根据该条语句中每个所述评价对象对应的每个所述情感词的情感类型,得到该条语句对应于每个所述评价对象的分值;
所述处理模块包括:
第一处理子模块,用于根据该条语句中每个所述评价对象对应的每个所述情感词的情感类型,得到该条语句中每个所述评价对象对应于每个所述情感词的分值;
累加子模块,用于对该条语句中每个所述评价对象对应的所有所述情感词的分值进行累加,得到该语句对应于每个所述评价对象的分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611256003.7/1.html,转载请声明来源钻瓜专利网。





