[发明专利]构建情感词典的方法及装置有效
| 申请号: | 201510917819.9 | 申请日: | 2015-12-10 |
| 公开(公告)号: | CN106874275B | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 郭向前 | 申请(专利权)人: | 北京新媒传信科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
| 代理公司: | 11138 北京三高永信知识产权代理有限责任公司 | 代理人: | 江崇玉 |
| 地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 构建 情感 词典 方法 装置 | ||
1.一种构建情感词典的方法,其特征在于,所述方法包括:
获取多个待识别的建模语料;
从每个待识别的建模语料中,获取至少一个情感特征词;
对于任一情感特征词,获取对所述情感特征词的至少两个标注结果,所述至少两个标注结果由发表者及多个接收者标注,每个标注结果对应一个分类情感标签;
根据对所述情感特征词的至少两个标注结果,判断所述情感特征词是否满足预设条件;
如果所述情感特征词满足所述预设条件,将所述情感特征词加入到情感词典中,
所述对于任一情感特征词,获取对所述情感特征词的至少两个标注结果,包括:
将所述情感特征词及分类情感标签列表发送至所述发表者所在的移动终端,所述分类情感标签列表中包括多个分类情感标签;
接收所述发表者所在移动终端发送的第一标注结果,所述第一标注结果为所述发表者从所述分类情感标签列表中,为所述情感特征词所选取的分类情感标签;
将所述情感特征词及所述分类情感标签列表发送至多个接收者所在的移动终端;
接收每个接收者所在的移动终端发送的第二标注结果,所述第二标注结果为所述接收者从所述分类情感标签列表中,为所述情感特征词所选取的分类情感标签;
将所述第一标注结果及多个第二标注结果作为所述至少两个标注结果。
2.根据权利要求1所述的方法,其特征在于,所述从每个待识别的建模语料中,获取至少一个情感特征词,包括:
采用指定分词算法将每个待识别的建模语料切分为多个语素片;
对所述多个语素片进行过滤,得到至少一个情感特征词。
3.根据权利要求1所述的方法,其特征在于,所述根据对所述情感特征词的至少两个标注结果,判断所述情感特征词是否满足预设条件,包括:
对所述情感特征词的至少两个标注结果进行统计,得到对所述情感特征词的总标记数;
判断所述总标记数是否大于第一阈值;
如果所述总标记数大于所述第一阈值,则根据每个标注结果对应的分类情感标签,将所述至少两个标注结果划分为多种分类结果;
获取每种分类结果在所述总标记数中所占的比值;
从每种分类结果在所述总标记数中所占的比值中,获取最大比值;
判断所述最大比值是否大于第二阈值;
如果所述最大比值大于所述第二阈值,则确定所述情感特征词满足预设条件。
4.根据权利要求3所述的方法,其特征在于,所述如果所述情感特征词满足所述预设条件,将所述情感特征词加入到情感词典中,包括:
将所述情感特征词及所述最大比值对应的分类情感标签加入到情感词典中。
5.根据权利要求1所述的方法,其特征在于,所述分类情感标签列表中包括的分类情感标签为乐标签、好标签、怒标签、哀标签、惧标签、恶标签、惊标签,且每个分类情感标签中包括多个子标签;
其中,所述好标签包括尊敬子标签、赞扬子标签、相信子标签、喜好子标签、祝愿子标签;所述怒标签包括愤怒子标签;所述哀标签包括悲伤子标签、失望子标签、疚子标签、思子标签;所述惧标签包括慌子标签、恐惧子标签、羞子标签;所述恶标签包括烦闷子标签、憎恶子标签、贬责子标签、妒忌子标签、怀疑子标签;所述惊标签包括惊奇子标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新媒传信科技有限公司,未经北京新媒传信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510917819.9/1.html,转载请声明来源钻瓜专利网。





