[发明专利]构建情感词典的方法及装置有效
| 申请号: | 201510917819.9 | 申请日: | 2015-12-10 |
| 公开(公告)号: | CN106874275B | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 郭向前 | 申请(专利权)人: | 北京新媒传信科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
| 代理公司: | 11138 北京三高永信知识产权代理有限责任公司 | 代理人: | 江崇玉 |
| 地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 构建 情感 词典 方法 装置 | ||
本发明公开了一种构建情感词典的方法及装置,属于信息技术领域。该方法包括:获取多个待识别的建模语料;从每个待识别的建模语料中,获取至少一个情感特征词;对于任一情感特征词,获取对情感特征词的至少两个标注结果,至少两个标注结果由发表者及多个接收者标注,每个标注结果对应一个分类情感标签;根据对情感特征词的至少两个标注结果,判断情感特征词是否满足预设条件;如果情感特征词满足预设条件,将情感特征词加入到情感词典中。本发明不依赖专业标注人员,基于发表者及多接收者对情感特征词进行标注,解决了情感特征词标注不全面、不准确的问题,提高了所构建的情感词典的准确性。
技术领域
本发明涉及信息技术领域,特别涉及一种构建情感词典的方法及装置。
背景技术
随着信息技术的发展,终端普及率的提高,越来越多用户借助终端中安装的微博、微信等社交应用来表达自己的意见、观点、态度。例如,对政治人物、娱乐人物、热点人物的个人喜好;对某类产品的用后评价与建议;对社会政治事件的看法、立场;对自己的心情、感受的宣泄等。通常用于表达自己的意见、观点、态度的词语往往具有一定的情感倾向,基于这些词语所构建的情感词典,具有十分重要的意义,可用于个人形象的维护、企业营销管理及品牌宣传、商家对产品的改进、政府对舆情控制等方面。
目前,构建情感词典的方法为:专业标注人员对从社交应用中获取到的海量语料进行筛选,选取情感特征词,为情感特征词标注相应的分类情感标签,得到包括情感特征词及对应分类情感标签的情感词典。
然而,随着网络语言的不断发展,各种新词语层出不穷,加上各种网络符号也常被用来表达用户情感,单纯依赖专业标注人员很难全面地、准确地对社交应用中的情感特征词进行标注,使得构建情感词典准确性较低。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种构建情感词典的方法及装置。所述技术方案如下:
一方面,提供了一种构建情感词典的方法,所述方法包括:
获取多个待识别的建模语料;
从每个待识别的建模语料中,获取至少一个情感特征词;
对于任一情感特征词,获取对所述情感特征词的至少两个标注结果,所述至少两个标注结果由发表者及多个接收者标注,每个标注结果对应一个分类情感标签;
根据对所述情感特征词的至少两个标注结果,判断所述情感特征词是否满足预设条件;
如果所述情感特征词满足所述预设条件,将所述情感特征词加入到情感词典中。
可选地,所述从每个待识别的建模语料中,获取至少一个情感特征词,包括:
采用指定分词算法将每个待识别的建模语料切分为多个语素片;
对所述多个语素片进行过滤,得到至少一个情感特征词。
可选地,所述对于任一情感特征词,获取对所述情感特征词的至少两个标注结果,包括:
将所述情感特征词及分类情感标签列表发送至所述发表者所在的移动终端,所述分类情感标签列表中包括多个分类情感标签;
接收所述发表者所在移动终端发送的第一标注结果,所述第一标注结果为所述发表者从所述分类情感标签列表中,为所述情感特征词所选取的分类情感标签;
将所述情感特征词及所述分类情感标签列表发送至多个接收者所在的移动终端;
接收每个接收者所在的移动终端发送的第二标注结果,所述第二标注结果为所述接收者从所述分类情感标签列表中,为所述情感特征词所选取的分类情感标签;
将所述第一标注结果及多个第二标注结果作为所述至少两个标注结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新媒传信科技有限公司,未经北京新媒传信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510917819.9/2.html,转载请声明来源钻瓜专利网。





