[发明专利]一种用于判断文本情感程度的方法和系统在审
申请号: | 201210289551.5 | 申请日: | 2012-08-15 |
公开(公告)号: | CN103593334A | 公开(公告)日: | 2014-02-19 |
发明(设计)人: | 杨震;孙燚;宁恒宇;肖晴;陈正文;马晓军;王桢;俞惠华 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 孙宝海 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于判断文本情感程度的方法和系统。该方法包括由人工对少量初始语料进行标注,计算关键词的权重,并根据关键词的权重构建关键词判断矩阵。利用关键词进行检索可获得更多的语料,并利用关键词判断矩阵对所获得的语料进行自动标记。应用本方法和系统,可以对文本情感倾向和情感程度进行判断。这种判断能力和判断准确度可随着系统的应用得到不断扩展、完善和提高。第一批标注数据由工作人员完成后,后续系统能够自动标记信息,在一定或者特定情况下,仅需工作人员进行部分人工抽查或审核,因此有效降低了人力成本。本系统可用于提供对互联网或者任意待分析信息资源的情感分析,或者从互联网上获得与用户观点最接近的信息。 | ||
搜索关键词: | 一种 用于 判断 文本 情感 程度 方法 系统 | ||
【主权项】:
一种用于判断文本情感程度的方法,其特征在于,该方法包括:获取多个语料,并对所述语料进行人工标注,以构建语料库,所述语料库包括每个语料的文本内容、情感倾向、情感程度级别以及与所述情感倾向和所述情感程度级别相对应的关键词;计算所述关键词的权值,并根据所述关键词的权值构建关键词判断矩阵;根据所述关键词的权值构建搜索词语库,并从所述搜索词语库中选取多个搜索词进行检索,以获得新语料;利用所述关键词判断矩阵,对所述新语料的情感倾向和情感程度级别进行自动判断,以重构语料库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210289551.5/,转载请声明来源钻瓜专利网。