[发明专利]情感实体词的筛选方法和装置有效
申请号: | 201910491200.4 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110399481B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 杨志明 | 申请(专利权)人: | 深思考人工智能机器人科技(北京)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/9535;G06F40/289 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
地址: | 100084 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 实体词 筛选 方法 装置 | ||
本发明公开了一种情感实体词的筛选方法和装置,包括:遍历候选文本的每个句子,选出每个句子中权重指标最大的情感实体词为候选情感实体词;情感实体词为一个句子中的情感对象词与情感词的组合;在所有候选情感实体词中,统计不同词的出现频次,依据出现频次对不同词进行非递减排序,取排序中前预设个数的候选情感实体词为备用情感实体词。基于本发明的方法,自动生成候选文本的备用情感实体词,无需人工参与,既提高了处理效率,又能避免人工处理带来的失误。
技术领域
本发明涉及计算机领域,特别涉及一种情感实体词的筛选方法和装置。
背景技术
随着互联网和社交媒体的发展,目前网络上已经有海量的文本信息,包括维基百科词条、学术文章、新闻报道、以及各种售后服务评论,而这些文本信息中蕴含了大量有价值的信息。现有的文本分类技术可以粗略的提取其中特定的信息。
情感计算作为一种文本分类技术,通过对售后评论进行情感分析可以得知消费者对于该产品或者服务的满意度。目前,情感计算最常见的是利用情感词典中的关键词对所给的句子分类或者打分。
基于情感词典的情感计算中最重要的步骤是情感词典的构建,而情感词典的构建通过人工构建实现,包括构建情感实体词及其情感分类。人工构建不仅费事费力,且容易出错。
发明内容
有鉴于此,本发明提供一种情感实体词的筛选方法和装置,解决现有情感词典中感情实体词的人工构建问题。
本发明提供一种情感实体词的筛选方法,该方法包括
遍历候选文本的每个句子,选出每个句子中权重指标最大的情感实体词为候选情感实体词;情感实体词为一个句子中的情感对象词与情感词的组合;
在所有候选情感实体词中,统计不同词的出现频次,依据出现频次对不同词进行非递减排序,取排序中前预设个数的候选情感实体词为备用情感实体词。
本发明还提供一种非瞬时计算机可读存储介质,非瞬时计算机可读存储介质存储指令,其指令在由处理器执行时使得处理器执行上述的情感实体词的筛选方法中的步骤。
本发明还提供一种情感实体词的筛选装置,包括处理器和上述的非瞬时计算机可读存储介质。
本发明方法,以句子为单位,基于频次和权重指标筛选候选文本的“备用情感实体词”,可以确保得到的“备用情感实体词”为热门的重要情感实体词。
且本发明方法,可以自动运行,无需人工参与,既提高了处理效率,又能避免人工处理带来的失误。
附图说明
图1为本发明情感实体词的筛选方法的流程图;
图2为本发明情感实体词及其权重指标的实现流程图;
图3为本发明情感实体词的筛选装置的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,本发明提供一种情感实体词的筛选方法,包括
S10:遍历候选文本的每个句子,选出每个句子中权重指标最大的情感实体词为候选情感实体词;情感实体词为一个句子中的情感对象词与情感词的组合;
S20:在所有候选情感实体词中,统计不同词的出现频次,依据出现频次对不同词进行非递减排序,取排序中前预设个数的候选情感实体词为备用情感实体词。
以句子:“最满意的一点是不仅外观霸气内饰配置也毫不逊色”为例,可以按图2方法生成该句的候选情感实体词及其权重指标。
S31:对句子进行分词和词性分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深思考人工智能机器人科技(北京)有限公司,未经深思考人工智能机器人科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910491200.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页的训练方法及系统
- 下一篇:文本分类方法、模型和装置