[发明专利]一种文本分析知识库的构建方法在审
申请号: | 201810233777.0 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108563630A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 王晓峰;袁波 | 申请(专利权)人: | 上海蔚界信息科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201913 上海市崇明区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识库 情感词典 文本类数据 词典模块 情感规则 情感倾向 文本分析 库模块 语句库 构建 分析 词汇 场景形成 无效内容 业务领域 智能应用 情感词 去除 计算机 补充 | ||
1.一种文本分析知识库的构建方法,其特征在于,包括专有词典模块,无效语句库模块,情感词典模块和情感规则库模块;
所述的专有词典模块主要是分析领域的新词、专有词汇;
所述的无效语句库模块主要是专有领域中没有实际含义、容易干扰理解和分析的内容;
所述的情感词典模块主要是领域内情感词和情感倾向得分;
所述的情感规则库模块主要是对情感词典使用的一个补充。
2.根据权利要求1所述的一种文本分析知识库的构建方法,其特征在于,所述的专有词典模块加入词汇的方法是:(1).直接加入词汇;(2).加入词汇和权重;(3).加入词汇和词性;(4).词汇、词性和权重;加入后可以对词性和权重进行修改;使用时,根据需要将词典与分词工具或文本分析工具对接即可。
3.根据权利要求1所述的一种文本分析知识库的构建方法,其特征在于,所述的无效语句库模块加入无效的词汇和语句,加入方法为:(1).无效词语直接加入库中;(2).无效句子可以直接加入库中,或者用正则表达式的形式替代部分或全部内容并加入库中;使用时,将无效语句库和文本分析工具对接,剔除相关内容即可。
4.根据权利要求1所述的一种文本分析知识库的构建方法,其特征在于,所述的情感词典模块单独或批量地添加情感词以及其对应的情感分数,加入方法为:添加情感词,设置情感词对应的情感分值;使用时,将情感词典与文本分析工具对接,结合适合的情感算法即可应用。
5.根据权利要求1所述的一种文本分析知识库的构建方法,其特征在于,所述的情感规则库模块进行编辑设置后加入,加入后符合规则的模式都将对应相应的情感倾向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蔚界信息科技有限公司,未经上海蔚界信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810233777.0/1.html,转载请声明来源钻瓜专利网。