[发明专利]一种基于DenseNet面向电力领域的电话诉求文本分类算法有效
申请号: | 201811208673.0 | 申请日: | 2018-10-17 |
公开(公告)号: | CN109376241B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 王亿;陆岷;章晨璐;汪宇杰;李豪帅;吴亦灵;孔锋峰;邱海锋;陈杰;翁利国;陈辉 | 申请(专利权)人: | 国网浙江杭州市萧山区供电有限公司;浙江中新电力工程建设有限公司自动化分公司;浙江中新电力工程建设有限公司;国网浙江省电力有限公司杭州供电公司;国家电网有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 项军 |
地址: | 311201 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于DenseNet面向电力领域的电话诉求文本分类算法,属于文本分类算法技术领域,通过对待分类的文本进行预处理、数据增广、建立词汇字典、词向量id匹配、词向量降维、拼接特征值和随机排列组合拼接后的特征值等操作后获得文本分类器,利用该文本分类器对文本进行分类。本发明提供的基于DenseNet面向电力领域的电话诉求文本分类算法,能有效弥补传统算法的不足,很好的适应电力诉求文本存在的专业性强、长度差异大、文字和数字混杂等特点,能在保证分类准确率的前提下降低模型的复杂度,实现对电力领域的电话诉求文本进行快速、准确的分类,很好的满足分类要求。 | ||
搜索关键词: | 一种 基于 densenet 面向 电力 领域 电话 诉求 文本 分类 算法 | ||
【主权项】:
1.一种基于DenseNet面向电力领域的电话诉求文本分类算法,其特征在于,包括以下步骤,S1、获取待分类的电话诉求文本;S2、对步骤S1中获取的电话诉求文本进行预处理;S3、根据步骤S2中预处理后的电话诉求文本进行数据增广;S4、根据步骤S3中增广后的数据建立词汇字典;S5、根据步骤S4中建立的词汇字典进行词向量id匹配;S6、对步骤S5中匹配后的词向量进行词向量降维;S7、采用ResNet和DenseNet‑BC对步骤S6中降维后的词向量进行1×1卷积层处理,并对经卷积层处理后得到的相同尺寸的特征值进行拼接;S8、对步骤S7中拼接后的特征值进行随机排列得到高层次特征;S9、利用步骤S8中得到的高层次特征对电话诉求文本进行分类,实现分类目的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江杭州市萧山区供电有限公司;浙江中新电力工程建设有限公司自动化分公司;浙江中新电力工程建设有限公司;国网浙江省电力有限公司杭州供电公司;国家电网有限公司,未经国网浙江杭州市萧山区供电有限公司;浙江中新电力工程建设有限公司自动化分公司;浙江中新电力工程建设有限公司;国网浙江省电力有限公司杭州供电公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811208673.0/,转载请声明来源钻瓜专利网。