[发明专利]一种建筑质量投诉文本分类的方法和系统在审
| 申请号: | 201810405432.9 | 申请日: | 2018-04-29 |
| 公开(公告)号: | CN108563791A | 公开(公告)日: | 2018-09-21 |
| 发明(设计)人: | 钟波涛;邢雪娇;汪旭;骆汉宾;方伟立 | 申请(专利权)人: | 华中科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06Q10/06;G06Q50/08 |
| 代理公司: | 华中科技大学专利中心 42201 | 代理人: | 尚威;李智 |
| 地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 质量投诉 投诉 卷积神经网络 文本分类 文本 数据收集和分析 文本分类模型 最优分类模型 文本预处理 后续处理 机器学习 空间向量 模型参数 模型构建 模型优化 人工分类 文本表示 文本分词 文本数据 文本语言 验证结果 语义信息 停用词 准确率 分词 构建 匹配 删除 自动化 验证 分类 | ||
本发明公开了一种建筑质量投诉文本分类的方法和系统,方法包括数据收集和分析:收集现有的建筑质量投诉文本,并给每条投诉人工匹配投诉类别;投诉文本预处理:使用分词软件将投诉文本分词处理并删除停用词;模型构建:构建基于卷积神经网络的文本分类模型;模型优化:利用已标记的文本数据,进行模型的训练与验证,对比不同批次验证结果的准确率,自动调整模型参数,最终得到最优分类模型。本发明的技术方案由于采用基于卷积神经网络的机器学习,将投诉文本表示为包含语义信息的空间向量,能够对投诉文本进行高效、准确的自动化分类,避免了人工分类方式下由于文本语言表达问题造成的理解偏差,有利于支持建筑质量投诉文本的后续处理。
技术领域
本发明属于自然语言处理和建筑工程领域,更具体地,涉及一种建筑质量投诉文本分类的方法和系统。
背景技术
随着建筑行业的快速发展,各种建筑质量相关问题不断涌现,相关投诉日益增多。传统的建筑质量投诉方法是,用户通过电话、信件或者面谈等方式提出投诉请求,由工作人员记录投诉内容。随着互联网技术的发展迅速,作为政府电子政务系统的重要组成部分,多种电子投诉渠道(如政府投诉网站、微博、微信平台等)得到快速发展,因此建筑质量投诉规模越来越大。如何快速有效的解决大量用户投诉,成为政府急需解决的问题。
在处理建筑质量投诉的过程中,首先需要对不同投诉分门别类,以便后续快速、准确的将不同类别的投诉分配给不同部门的专业人员进行处理。因此文本分类是处理建筑质量投诉的首要任务。
传统建筑质量投诉文本分类过程是由相关工作人员针对投诉内容进行人工分类。传统建筑质量投诉文本分类过程需要大量劳动力,不适应当前快速增长的投诉量。另外,由于参与分类的工作人员由于专业知识的偏差,容易造成错误的分类,影响后期投诉处理的效率。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种建筑质量投诉文本分类的方法和系统,其目的在于,应用计算机技术自动处理投诉文本,实现高效准确的分类。
为实现上述目的,按照本发明的一个方面,提供了一种建筑质量投诉文本分类的方法,包括以下步骤:
步骤1:收集现有的建筑质量投诉文本,提取每条投诉的投诉内容及投诉类别;
步骤2:将投诉内容分词处理,构建投诉文本二维矩阵;
步骤3:将投诉内容文本二维矩阵输入卷积神经网络,对卷积神经网络进行训练,得到文本分类模型。
进一步地,步骤2中,分词处理包括将投诉文本切词并将删除停用词,分词处理后将投诉文本转换为二维空间矩阵。
进一步地,投诉文本转换为二维空间矩阵的方法如下:
2.1、建立建筑质量投诉领域词汇词典;
2.2、将投诉文本中包含的关键词,分别在投诉领域词汇词典中进行检索;
2.3、按照关键词的序列,将从词典中查找的关键词向量组合成投诉文本的二维空间矩阵。
进一步地,步骤3中的文本分类模型包括特征提取和文本分类两部分;
特征提取部分包括卷积核和全连接层,卷积核中包括卷积层、激活层和池化层;
文本分类部分包括输入层、隐藏层和输出层。
进一步地,文本分类模型中的模型参数包括;输入层参数xi,隐藏层参数yr,输出层参数Cl,输入层与隐藏层之间为Wir,隐藏层与输出层之间参数为Vrl;其中,
I表示输入层总共有I个输入参数,R表示隐藏层总共有R个隐藏参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810405432.9/2.html,转载请声明来源钻瓜专利网。





