[发明专利]一种基于主题模型的诉求智能转办方法和装置在审
申请号: | 201910748011.0 | 申请日: | 2019-08-14 |
公开(公告)号: | CN110516937A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 刘昕;席永轲;杜凯宁;张春营;白婷婷;孙洪展 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/27;G06F16/33 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 部门数据 主题模型 拟合 数据预处理操作 方法和装置 关键词筛选 规范化数据 数据规范化 数据分组 数据清洗 停用词 无监督 智能化 预测 分词 构建 算法 匹配 分组 智能 应用 发现 | ||
1.一种基于主题模型的诉求智能转办方法和装置,包括以下步骤:
A.基于预处理后的各不同办理部门诉求数据,采用TF-IDF算法进行特征词提取,提取出权重值大于0的关键词作为各部门核心特征词,并对各部门历史诉求数据进行关键词筛选,只保留其核心特征词。
B.应用LDA算法对筛选后各部门数据进行训练,构建对应主题模型。在训练过程中通过计算关键词对应主题、关键词对应文档、文档对应主题的概率分布,调整狄利克雷分布函数中超参数,从而得到不同办理部门的LDA修正模型,基于所得各办理部门LDA主题模型,对所得各办理部门模型数据以“主题词*权重”的形式整合到总模型库中,得到办理部门总模型。
C.针对新来诉求使用权重叠加、重叠主题词消除等方法筛选出该诉求的前n个候选部门。
D.对步骤C所选取的候选部门,使用历史相似诉求拟合方法确定拟合度最高部门,最终确定该新诉求办理部门。
2.根据权利要求1所述的一种基于主题模型的诉求智能转办方法和装置,其特征在于,所述的步骤A中,在对已获取数据进行TF-IDF训练时,针对每个关键词在其办理部门数据中出现的次数进行TF值计算;将全部部门诉求数据作为总语料库,对每个关键词在不同部门中的出现情况进行IDF值计算,并用TF*IDF最终确定每个关键词的权重值,然后取出权重值大于0的关键词对历史诉求数据进一步筛选。
3.根据权利要求1所述的一种基于主题模型的诉求智能转办方法和装置,其特征在于,所述的步骤B中,处理后数据是指使用权重值大于0的关键词对历史诉求数据进一步筛选后的数据。在LDA模型训练阶段,输入数据为各办理部门模型训练数据,得到的每个主题的模型由权重*主题词组成,如:[0.029*政府+0.023*调查+0.020*小区+0.016*街道+0.014*业主+0.014*村民]。
4.根据权利要求1所述的一种基于主题模型的诉求智能转办方法和装置,其特征在于,所述的步骤C中,在办理部门预测阶段,每获取一条新来诉求数据,通过权重叠加、重叠主题词消除对其候选部门进行准确预测,其中n可根据部门数据进行自定义。权重叠加是指,将新诉求数据的所有分词对每一办理部门模型逐一进行主题词权重叠加,并取出权重最大的n个候选办理部门。重叠主题词消除是指,不同的模型之间可能存在相同的主题词,而不同部门间数据量的多少会导致相同主题词的权重失衡,需要将不同模型中的相同关键词进行去除,利用剩余主题词权重对n个候选部门序列进一步调整。
5.根据权利要求1所述的一种基于主题模型的诉求智能转办方法和装置,其特征在于,所述的步骤D中,历史相似诉求拟合,基于步骤C中的处理结果,将新来诉求与n个候选部门中每一历史诉求进行历史相似诉求拟合度计算(诉求数据匹配词个数/目标诉求数据长度),根据相似度的值对n个候选部门序列进一步调整,并取出历史相似诉求拟合度最高部门作为该新来诉求所属办理部门。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910748011.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理