[发明专利]一种基于主题模型的诉求智能转办方法和装置在审

专利信息
申请号: 201910748011.0 申请日: 2019-08-14
公开(公告)号: CN110516937A 公开(公告)日: 2019-11-29
发明(设计)人: 刘昕;席永轲;杜凯宁;张春营;白婷婷;孙洪展 申请(专利权)人: 中国石油大学(华东)
主分类号: G06Q10/06 分类号: G06Q10/06;G06F17/27;G06F16/33
代理公司: 暂无信息 代理人: 暂无信息
地址: 266580 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 部门数据 主题模型 拟合 数据预处理操作 方法和装置 关键词筛选 规范化数据 数据规范化 数据分组 数据清洗 停用词 无监督 智能化 预测 分词 构建 算法 匹配 分组 智能 应用 发现
【权利要求书】:

1.一种基于主题模型的诉求智能转办方法和装置,包括以下步骤:

A.基于预处理后的各不同办理部门诉求数据,采用TF-IDF算法进行特征词提取,提取出权重值大于0的关键词作为各部门核心特征词,并对各部门历史诉求数据进行关键词筛选,只保留其核心特征词。

B.应用LDA算法对筛选后各部门数据进行训练,构建对应主题模型。在训练过程中通过计算关键词对应主题、关键词对应文档、文档对应主题的概率分布,调整狄利克雷分布函数中超参数,从而得到不同办理部门的LDA修正模型,基于所得各办理部门LDA主题模型,对所得各办理部门模型数据以“主题词*权重”的形式整合到总模型库中,得到办理部门总模型。

C.针对新来诉求使用权重叠加、重叠主题词消除等方法筛选出该诉求的前n个候选部门。

D.对步骤C所选取的候选部门,使用历史相似诉求拟合方法确定拟合度最高部门,最终确定该新诉求办理部门。

2.根据权利要求1所述的一种基于主题模型的诉求智能转办方法和装置,其特征在于,所述的步骤A中,在对已获取数据进行TF-IDF训练时,针对每个关键词在其办理部门数据中出现的次数进行TF值计算;将全部部门诉求数据作为总语料库,对每个关键词在不同部门中的出现情况进行IDF值计算,并用TF*IDF最终确定每个关键词的权重值,然后取出权重值大于0的关键词对历史诉求数据进一步筛选。

3.根据权利要求1所述的一种基于主题模型的诉求智能转办方法和装置,其特征在于,所述的步骤B中,处理后数据是指使用权重值大于0的关键词对历史诉求数据进一步筛选后的数据。在LDA模型训练阶段,输入数据为各办理部门模型训练数据,得到的每个主题的模型由权重*主题词组成,如:[0.029*政府+0.023*调查+0.020*小区+0.016*街道+0.014*业主+0.014*村民]。

4.根据权利要求1所述的一种基于主题模型的诉求智能转办方法和装置,其特征在于,所述的步骤C中,在办理部门预测阶段,每获取一条新来诉求数据,通过权重叠加、重叠主题词消除对其候选部门进行准确预测,其中n可根据部门数据进行自定义。权重叠加是指,将新诉求数据的所有分词对每一办理部门模型逐一进行主题词权重叠加,并取出权重最大的n个候选办理部门。重叠主题词消除是指,不同的模型之间可能存在相同的主题词,而不同部门间数据量的多少会导致相同主题词的权重失衡,需要将不同模型中的相同关键词进行去除,利用剩余主题词权重对n个候选部门序列进一步调整。

5.根据权利要求1所述的一种基于主题模型的诉求智能转办方法和装置,其特征在于,所述的步骤D中,历史相似诉求拟合,基于步骤C中的处理结果,将新来诉求与n个候选部门中每一历史诉求进行历史相似诉求拟合度计算(诉求数据匹配词个数/目标诉求数据长度),根据相似度的值对n个候选部门序列进一步调整,并取出历史相似诉求拟合度最高部门作为该新来诉求所属办理部门。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910748011.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top