[发明专利]数据挖掘方法、装置、服务器及可读存储介质有效

专利信息
申请号: 201811526754.5 申请日: 2018-12-13
公开(公告)号: CN111401388B 公开(公告)日: 2023-06-30
发明(设计)人: 吴康康;王鹏;柳俊宏;王杰 申请(专利权)人: 北京嘀嘀无限科技发展有限公司
主分类号: G06F18/2411 分类号: G06F18/2411;G06F18/214;G06F16/332;G06F40/284
代理公司: 北京超成律师事务所 11646 代理人: 邓超
地址: 100193 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请实施例提供了一种数据挖掘方法、装置、服务器及可读存储介质,通过获取目标对话数据并从目标对话数据中抽取问题数据,并对问题数据进行分词,得到由多个分词组成的分词结果,从而根据分词结果构建对应的频繁模式树,并从构建的频繁模式树中挖掘频繁项集合,其中,该频繁项集合包括多个频繁项,每个频繁项对应一个数据挖掘的知识点。如此,本申请能够精准全面地挖掘建单轮对话中的知识点,大大提高知识点挖掘的效率和质量,以便更加有效地解决用户的问题,提高用户的满意度。
搜索关键词: 数据 挖掘 方法 装置 服务器 可读 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811526754.5/,转载请声明来源钻瓜专利网。

同类专利
  • 一种样本数据筛选方法及系统-202311071767.9
  • 薛亮;朱跃龙;冯钧;陆佳民 - 河海大学
  • 2023-08-24 - 2023-10-27 - G06F18/2411
  • 本发明公开了一种样本数据筛选方法及系统,对于电力工器具不同产品类型的每一个产品,获取其样本数据;计算每一种产品的使用频率、每一个产品的耐力值权重及每一类产品的耐力值权重;对于任意两种指定特征类型,计算二者之间的斯皮尔曼系数,选择出N个特征;通过SVM‑RFE与DT‑RFE分别计算出特征权重与模型准确率;并进行动态加权融合,再依次消除重要度排名从低到高的特征;利用交叉验证方法得到初始特征子集的分类精度;直至特征子集为空;得到不同特征数量的特征子集,将不同模型各自的精度乘以重要度得到总权重,选择最高的特征子集作为最优特征组合。本发明大大减少特征数量,减少计算维度,能够在提高损耗准确率的同时计算时间,提高效率。
  • 文本水印处理方法、装置、电子设备及存储介质-202311198457.3
  • 吴海燕;付大伟 - 云粒智慧科技有限公司
  • 2023-09-18 - 2023-10-27 - G06F18/2411
  • 本发明提供一种文本水印处理方法、装置、电子设备及存储介质,涉及水印技术领域,该方法包括:获取支持向量机模型、目标文本矩阵中各字符的特征向量和第一水印指纹信息;支持向量机模型是基于多个原始文本矩阵中各字符的特征向量和需要嵌入水印的多个第一字符位置训练得到的;多个第一字符位置形成预设形状,且多个第一字符位置处于原始文本矩阵的非边缘位置;将目标文本矩阵中各字符的特征向量输入支持向量机模型中进行处理,得到目标文本矩阵中待嵌入水印的多个第二字符位置;基于第一水印指纹信息向多个第二字符位置嵌入水印。本发明可以在提升水印处理效率的同时提升水印隐蔽性和安全性。
  • 一种沥青路面综合性能的评价方法-201911420814.X
  • 赵静;王选仓;郭昱辰;李美鑫;张凯星;吴传海;李善强;房娜仁;李浩 - 长安大学
  • 2019-12-31 - 2023-10-27 - G06F18/2411
  • 本发明提供一种关于交叉验证CV寻优支持向量机SVM的沥青路面综合性能的评价方法,解决了现有评价方法PQI计算不涉及路面结构强度指数、各指标权重确定不能完全适用于具体地区、不能准确客观反映路面整体水平的问题。通过建立CV‑SVM模型,以公路技术状况分项指标等级划分标准为训练集进行训练,以多功能车检测出的沥青路面综合性能数据为测试集,对沥青路面性能进行综合评价,整个评价过程中,利用并没有计算PQI的过程,同时将多项指标纳入综合性能评价中,避免单独对此指标进行评定,因此,客观全面的对路面性能进行,提高养护工作的效率及决策的准确性。
  • 数据处理方法及装置、电子设备、计算机可读介质-202010093525.X
  • 苏业;冷家冰;管超;任思可;黄锋;李旭 - 北京百度网讯科技有限公司
  • 2020-02-14 - 2023-10-27 - G06F18/2411
  • 本公开提供了一种数据处理方法,包括:获取数据检测请求,所述数据检测请求包括多个已标注数据;针对每个已标注数据,利用预先训练好的至少一个异常检测分类器,对该已标注数据进行预测,得到每个异常检测分类器对该已标注数据的预测结果,该已标注数据的预测结果包括用于确定该已标注数据是否为离群数据的信息;根据至少一个异常检测分类器对该已标注数据的预测结果,确定该已标注数据是否为离群数据。本公开还提供了数据处理装置、电子设备及计算机可读介质。
  • 一种面向数字助听器的场景匹配方法、装置及计算机设备-201911364101.6
  • 王敏 - 惠州市锦好医疗科技股份有限公司
  • 2019-12-26 - 2023-10-27 - G06F18/2411
  • 本发明公开一种面向数字助听器的场景匹配方法,先获取声音信号,根据所述声音信号,得到信号样本;然后通过对信号样本进行第一次特征提取以实现场景的初始匹配;再基于初始匹配的结果,通过对信号样本进行第二次特征提取以实现场景的最终匹配。本发明提供的方法通过两次特征提取和两个不同分类器的分类,可有效提高分类精度,且计算速度快,可满足实时处理的需求,非常适合助听器的应用市场,具有很高的实用价值。
  • 基于相似性的医康养服务需求分类方法-202310918638.2
  • 周学权;徐晓飞;赵誉茹;涂志莹;初佃辉;姚若岚;孟凡超;张华;李春山 - 哈尔滨工业大学
  • 2023-07-25 - 2023-10-24 - G06F18/2411
  • 本发明公开了一种基于相似性的医康养服务需求分类方法,所述方法包括如下步骤:步骤一、数据预处理;步骤二、训练全局语义向量;步骤三、训练词向量;步骤四、计算功能语义权重FunSemWeight;步骤五、关键词提取;步骤六、训练主题语义向量;步骤七、计算相似性并选择核函数;步骤八、构建支持向量机分类器。本发明在进行相似性计算时,通过更加准确的语义向量表示来提升对用户需求的理解,在全局语义向量的基础上结合主题语义向量,补充主题信息有利于提升对特定领域的识别能力,有利于提高相似性计算的准确性进而更准确的分类。
  • 一种面向脑卒中非平衡数据集的分类方法及系统-202310944187.X
  • 李凤莲;张雪英;魏鑫;回海生;李彦民 - 太原理工大学
  • 2019-11-28 - 2023-10-24 - G06F18/2411
  • 本发明公开了一种面向脑卒中非平衡数据集的分类方法及系统,涉及数据处理技术领域,方法包括:将脑卒中非平衡数据集划分成训练样本集和测试样本集;根据各个样本点之间的距离确定正/负类样本自适应调节半径,以确定正/负类样本自适应调节因子,进而构建差异矩阵;根据差异矩阵统计样本点有效范围内的正类样本个数和负类样本个数,以确定样本点所含的正/负类信息量,进而构造信息量模糊隶属函数;确定基于样本间距离的正/负类模糊隶属度函数;确定改进后的正/负类模糊隶属度函数,进而构造模糊支持向量机分类器;采用模糊支持向量机分类器对脑卒中非平衡数据集进行分类。本发明有效提高对脑卒中非平衡数据集的分类性能。
  • 一种变压器运行状态确定方法、装置及电子设备-202310717593.2
  • 袁胜聪;刘家俊 - 西安力传智能技术有限公司
  • 2023-06-16 - 2023-10-24 - G06F18/2411
  • 本申请实施例提供了一种变压器运行状态确定方法、装置及电子设备,其中,该方法通过获取目标变压器的变压器油中的溶解气体数据,确定不同目标溶解气体数据之间的关联特征,基于该不同目标溶解气体数据之间的关联特征,利用预设故障诊断模型,确定目标变压器的目标运行状态。由于不同目标溶解气体数据之间的关联特征是基于不同类型目目标溶解气体数据之间的支持度与置信度确定得到的,该关联特征能够更为精准地表征不同溶解气体之间的关联关系,能够更为综合地反映变压器油中的各气体成分之间的关系。因此,选用本申请实施例,可借助不同指标参数对变压器的状态进行综合诊断,进一步得到更为精准的电力变压器运行状态的预测结果。
  • 一种电力设备智能综合监控系统-202310937939.X
  • 唐许良;万衡;陈进;万家喻;杨刚 - 江苏金鑫信息技术有限公司
  • 2023-07-27 - 2023-10-24 - G06F18/2411
  • 本发明涉及一种电力设备智能综合监控系统,包括数据采集模块,电路监控模块,数据处理模块,系统告警模块以及系统配置管理模块。本发明通过电力设备运行数据的数字化采集,实现关键数据综合性分析、智能告警、预判等扩展功能,相关数据实时进行调用,与电力系统互联互通联组成网,具备了实时发现故障指征,预判其性质并进行处理,实现电力系统运行的稳定。本发明可以实现电力设备运行数据的数字化采集,具备电力设备集中监控、预判系统状态,达到无人值班的条件和功能,满足电力系统的智能化监控业务的开展。
  • 一种基于装置量测数据的智能电能表故障预测方法-202310769140.4
  • 杨舟;陈珏羽;周政雷;高武东;潘俊涛;蒋雯倩;林秀清;韦杏秋 - 广西电网有限责任公司
  • 2023-06-28 - 2023-10-20 - G06F18/2411
  • 本发明公开了一种基于装置量测数据的智能电能表故障预测方法,涉及电表故障预测技术领域,包括以下步骤:获取电表故障特征变量;进行数据异常值剔除,将特征变量数据进行归一化处理;将时域特征信息融入到归一化特征变量,构造与时域信息和故障特征变量相关的卷积神经网络输入矩阵;数据输入,进行卷积神经网络前向传播,得到模型输出结果;计算模型的损失函数,对模型参数进行更新,获取智能电能表故障分析模型;构造输入矩阵,采用训练好的模型进行智能电能表故障分析,对故障类别进行预测。本发明最终得出一个可以用于智能表故障分析和故障类别预测的模型用于故障预测,该模型基于历史故障特征进行模型训练,保证了故障分析的准确性。
  • 基于盲信号分离和支持向量机的滚动轴承故障诊断方法-202011088023.4
  • 张伟涛;纪晓凡;孙瑾铃;楼顺天 - 西安电子科技大学
  • 2020-10-13 - 2023-10-20 - G06F18/2411
  • 本发明提出了一种基于盲信号分离和支持向量机的滚动轴承故障诊断方法,属于旋转机械智能故障诊断技术领域,旨在提高滚动轴承故障诊断的精度、效率和鲁棒性,实现步骤为:获取训练样本集和测试样本集;获取训练样本集对应的多维特征向量集;获取支持向量机集合;对支持向量机集合进行迭代训练;定义观测矩阵和分离矩阵;对观测矩阵进行盲信号分离;获取滚动轴承的故障诊断结果。本发明在分离矩阵的迭代中引入了自适应选择非线性函数和迭代步长,在提取振动信号特征向量时采用由幅域参数、频域指标和多尺度熵共同组成的多维特征向量,结合支持向量机,有效提高了诊断精度、效率和鲁棒性。
  • 一种管线故障诊断方法和系统-202011558156.3
  • 王超楠;韩一梁;倪娜;刘伟 - 北京无线电计量测试研究所
  • 2020-12-25 - 2023-10-20 - G06F18/2411
  • 本申请公开了一种管线故障诊断方法,构建故障诊断训练数据集,根据故障类别和故障成因,形成贝叶斯网络初始结构,确定最匹配的贝叶斯网络结构和参数;对监测数据和故障类别的对应关系进行学习,确定SVM故障分类模型;基于管线中各节点实时监测数据,根据所述SVM故障分类模型对故障进行分类;根据分类的结果,用贝叶斯网络结构和参数进行推理,确定所述各节点发生故障的概率,以故障发生概率最大的节点和发生的故障类别作为故障诊断结果。本申请还提出一种管线故障诊断系统。本申请解决故障诊断的历史故障数据量不充分的问题。
  • 一种基于电容型设备缺陷数据的设备缺陷时间预测方法-202010039425.9
  • 彭晶;王科;谭向宇;邓云坤;耿英三;闫静;刘志远;马仪;赵现平;李昊;刘红文 - 云南电网有限责任公司电力科学研究院
  • 2020-01-15 - 2023-10-20 - G06F18/2411
  • 本申请提供的一种基于电容型设备缺陷数据的设备缺陷时间预测方法,首先获取电容型设备缺陷数据,通过一系列特征工程的方法更好地处理得到的异常、冗余和缺失数据,通过建立电容型设备缺陷发生时间模型更好地预测缺陷的发生时间,模型可以从大数据中提取有效特征,并且使用这些特征来比较精确地预测电容型设备的缺陷发生时间。本申请提供的基于电容型设备缺陷数据的设备缺陷时间预测方法,具有实现简单,计算速度快,预测精度高,预测鲁棒性好,预测流程系统化的优点,解决了现有技术中单纯考虑试验数据放弃电网公司历年来收集到的电容设备工作和检修数据来进行研究预测可能得出比较片面的结论,不能准确预测设备缺陷时间的问题。
  • 一种自动化行业分类装置及其工作方法-202010325081.8
  • 张嘉豪;傅玉峰;孙惠平;陈钟;虞丽;朱俊 - 南京辰阔网络科技有限公司;北京大学
  • 2020-04-23 - 2023-10-20 - G06F18/2411
  • 本发明属于计算机技术和智能风控信用评分应用技术领域,具体公开了一种自动化行业分类装置及其工作方法。本发明的一种自动化行业分类装置及其工作方法的有益效果在于:1、综合使用了未在其他专利中出现过且能够反映企业行业的多维数据,能够从成果、项目、人事、业务等多个方面反映企业行业范围,相比仅仅使用销售业务层面数据,能够更加准确对跨行业的企业进行准确行业分类;2、挖掘了更深层次的信息,不仅使用商品名称,更利用销售额占比来进行行业分类训练,对于企业行业分类评定更加全面和准确。
  • 用于生成能由人类感知的解释性输出的系统及用于监控异常识别的方法和计算机程序-202310342378.9
  • 尼古拉斯·特韦斯;格奥尔格·施奈德 - 采埃孚股份公司
  • 2023-03-31 - 2023-10-17 - G06F18/2411
  • 用于生成能由人类感知的解释性输出的系统及用于监控异常识别的方法和计算机程序。在用于针对由异常识别模块就工业制造过程的高频传感器数据或从中推导出的参量所预言的异常生成能由人类感知的解释性输出的系统中,当异常识别模块将描述制造过程的机器、构件和/或产品的状态的传感器数据或传感器数据的范围分类为偏离正常期望的能观察的数据时,异常识别模块预言异常,其中,该系统被配置成将优化的解释性掩码作为能由人类感知的解释性输出发送,其中,人类基于优化的解释性掩码识别出哪些传感器数据、传感器数据的范围或从中推导出的参量对由异常识别模块预言的异常负责。
  • 用于挖掘机工况识别的方法及挖掘机工况识别装置-202310716264.6
  • 曾光;彭斐琳;童兴;徐冰川;谢毅 - 中科云谷科技有限公司
  • 2023-06-15 - 2023-10-17 - G06F18/2411
  • 本申请公开了一种用于挖掘机工况识别的方法及挖掘机工况识别装置。该方法包括:获取挖掘机的操作手柄先导控制信号数据和双泵压力信号数据;对操作手柄先导控制信号数据和双泵压力信号数据进行预处理以得到预处理后的数据;根据预处理后的数据构建特征向量;将特征向量进行特征降维以得到降维后的特征向量;将降维后的特征向量输入分类模型以得到挖掘机的第一工况模式;对第一工况模式进行校验并输出工况识别结果明细表。本申请结合复合信号的基本时域特征和挖掘的实际情况构建了特征向量,并对特征向量进行了降维,去除了对识别结果影响较小的特征因子,并在模型识别结束后,对分类结果进行校验,以纠正模型识别的结果,提高了模型的分类精度。
  • 一种太阳能发电量预测方法及系统-202311155060.6
  • 刘志刚;李选娟;欧云杰 - 无锡安鑫卓越智能科技有限公司
  • 2023-09-08 - 2023-10-17 - G06F18/2411
  • 本发明公开了一种太阳能发电量预测方法及系统,属于预测目的的数据处理技术领域,方法包括:获取历史气象数据和历史发电量数据;构建气象样本训练集;初始化粒子群,粒子群包括多个粒子,每个粒子代表一个气象样本;基于支持向量机,构建多个弱分类器;通过粒子群寻优算法,对各个弱分类器进行训练;对各个弱分类器进行加权集成,生成强分类器;基于注意力机制的双向长短时记忆神经网络,构建多个不同天气状态下的发电量预测模型;将历史发电量数据划分为多种不同天气状态的发电量样本训练集;对相应的发电量预测模型进行训练;获取当前气象数据;通过强分类器,确定天气预测状态;选择与天气预测状态对应的发电量预测模型进行发电量预测。
  • 一种基于CNN-Bi-LSTM的SOC估计方法-202310835282.6
  • 朱毛赛;肖勇军;翟伟峥;韩乐聪 - 林源电力(南京)有限公司
  • 2023-07-07 - 2023-10-13 - G06F18/2411
  • 本发明提供一种基于CNN‑Bi‑LSTM的SOC估计方法,包括对数据集进行Savitzky‑Golay滤波和归一化处理;根据采集的电池参数构建1D‑CNN模型,利用构建的1D‑CNN对获取的电池参数进行深层特征提取,捕获更多相关的特征用于估计,提高估计的准确度;根据1D‑CNN的输出情况构建Bi‑LSTM网络,提取不同时刻的时序特征;利用全连接层将特征通过非线性变化后映射为最终的SOC估计。本发明利用Bi‑LSTM从正向和反向读取特征参数,学习电池SOC在过去、未来的信息和当前信息之间的时序关系,增强模型的特征提取能力,有效提高估计的准确度。
  • 用于气象等复杂系统的基于变量选择和反向时滞特征选择的条件格兰杰因果分析方法-202310958325.X
  • 李蒙;那晓栋;韩敏 - 大连理工大学
  • 2023-08-01 - 2023-10-13 - G06F18/2411
  • 本发明提出一种用于气象等复杂系统的基于变量选择和反向时滞特征选择的条件格兰杰因果分析方法,属于数据挖掘技术领域。本发明先将采集到的数据进行预处理,对缺失数据采用平均值插补方法进行补全,并对数据进行平稳性检验及处理,以满足建立模型的假设。之后将数据进行归一化,以消除不同变量量纲带来的影响。最后建立基于变量选择和反向时滞特征选择的条件格兰杰因果分析模型,实现准确探究变量间因果关系的目的,同时展现不同变量间的因果关系指数,以达到定量、准确地分析系统间各变量间的因果关系。本发明能够实现对复杂系统进行精准建模,目的在于拓展原始的方法适用于高维且能够展示更多的动态信息。
  • 一种扩充建模样本数据标签的方法及装置-202211579905.X
  • 陈明;肖勃飞;况文川;石建伟;魏蜀吾 - 中电金信软件有限公司
  • 2022-12-06 - 2023-10-13 - G06F18/2411
  • 本发明提供了一种扩充建模样本数据标签的方法及装置,扩充建模样本数据标签的方法包括:从预先存储的供应链对应的数据库中,针对每一样本用户,提取该样本用户的样本数据,得到样本数据集;基于样本数据集中的各样本数据以及预先设置的价值评估算法,计算样本用户的评价指标值;基于各样本用户的评价指标值,对样本用户进行分类,得到分层客群,依据预先设置的显著性差异策略,从各分层客群中,获取有效客群集并进行标签标记;依据进行标签标记的有效客群集以及支持向量机算法,构建支持向量机模型;基于构建的支持向量机模型,对除有效客群集之外的分层客群中的样本用户进行标签标记。可以提高基于建模样本数据构建的风险评估模型的精度。
  • 一种结合非平行性双支持向量机和样本特权信息的分类方法-202010707048.1
  • 车志勇;刘波;肖燕珊 - 广东工业大学
  • 2020-07-21 - 2023-10-13 - G06F18/2411
  • 本发明公开了一种结合非平行性双支持向量机和样本特权信息的分类方法,包括以下步骤:S1、提取样本额外的特征信息;S2、构建非平行双支持向量机的模型;S3、构造校正函数;S4、通过校正函数把额外的特征信息整合到非平行双支持向量机的模型中构造目标模型;S5、利用拉格朗日函数和K.K.T条件,通过两个二次规划问题来求解构造出的目标模型,从而找到两个非平行分类平面;S6、利用步骤S5找到的两个非平行分类平面对样本进行分类,确定样本的标签。本发明具有运算速度快、分类准确率高等优点。
  • 一种多特征评价准则融合的地震属性优选方法-201910324172.7
  • 李克文;周广悦;杨耀忠;王兴谋;朱剑兵 - 中国石油大学(华东)
  • 2019-04-22 - 2023-10-13 - G06F18/2411
  • 本发明公开了一种多特征评价准则融合的地震属性优选方法,其特征在于通过匹配地震属性样本与储层类别标签,获得带有类别标签的地震属性集;针对单一特征评价准则难以准确评估地震属性重要性的问题,首先采用Fisher score、互信息、Person相关系数3种特征评价准则计算地震属性与储层类别的相关性大小,分别按照相关性大小对地震属性的重要性进行排序,其次以支持向量机为分类器,结合不同特征评价准则计算分类准确率,将各评价准则的准确率与三者的准确率之和的比作为权重,最后采用线性加权的方式对各评价准则得到的排序结果进行融合处理,进而实现地震属性优选。本发明通过综合考虑多种特征评价准则,筛选出对分类起关键作用的地震属性组合,从而提高储层预测的有效性。
  • 多类型异常网页分类模型的构建方法、异常网页检测方法-202010721898.7
  • 陆毛毛;权义宁;苗启广;宋建锋;戚玉涛;谢琨;孙鹏岗 - 西安电子科技大学
  • 2020-07-24 - 2023-10-13 - G06F18/2411
  • 本发明公开了一种多类型异常网页分类模型的构建方法、异常网页检测方法,其中,多类型异常网页分类模型的构建包括:将不同类型的异常网页分类,并根据不同类型的网页的攻击意图和手段选择相应的属性,并通过SVM‑RFE选取最合适的最优属性,并将每个属性在朴素贝叶斯上的精确度为特征有效度,并将其引入SVM中,设计出一种具有特征有效度的支持向量机,将选取的特征在含有特征有效度支持向量机中训练得到多类型异常网页分类模型。其中,异常网页检测方法包括;将提交的URL提取异常特征,并进行标准化处理,然后调用本发明的多类型异常网页分类模型进行检测。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top