[发明专利]基于大数据的信息获取方法、装置、设备及存储介质在审
申请号: | 202011037785.1 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112052310A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 朱志强 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/34;G06F16/35 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 信息 获取 方法 装置 设备 存储 介质 | ||
1.一种基于大数据的信息获取方法,其特征在于,所述方法包括:
获取目标人员的行为轨迹数据集,提取所述行为轨迹数据集包含的多个历史问答数据特征;
计算所述多个历史问答数据特征的特征权重,确定所述特征权重大于预设阈值的所述历史问答数据特征为所述目标人员的目标问答特征;
获取问答数据集,利用预设聚类算法将所述问答数据集按照问答类别进行分类,得到分类问答集;
将所述分类问答集中与所述目标问答特征的问答类别对应的问答数据汇集为匹配数据集;
将所述匹配数据集序列化为问答列表;
获取待处理的在线问题,在所述问答列表中查询并获取与所述在线问题匹配的问答数据。
2.如权利要求1所述的基于大数据的信息获取方法,其特征在于,所述利用预设聚类算法将所述问答数据集按照问答类别进行分类,包括:
从所述问答数据集中随机选取问答数据作为目标问答数据;
计算所述目标问答数据与多个预设标准类别之间的差异值;
确定与所述目标问答数据的差异值最小的预设标准类别为所述目标问答数据的问答类别。
3.如权利要求2所述的基于大数据的信息获取方法,其特征在于,所述计算所述目标问答数据的问答类别与多个预设标准类别的差异值,包括:
利用如下差异算法计算所述目标问答数据的问答类别与预设标准类别的差异值d(x,y)2:
d(x,y)2=‖x-yi‖2
其中,x为目标问答数据的问答类别,yi为多个预设标准类别中的第i个标准类别。
4.如权利要求1所述的基于大数据的信息获取方法,其特征在于,所述将所述匹配数据集序列化为问答列表,包括:
获取多个序列化处理函数;
将所述多个序列化处理函数线性组合为构造函数;
利用所述构造函数构造序列化接口;
利用所述序列化接口对所述匹配数据集进行序列化处理,得到问答列表。
5.如权利要求1至4中任一项所述的基于大数据的信息获取方法,其特征在于,所述获取在线问题包括:
当检测到语音在线问题的语音输入信息时,持续检测所述语音输入信息的语音强度;
当所述语音强度小于分贝阈值时,确定所述语音强度小于分贝阈值时的语音输入信息为所述语音在线问题的语音终止输入信息;
利用语音识别模型将所述语音终止输入信息之前的语音输入信息转换为在线问题。
6.如权利要求1至4中任一项所述的基于大数据的信息获取方法,其特征在于,所述在所述问答列表中查询并获取与所述在线问题匹配的问答数据包括:
检测所述问答列表的存储环境;
获取与所述存储环境对应的编译器;
利用所述编译器根据所述在线问题编译问题查询语句;
通过执行所述问题查询语句在所述问答列表中查询并获取与所述在线问题匹配的问答数据。
7.如权利要求1至4中任一项所述的基于大数据的信息获取方法,其特征在于,所述提取所述行为轨迹数据集包含的多个历史问答数据特征,包括:
获取训练轨迹数据集以及所述训练轨迹数据集对应的标准历史问答数据特征;
利用预设的特征提取模型对所述训练轨迹数据集进行特征提取,得到预测历史问答数据特征;
计算所述预测历史问答数据特征和所述标准历史问答数据特征之间的差异值;
若所述差异值大于误差阈值,则调整所述特征提取模型的参数后重新进行特征提取;
若所述差异值小于所述误差阈值,则生成训练完成的特征提取模型;
利用训练完成的特征提取模型对所述行为轨迹数据集进行特征提取,得到多个历史问答数据特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011037785.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置