[发明专利]一种数据处理方法和系统在审
申请号: | 202010140962.2 | 申请日: | 2020-03-03 |
公开(公告)号: | CN113345557A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 徐忆苏 | 申请(专利权)人: | 北京悦熙兴中科技有限公司 |
主分类号: | G16H20/90 | 分类号: | G16H20/90;G16H50/70;G16H10/60 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 系统 | ||
1.一种数据处理方法,其特征在于,包括:
获取在线信息数据,所述在线信息数据包括:用户的基本信息、自述信息、问诊单信息、以及舌照信息;
对所述在线信息数据进行过滤,得到目标信息数据;
对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量;
根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息;所述参考信息集合包括:历史信息数据对应的历史特征向量以及所述历史信息数据对应的历史参考信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量,包括:
通过第一模型对所述目标信息数据进行特征提取,得到所述基本信息对应的第一特征向量、所述自述信息对应的第二特征向量、所述问诊单信息对应的第三特征向量、以及所述舌照信息对应的第四特征向量;
将所述第一特征向量、所述第二特征向量、所述第三特征向量、所述第四特征向量进行拼接,得到初始特征向量;
通过第二模型对所述初始特征向量进行处理,得到所述目标信息数据对应的目标特征向量。
3.根据权利要求2所述的方法,其特征在于,所述第一模型中包括:第一映射表、关键词列表、第二映射表、以及第三映射表;
所述通过第一模型对所述目标信息数据进行特征提取,得到所述用户的基本信息对应的第一特征向量、所述用户的自述信息对应的第二特征向量、所述用户的问诊单信息对应的第三特征向量、以及所述用户的舌照信息对应的第四特征向量,包括:
根据所述目标信息数据中用户的基本信息与所述第一映射表中预置的基本信息之间的映射关系,提取得到所述用户的基本信息对应的第一特征向量;
根据所述目标信息数据中用户的自述信息与所述关键词列表中预置的关键词之间的映射关系,提取得到所述用户的自述信息对应的第二特征向量;
根据所述目标信息数据中用户的问诊单信息与所述第二映射表中预置的问诊单信息之间的映射关系,提取得到所述用户的问诊单信息对应的第三特征向量;
根据所述目标信息数据中用户的舌照信息与所述第三映射表中预置舌照信息之间的映射关系,提取得到所述用户的舌照信息对应的第四特征向量。
4.根据权利要求2所述的方法,其特征在于,所述第二模型包括多层感知器深度模型或主成分分析模型;所述通过第二模型对所述初始特征向量进行处理,得到所述目标信息数据对应的目标特征向量,包括:
当所述参考信息集合中历史信息数据量大于或等于预设阈值,且所述历史信息数据带有标签时,通过所述多层感知器深度模型处理所述初始特征向量,得到所述目标信息数据对应的目标特征向量;
当所述参考信息集合中历史信息数据量小于所述预设阈值,或所述参考信息集合中历史信息数据不带标签时,通过所述主成分分析模型处理所述初始特征向量,得到所述目标信息数据对应的目标特征向量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息,包括:
根据所述目标信息数据对应的目标特征向量,通过第三模型从参考信息集合中获取所述在线信息数据对应的目标参考信息;
其中,所述第三模型通过如下步骤构建得到:
确定所述目标特征向量的特征向量维度和相似性度量指标;其中,所述相似性度量指标包括:欧式距离度量和夹角余弦值度量;
当所述目标特征向量的特征向量维度小于或等于预设维度,且所述目标特征向量的相似性度量指标使用欧式距离度量时,选择kd树构建所述第三模型;
当所述目标特征向量的特征向量维度大于所述预设维度,或所述目标特征向量的相似性度量指标使用夹角余弦值度量时,选择球树构建所述第三模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京悦熙兴中科技有限公司,未经北京悦熙兴中科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010140962.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种试管架的进样退样模组
- 下一篇:网络直购管理方法、系统、设备与平台