[发明专利]溶解度预测模型的训练数据获取方法及装置有效
| 申请号: | 202010652020.2 | 申请日: | 2020-07-08 |
| 公开(公告)号: | CN111599417B | 公开(公告)日: | 2023-10-20 |
| 发明(设计)人: | 孟金涛 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G16C10/00 | 分类号: | G16C10/00;G16C20/30;G16C20/70 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 溶解度 预测 模型 训练 数据 获取 方法 装置 | ||
1.一种溶解度预测模型的训练数据获取方法,其特征在于,所述方法包括:
获取至少两个训练数据集的第一溶解度数据,一个第一溶解度数据包括一个分子数据的溶解度值;
分别将每个训练数据集中重复的所述第一溶解度数据合并,得到所述每个训练数据集对应的第二溶解度数据以及各个第二溶解度数据的第一权重,所述第一权重用于指示所述第二溶解度数据对应的所述第一溶解度数据的重复度;
基于所述每个训练数据集的所述第一溶解度数据,对溶解度预测模型进行训练,基于所述溶解度预测模型的模型预测结果,确定所述每个训练数据集对应的第二权重,所述第二权重用于指示所述每个训练数据集的数据准确度;
对于任一训练数据集,基于所述每个训练数据集对应的第二权重,从所述至少两个训练数据集中确定至少一个训练数据集,作为所述任一训练数据集对应的至少一个参考数据集;
基于所述任一训练数据集对应的参考数据集的第二权重、所述参考数据集对应的第二溶解度数据以及各个所述第二溶解度数据的第一权重,对所述任一训练数据集进行数据修复,得到目标训练数据,一个所述目标训练数据包括一个分子数据的溶解度值以及所述溶解度值的目标权重,所述目标权重用于指示所述溶解度数据的准确度。
2.根据权利要求1所述的方法,其特征在于,所述分别将每个训练数据集中重复的所述第一溶解度数据合并,得到所述每个训练数据集对应的第二溶解度数据以及各个第二溶解度数据的第一权重,包括:
对于每个训练数据集,将对应于相同分子数据的所述第一溶解度数据分为一组,得到至少两组溶解度数据;
对于每一组溶解度数据,分别将包括相同溶解度值的所述第一溶解度数据合并,得到至少一个第二溶解度数据;
基于所述第二溶解度数据所包含所述第一溶解度数据的数目,确定所述第二溶解度数据的所述第一权重。
3.根据权利要求1所述的方法,其特征在于,所述基于所述每个训练数据集的所述第一溶解度数据,对溶解度预测模型进行训练,基于所述溶解度预测模型的模型预测结果,确定所述每个训练数据集对应的第二权重,包括:
对于所述每个训练数据集,基于训练数据集中第一目标数量的所述第一溶解度数据,对所述溶解度预测模型进行训练,得到训练好的溶解度预测模型;
对于所述每个训练数据集,基于训练数据集中第二目标数量的所述第一溶解度数据,确定所述训练好的溶解度预测模型的模型预测精度;
基于所述每个训练数据集对应的所述模型预测精度,确定所述每个训练数据集对应的第二权重,所述第二权重与所述模型预测精度正相关。
4.根据权利要求1所述的方法,其特征在于,所述对于任一训练数据集,基于所述每个训练数据集对应的第二权重,从所述至少两个训练数据集中确定至少一个训练数据集,作为所述任一训练数据集对应的至少一个参考数据集,包括:
将所述每个训练数据集对应的第二权重与所述任一训练数据集对应的第二权重进行比较;
获取所对应的第二权重大于或等于所述任一训练数据集对应的第二权重的所述训练数据集,作为所述任一训练数据集对应的参考数据集。
5.根据权利要求1所述的方法,其特征在于,所述基于所述任一训练数据集对应的参考数据集的第二权重、所述参考数据集对应的第二溶解度数据以及各个所述第二溶解度数据的第一权重,对所述任一训练数据集进行数据修复,得到目标训练数据,包括:
基于所述参考数据集对应的第二权重、所述参考数据集对应的第二溶解度数据以及各个所述第二溶解度数据的第一权重,生成修复数据集,所述修复数据集包括所述参考数据集对应的第二溶解度数据以及各个所述第二溶解度数据的第三权重,所述第三权重用于指示所述第二溶解度数据的准确度;
基于所述修复数据集,对所述任一训练数据集进行数据修复,得到目标训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010652020.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:终端配件及光源控制方法
- 下一篇:一种简易书本计数器





