[发明专利]潜在成交房源筛选方法、装置、设备及可读存储介质在审
| 申请号: | 201810043521.3 | 申请日: | 2018-01-17 |
| 公开(公告)号: | CN108230039A | 公开(公告)日: | 2018-06-29 |
| 发明(设计)人: | 郑来良 | 申请(专利权)人: | 平安好房(上海)电子商务有限公司 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06;G06Q50/16 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
| 地址: | 200000 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 筛选 测试样本数据 可读存储介质 训练样本数据 目标模型 特征因子 样本数据 筛选模型 数据提取 成交量 | ||
1.一种潜在成交房源筛选方法,其特征在于,所述潜在成交房源筛选方法包括:
获取房源成交数据,基于该房源成交数据提取房源筛选的特征因子;
基于所述特征因子与所述房源成交数据,建立样本数据,并对所述样本数据进行拆分处理,以获取训练样本数据和测试样本数据;
基于该训练样本数据和测试样本数据训练潜在成交房源筛选模型,以确定潜在成交房源筛选的目标模型,以基于所述目标模型筛选潜在成交房源。
2.如权利要求1所述的潜在成交房源筛选方法,其特征在于,所述基于所述特征因子与所述房源成交数据,建立样本数据步骤包括:
获取各个特征因子的数据规则,逐一对所述房源成交数据进行数据清洗、合并、完整性验证处理;
将经所述清洗、合并、完整性验证处理后的房源成交数据转化为数值数据,将所述数值数据作为样本数据。
3.如权利要求1所述的潜在成交房源筛选方法,其特征在于,所述对所述样本数据进行拆分处理,以获取训练样本数据和测试样本数据步骤包括:
获取所述样本数据的拆分规则,基于该拆分规则获取训练样本数据和测试样本数据,其中,所述拆分规则包括所述训练样本数据多于测试样本数据,所述训练样本数据与测试样本数据中均含有成交房源数据与未成交房源数据;
对训练样本数据和测试样本数据进行归一化处理。
4.如权利要求1-3任一项所述的潜在成交房源筛选方法,其特征在于,所述基于该训练样本数据和测试样本数据训练潜在成交房源筛选模型,以确定潜在成交房源筛选的目标模型步骤包括:
获取预存的潜在成交房源筛选模型,基于训练样本数据训练所述潜在成交房源筛选模型,以得到预测模型;
基于所述测试样本数据测试所述预测模型,以得到测试结果,基于该测试结果确定目标模型。
5.如权利要求4所述的潜在成交房源筛选方法,其特征在于,所述潜在成交房源筛选模型中包括待调整参数,所述待调整参数包括决策树数量,
所述基于训练样本数据训练所述潜在成交房源筛选模型,以得到预测模型步骤包括:
通过网格搜索各个决策树数量,并基于网格搜索的各个决策树数量与训练样本数据,训练所述潜在成交房源筛选模型,以得到各个训练结果;
基于所述各个训练结果,从各个决策树数量中确定目标决策树数量;
基于所述目标决策树,调整潜在成交房源筛选模型的决策树数量,以得到预测模型。
6.如权利要求5所述的潜在成交房源筛选方法,其特征在于,所述基于所述测试样本数据测试所述预测模型,以得到测试结果,基于该测试结果确定目标模型步骤包括:
获取所述目标决策树的最大深度步数,并基于该最大深度步数、所述最大深度步数中各个步数对应的各个数据节点,获取各个最小叶子节点的数据;
通过网格搜索所述各个最小叶子节点的数据,以确定目标迭代深度步数;
基于所述迭目标迭代深度步数与目标决策树数量,调整潜在成交房源筛选模型的迭代深度步数与目标决策树数量,以获取参数调整后的调整模型;
基于所述测试样本数据测试所述调整模型,判断所述调整模型是否收敛,当收敛时,该调整模型即为目标模型。
7.如权利要求5所述的潜在成交房源筛选方法,其特征在于,所述通过网格搜索各个决策树数量,并基于网格搜索的各个决策树数量与训练样本数据,训练所述潜在成交房源筛选模型,以得到各个训练结果步骤包括:
通过网格搜索各个决策树数量,以获取各个决策树数量对应的各个信息熵,其中,信息熵由公式确定,P(i)为事件发生的概率;
基于信息熵的大小从高至低选取预设个数的决策树数量,并基于该预设个数的决策树数量与训练样本数据,训练所述潜在成交房源筛选模型,以得到各个训练结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安好房(上海)电子商务有限公司,未经平安好房(上海)电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810043521.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息推送方法、服务器和计算机可读存储介质
- 下一篇:到店预测方法及装置





