[发明专利]服务器存储新闻的存储资源优化方法及系统在审
申请号: | 201910593949.X | 申请日: | 2019-07-03 |
公开(公告)号: | CN110413899A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 马文佳 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/958;G06F16/33 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 葛勤 |
地址: | 518029 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻数据 新闻主题 处理数据 标注 存储资源优化 格式化 服务器存储 求和结果 提取数据 删除 词汇 服务器调用 服务器资源 敏感性分析 优化服务器 存储资源 提供商 求和 分词 过滤 分类 概率 保留 优化 | ||
本发明公开了一种服务器存储新闻的存储资源优化方法及系统,涉及服务器资源优化技术领域,用于优化服务器的存储资源,包括:对新闻数据分类,并将获取的新闻数据格式化;将格式化新闻进行分词标注处理生成新闻处理数据;对标注的动词及名词敏感性分析生成分析结果;若分析结果中有敏感性词汇,将新闻处理数据对应的新闻数据过滤并删除;若分析结果不具有敏感性词汇,提取新闻处理数据中标注的动词及名词生成提取数据;根据提取数据生成新闻主题;对新闻主题中概率最大的主题求和;若求和结果大于或等于阈值,保留新闻主题对应的新闻数据,若求和结果小于阈值,删除新闻主题对应的新闻数据;从而提高了新闻提供商的服务器调用有价值的新闻的效率。
技术领域
本发明涉及服务器资源优化技术领域,尤其涉及一种服务器存储新闻的存储资源优化方法及系统。
背景技术
随着互联网技术的发展,人们逐渐习惯从互联网上读取新闻来了解天下事,然而由于种种原因,互联网上出现了一些无意义的文章、广告软文等无价值的新闻,而这些无价值的新闻若出现在新闻提供商提供的新闻处,站在用户的角度来看,读取无价值的新闻会浪费用户的时间,站在新闻提供商的角度来看,用户若读取了过多的无价值新闻,则会慢慢失去对该新闻提供商的信任,从而换一个新闻提供商,这对新闻提供商也是极为不利的。
而为了剔除互联网上无价值的新闻,新闻提供商中的编辑、记者等工作岗位的人会通过人工判断新闻的价值,从而剔除一些无价值的新闻。
然而,互联网时代的信息量是呈爆炸式增长的,通过人工来剔除无价值的新闻需要极其庞大的团队来完成,而显然,大多数新闻提供商无法组建庞大的团队来完成无价值新闻的剔除,这就造成了无价值新闻的剔除效率低下的后果,从而使得无价值的新闻占据了新闻提供商使用服务器的大量存储资源,久而久之会出现新闻提供商的服务器在调用有价值的新闻时,效率低下的问题。
发明内容
本发明的主要目的在于提供一种服务器存储新闻的存储资源优化方法及系统,旨在解决现有技术中新闻提供商的服务器在调用有价值的新闻时,效率低下的技术问题。
为实现上述目的,本发明第一方面提供一种服务器存储新闻的存储资源优化方法,包括:对新闻数据进行分类,生成新闻类别,并将获取的新闻数据进行格式化,生成格式化新闻;在所述新闻类别下,将所述格式化新闻进行分词标注处理,生成新闻处理数据;对所述新闻处理数据中标注的动词及名词进行敏感性分析,生成分析结果;判断所述分析结果,若所述分析结果表明所述新闻处理数据中具有敏感性词汇,则将新闻处理数据对应的新闻数据过滤并删除;若所述分析结果表明所述新闻处理数据中不具有敏感性词汇,则提取所述新闻处理数据中标注的动词及名词,生成提取数据;根据所述提取数据生成至少一个新闻主题;对所有所述新闻主题中概率最大的主题进行求和,得到求和结果;将所述求和结果与预先设定的阈值对比,若所述求和结果大于或等于所述阈值,则保留所述新闻主题对应的新闻数据,若所述求和结果小于所述阈值,则删除所述新闻主题对应的新闻数据。
进一步地,所述方法还包括:对新闻数据进行排序;所述对新闻数据进行排序包括:获取新闻数据的新闻信息,所述新闻信息包括新闻时间、信息源、相似新闻数量及热度词;根据所述新闻信息对新闻数据的价值进行评估,生成新闻数据的评估数值;根据所述评估数值的大小,根据从大到小的顺序为新闻数据进行排序。
进一步地,设置三个阶段数值,根据所述阶段数值的范围将所述评估数值分为评估数值高、评估数值中及评估数值低三个阶段;将三个阶段数值范围内对应的新闻数据按照范围不同分别存储至服务器的不同区域内。
进一步地,所述方法还包括:根据所述三个阶段数值内的数值调用对应的新闻数据,且优先调用所述评估数值高的范围内的新闻数据,将调用的新闻数据输出并推送至用户处。
进一步地,所述方法还包括:获取并记录用户点击新闻数据对应的所述三个阶段数值内的点击频率;优先调用用户点击所述三个阶段数值内的新闻数据点击频率最高的新闻数据为用户推送新闻数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910593949.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:社交网络中的推荐方法及设备
- 下一篇:基于维特比算法的多社交网络账号匹配方法