[发明专利]新闻文章分类的方法、装置、设备及存储介质在审
申请号: | 201910046633.9 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109918501A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 刘立天 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及人工智能领域,提供一种新闻文章分类的方法、装置及存储介质,所述方法包括:获取第一数据集,对所述第一数据集进行预处理,得到训练集和测试集;采用分层表征方式,利用训练集预训练分类模型,得到所述分类模型的参数;调整所述分类模型中的参数,得到所述分类模型的最优模型参数后,构建语言模型;利用所述语言模型对所述测试集进行测试,若检测出所述语言模型的准确率高于预设阈值,则确定所述语言模型符合分类条件;根据所述语言模型对输入所述语言模型的第二数据集进行分类。提供采用本方案,能够提高新闻文章分类的准确率,以及提高word2vec预训练的词向量模型对新闻文章的分类效果。 | ||
搜索关键词: | 语言模型 新闻文章 分类模型 分类 存储介质 第一数据 测试集 训练集 准确率 预处理 人工智能领域 表征方式 分类条件 分类效果 训练分类 最优模型 词向量 数据集 分层 构建 预设 测试 检测 申请 | ||
【主权项】:
1.一种新闻文章分类的方法,其特征在于,所述方法包括:获取第一数据集,所述第一数据集可包括多篇新闻文章;对所述第一数据集进行预处理,得到训练集和测试集;采用分层表征方式,利用训练集预训练分类模型,得到所述分类模型的参数;调整所述分类模型中的参数,得到所述分类模型的最优模型参数后,构建语言模型;利用所述语言模型对所述测试集进行测试,若检测出所述语言模型的准确率高于预设阈值,则确定所述语言模型符合分类条件;根据所述语言模型对输入所述语言模型的第二数据集进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910046633.9/,转载请声明来源钻瓜专利网。