[发明专利]一种基于训练集循环扩充的文本多分类的方法在审
申请号: | 201610535646.9 | 申请日: | 2016-07-09 |
公开(公告)号: | CN107590156A | 公开(公告)日: | 2018-01-16 |
发明(设计)人: | 李雪鹏;田昊枢;毛智愚;欧高炎 | 申请(专利权)人: | 北京至信普林科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及文本多分类系统技术领域,特别涉及一种基于机器学习的应用程序分类的方法。通过应用循环扩充训练集,以提高使用计算机进行文本多分类的分类效果。具体技术方案包括使用文本信息的标题以及文本信息内容综合考虑方案进行文本多分类的方法;构建关键词、停用词词典的方法;用人工添加规则的方法提高小类别分类的效果。在使用同等数量的正确分类结论(人工标注的正确结论),循环扩充训练集的方法可以有效提升利用计算机进行文本多酚类的准确率。同时,该方法的分类效率远高于人工分类。 | ||
搜索关键词: | 一种 基于 训练 循环 扩充 文本 分类 方法 | ||
【主权项】:
循环扩充训练集的方法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京至信普林科技有限公司,未经北京至信普林科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610535646.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种热弯机成型模具的清理装置
- 下一篇:一种家电清洗装置