[发明专利]一种文本分类方法、系统及相关组件在审
申请号: | 201910329946.5 | 申请日: | 2019-04-23 |
公开(公告)号: | CN110059647A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 杨紫崴;赵明 | 申请(专利权)人: | 杭州智趣智能信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 310000 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种文本分类方法,所述文本分类方法包括获取原始训练样本集并将原始训练样本集中每一张图片划分为文本区域图像和非文本区域图像;根据文本区域图像对应的文本类别对文本区域图像进行类别标注操作,并将标注后的文本区域图像设置为正样本;将非文本区域图像设置为负样本;利用所述正样本和所述负样本训练文本分类模型,并利用所述文本分类模型对目标物体图像执行文本分类操作得到所述目标物体图像中每一文本内容对应的文本类别。本申请能够提高文本分类过程中文本类别的识别准确率,优化文本分类流程。本申请还公开了一种文本分类系统、一种计算机可读存储介质及一种电子设备,具有以上有益效果。 | ||
搜索关键词: | 文本分类 文本区域图像 目标物体图像 原始训练样本 非文本区域 文本类别 负样本 正样本 申请 计算机可读存储介质 文本分类模型 文本分类系统 电子设备 分类模型 类别标注 图像设置 文本内容 相关组件 训练文本 准确率 标注 图像 中文 优化 图片 | ||
【主权项】:
1.一种文本分类方法,其特征在于,包括:获取原始训练样本集并将所述原始训练样本集中每一张图片划分为文本区域图像和非文本区域图像;根据所述文本区域图像对应的文本类别对所述文本区域图像进行类别标注操作,并将标注后的文本区域图像设置为所述正样本;将所述非文本区域图像设置为负样本;利用所述正样本和所述负样本训练文本分类模型,并利用所述文本分类模型对目标物体图像执行文本分类操作得到所述目标物体图像中每一文本内容对应的文本类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州智趣智能信息技术有限公司,未经杭州智趣智能信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910329946.5/,转载请声明来源钻瓜专利网。