[发明专利]文本分类方法及装置在审
申请号: | 201811471905.1 | 申请日: | 2018-12-03 |
公开(公告)号: | CN109558489A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 赵卓成;马奥;吴明;陈英华;章祥 | 申请(专利权)人: | 南京中孚信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 邓超 |
地址: | 210000 江苏省南京市浦口区江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供一种文本分类方法及装置,涉及数据处理技术领域。本公开提供的文本分类方法及装置,基于预先构建的词袋库预先生成策略匹配库,以使策略匹配库包括词袋库中各词袋的关注词,并通过预先生成的策略匹配库,对输入的数据进行扫描匹配,输出匹配后的数据结果;并计算输出的数据结果的参量值,将计算得到的参量值与数据结果对应匹配的关注词的参量值进行比对,判断比对结果是否在预设的误差范围内,在判断过后,输出在预设的误差范围内数据结果,并进行分类处理,实现了快速对输入数据的分类处理,提高了数据分类的效率。 | ||
搜索关键词: | 数据结果 策略匹配 文本分类 分类处理 预先生成 袋库 预设 匹配 数据处理技术 比对结果 输出匹配 数据分类 输出 比对 构建 扫描 | ||
【主权项】:
1.一种文本分类方法,其特征在于,所述方法包括:基于预先生成的策略匹配库,对输入的数据进行扫描匹配,输出匹配后的数据结果;所述策略匹配库基于预先构建的词袋库生成,所述词袋库中包括多个词袋,各所述词袋包括多个关注词以及各所述关注词的参量值,所述策略匹配库包括各所述词袋的关注词;计算得到输出的数据结果的参量值;将计算得到的参量值与所述数据结果对应匹配的关注词的参量值进行比对,判断比对结果是否在预设的误差范围内;输出在所述预设的误差范围内的数据结果,并进行分类处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中孚信息技术有限公司,未经南京中孚信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811471905.1/,转载请声明来源钻瓜专利网。
- 上一篇:基于数据对犯罪行为的多维度分析方法
- 下一篇:一种提高期刊学术影响力的方法