[发明专利]一种基于规则和语义的多标签文本分类方法和系统在审
申请号: | 202310272292.3 | 申请日: | 2023-03-16 |
公开(公告)号: | CN116483997A | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 梁果敢;宗云兵;刘传彬;李旭;胡代国;贺作华 | 申请(专利权)人: | 金现代信息产业股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/211;G06F40/253;G06F40/268;G06F40/284 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 250000 山东省济南市高新区新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于规则和语义的多标签文本分类方法和系统,涉及自然语言处理技术领域。该方法步骤包括:获取文本数据,对文本数据进行标签标注,根据标签语义构建分类规则;根据标签语义寻找相同的词、短语或词语组合构建分类规则;根据标点符号位置将文本数据进行拆分;通过词性分析去除拆分后文本中的干扰信息,对去除干扰信息后的文本进行分词;根据分类规则对分词后的文本进行词语匹配,得到匹配到的带有分类标签的词语记录;对词语记录中的标签进行评分,根据分数阈值得到文本分类结果。本发明利用语句中词语的词性,分析句子结构,综合词性和句子成分制定规则,使规则清晰、简洁、覆盖面广,提高了文本分类的速度和精度。 | ||
搜索关键词: | 一种 基于 规则 语义 标签 文本 分类 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金现代信息产业股份有限公司,未经金现代信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310272292.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于快速转换的呼吸系统
- 下一篇:系统组件处理方法、装置、设备及存储介质