[发明专利]一种基于约束规范的文本分类方法及装置有效
申请号: | 201710779857.1 | 申请日: | 2017-09-01 |
公开(公告)号: | CN107577760B | 公开(公告)日: | 2019-12-17 |
发明(设计)人: | 席丽娜;李德彦;晋耀红 | 申请(专利权)人: | 中科鼎富(北京)科技发展有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 11363 北京弘权知识产权代理事务所(普通合伙) | 代理人: | 逯长明;许伟群 |
地址: | 100089 北京市海淀区万*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种基于约束规范的文本分类方法及装置,首先获取当前业务场景下的样本数据;其次根据所述样本数据、分类体系以及预设约束规范条件,生成本体表达式集;再次,获取当前业务场景下的文本信息,匹配所述本体表达式集中每个节点对应的本体表达式;最后,确定预测分类结果。其中,预设约束规范条件为通配约束、反向约束、位置约束以及信息结构约束中的一个或多个约束条件的组合。通过预设约束规范条件实现文本信息与本体表达式集之间按照预设的规则进行匹配,能够更精确的匹配本体表达式,提高匹配精度,解决传统分类方法精度低的问题。 | ||
搜索关键词: | 一种 基于 约束 规范 文本 分类 方法 装置 | ||
【主权项】:
1.一种基于约束规范的文本分类方法,其特征在于,包括:/n获取当前业务场景下的样本数据;/n根据所述样本数据、当前业务场景下的分类模型和预设约束规范条件,生成分类树及分类树中各节点的本体表达式集;各节点上的所述本体表达式中设置有所述预设约束规范条件对应的算子符号;/n获取待分类文本信息,根据所述待分类文本信息以及约束规范条件,匹配所述本体表达式集中每个节点对应的本体表达式,当触发带有所述算子符号的本体表达式时,按照预设匹配方式匹配节点对应信息;所述预设约束规范条件包括通配约束,所述通配约束是在所述本体表达式中设置通配约束算子符号,包括全子节点符号和跨级匹配符号,并按照以下步骤匹配所述本体表达式:/n获取当前业务场景下的待分类文本信息;/n根据当前业务场景下的语义模型,对所述待分类文本信息进行结构化处理,生成待处理文本信息;/n根据所述待处理文本信息,按节点的层级关系,逐一匹配所述本体表达式集中每个节点对应的本体表达式;/n判断所述本体表达式中的预设约束规范条件,如果所述本体表达式中包括全子节点符号,匹配所述本体表达式对应节点下的所有子节点信息;/n如果所述本体表达式中包括跨级匹配符号,匹配所述本体表达式对应节点下的指定子节点信息;/n根据匹配结果,确定与所述待分类文本信息对应的本体表达式所处节点信息为预测分类结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科鼎富(北京)科技发展有限公司,未经中科鼎富(北京)科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710779857.1/,转载请声明来源钻瓜专利网。
- 上一篇:用户评论自动推荐方法
- 下一篇:一种信息查看方法及相关设备