[发明专利]基于规则模板的语料分析方法及语料分析装置有效
申请号: | 201611140114.1 | 申请日: | 2016-12-12 |
公开(公告)号: | CN108614828B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 辛雨非 | 申请(专利权)人: | 北大方正集团有限公司;北京北大方正电子有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/205;G06F40/279 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 规则 模板 语料 分析 方法 装置 | ||
本发明提出了一种基于规则模板的语料分析方法及装置,基于规则模板的语料分析方法包括:获取语料;根据模型映射,记录语料的语料归属模型,并将语料存储至子语料库;在语料归属模型中建立知识元;根据属性映射,确定知识元的属性;根据知识元的属性,获取目标知识元;建立知识元与目标知识元的关联关系,采用本发明的方法能够大大减少语料分析过程的人力,将分析过程中的分类、建立知识元、属性填充和关系建立全部变为程序自动完成,提高了对语料分析的效率,节约了时间,保证了准确性。
技术领域
本发明涉及数字资源知识体系管理技术领域,具体而言,涉及一种基于规则模板的语料分析方法及基于规则模板的语料分析装置。
背景技术
知识服务是出版单位追捧的热点应用,国家在这方面的大量的资金投入也加快了知识服务在出版单位落地的时间,而知识服务的一个重要依赖内容就是知识体系的构建,只有建立了完善而专业的知识体系,才能更好地提供知识服务。
对于专业出版社来说,专业优质的知识是其核心资源,也是其与互联网内容的最大区别,建立起专业知识体系来提供知识服务是其将核心资源进行应用的一种有效的渠道,但出版社的资源却又比较分散,传统的资源管理方式都是将资源作为一条条语料存储在数据库或数据文件中进行利用和管理,如何将这些语料高效的构建为专业全面的知识体系就是一个亟待解决又十分有价值的研究课题。
目前,在利用语料建立知识体系的过程中,对语料的处理主要是人工分析,需要人工阅读语料的词头、描述等各项内容,根据这些内容来判断语料应该属于哪个分类,对应哪个模型,然后在找到的模型下手动建立与词头同名的知识元,之后还要人工分析语料中的内容,根据模型指定好的属性一一提取出来本词条对应知识元所拥有的具体属性值,最后也是最耗费人力的就是知识元关系的建立,需要根据已知的模型间关系,去到关系起点和终点两个模型中寻找哪两个具体的知识元应该建立一个关系,整个过程人工参与的程度高,造成容易出错、耗时长、效率低等缺点。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提出了一种基于规则模板的语料分析方法。
本发明的另一个目的在于提出了一种基于规则模板的语料分析装置。
有鉴于此,根据本发明的一个目的,提出了一种基于规则模板的语料分析方法,包括:获取语料;根据模型映射,记录语料的语料归属模型,并将语料存储至子语料库;在语料归属模型中建立知识元;根据属性映射,确定知识元的属性;根据知识元的属性,获取目标知识元;建立知识元与目标知识元的关联关系。
本发明提供的基于规则模板的语料分析方法,获取语料,通过模型映射,记录语料的语料归属模型,同时将语料复制到与语料归属模型同名的子语料库中,在语料归属模型中建立知识元,根据属性映射,自动确定知识元的属性,根据知识元的属性,获取目标知识元,建立知识元与目标知识元的关联关系,采用本发明的方法能够大大减少语料分析过程的人力,将分析过程中的分类、建立知识元、属性填充和关系建立全部变为程序自动完成,使用者的工作仅仅是在最开始拿小部分语料数据进行规律的分析和总结,后续全程都是自动进行,不需要用户手动参与,提高了对语料分析的效率,节约了时间,保证了准确性。
根据本发明的上述基于规则模板的语料分析方法,还可以具有以下技术特征:
在上述技术方案中,优选地,获取语料之前,还包括:建立至少一个语料归属模型;为每个至少一个语料归属模型设置模型属性;建立至少一个语料归属模型与其它语料归属模型之间的模型关系;将模型关系与模型属性进行绑定;建立规则模板;将规则模板与至少一个语料归属模型的模型关系进行绑定,进而建立至少一个语料归属模型的模型映射,其中模型映射包括模型映射规则;将规则模板与至少一个语料归属模型的模型属性进行绑定,进而建立至少一个语料归属模型的属性映射,其中属性映射包括属性映射规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611140114.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据切分方法、判重方法及电子设备
- 下一篇:一种播放方法及终端