[发明专利]校验行业文本的方法和装置有效
申请号: | 201611256002.2 | 申请日: | 2016-12-29 |
公开(公告)号: | CN108255887B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 孙德彬 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/953 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校验 行业 文本 方法 装置 | ||
本发明公开了一种校验行业文本的方法和装置。其中,该方法包括:建立第一数据库,其中,第一数据库用于存储行业人员的职位顺序;根据第一知识库建立第二数据库和第三数据库,其中,第二数据库用于存储行业人员的姓名,第三数据库用于存储行业人员的职位;根据第一数据库、第二数据库以及第三数据库对待测文本中的行业人员的职位顺序、姓名以及职位进行校验。本发明解决了现有的校验行业文本的方法任务量大以及校验精度低的技术问题。
技术领域
本发明涉及数据库领域,具体而言,涉及一种校验行业文本的方法和装置。
背景技术
随着信息化的飞速发展,人们获取信息资源的渠道越来越多。但在人们获取信息的同时,也会发现信息中出现了许多错误,尤其在新闻、报告等资源中的错误将会带来严重的影响。在政府行业中的新闻发布稿中常会出现政府行业人员名字错误、职位错误以及顺序排列错误等问题,例如,市长姓名在新闻的发布稿中的顺序是在市委书记或省长之前。类似上述问题需要校验人员有非常的敏感性和专业性才能发现,并且也不能保证100%的准确度。而目前多采用人工对信息资源中的错误进行校正,这种方法使得信息校验人员的任务量非常大,而且效率还比较低。
针对上述现有的校验行业文本的方法任务量大以及校验精度低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种校验行业文本的方法和装置,以至少解决现有的校验行业文本的方法任务量大以及校验精度低的技术问题。
根据本发明实施例的一个方面,提供了一种校验行业文本的方法,包括:建立第一数据库,其中,第一数据库用于存储行业人员的职位顺序;根据第一数据库建立第二数据库和第三数据库,其中,第二数据库用于存储行业人员的姓名,第三数据库用于存储行业人员的职位;根据第一数据库、第二数据库以及第三数据库对待测文本中的行业人员的职位顺序、姓名以及职位进行校验。
根据本发明实施例的另一方面,还提供了一种校验行业文本的装置,包括:第一建立模块,用于建立第一知识库,其中,第一数据库用于存储行业人员的职位顺序;第二建立模块,用于根据第一数据库建立第二数据库以及第三数据库,其中,第二数据库用于存储行业人员的姓名,第三数据库用于存储行业人员的职位;校验模块,用于根据第一数据库、第二数据库以及第三数据库对待测文本中的行业人员的职位顺序、姓名以及职位进行校验。
在本发明实施例中,采用机器校验行业文本的方式,通过建立第一数据库,并根据第一数据库建立第二数据库和第三数据库,最后根据第一数据库、第二数据库和第三数据库对待测文本中的行业人员的职位顺序、姓名以及职位进行校验,达到了对行业人员的姓名、职位以及顺序进行精确校验的目的,从而实现了减少文本校验人员的任务量以及提高校验精度的技术效果,进而解决了现有的校验行业文本的方法任务量大以及校验精度低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种校验行业文本的方法流程图;
图2是根据本发明实施例的一种可选的校验行业文本的方法流程图;
图3是根据本发明实施例的一种可选的校验行业文本的方法流程图;
图4是根据本发明实施例的一种可选的校验行业文本的方法流程图;
图5是根据本发明实施例的一种可选的校验行业文本的方法流程图;
图6是根据本发明实施例的一种可选的校验行业文本的方法流程图;以及
图7是根据本发明实施例的一种校验行业文本的装置结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611256002.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种歌曲的推荐方法及系统
- 下一篇:一种数据处理方法及系统