[发明专利]一种专业文书阅读的智能辅助方法、系统及存储介质在审
申请号: | 202110731773.7 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113297347A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 张海粟;王龙;沈建军;张胜;代亚兰;李向朋 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/36;G06F40/242;G06F40/295;G06F40/30 |
代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 雷霄 |
地址: | 410003 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 专业 文书 阅读 智能 辅助 方法 系统 存储 介质 | ||
本发明公开了一种专业文书阅读的智能辅助方法、系统及存储介质。该方法包括步骤:S1,获取专家知识和领域文档,构建领域知识库,该领域知识库中包括文档、术语、命名实体以及关系四类要素;S2,基于领域知识库进行待阅读专业文书理解和文书关联,即从待阅读专业文书中提取术语、命名实体和关系,根据提取的内容从领域知识库中获取辅助阅读内容,辅助阅读内容包括该待阅读专业文书中提取的术语、命名实体的知识以及关联知识。本发明通过借助于专家知识和领域文档,形成一个机器理解的领域知识库,在用户阅读时可以从领域知识库中获取辅助阅读内容,进行文本理解和文本关联,从而帮助用户快速、高效地阅读专业文书。
技术领域
本发明属于人工智能技术领域,更具体地,涉及一种专业文书阅读的智能辅助方法、系统及存储介质。
背景技术
随着信息化和大数据时代的到来,各行各业的技术资料、文献等专业电子文书数据快速增长,其中涉及到大量新概念、术语、实体,对于非专业人士或初级用户难于理解,或者对专业人士也很难深刻记忆大量的知识资料,这就使得人们在阅读专业文书时,需要耗费大量时间查找资料、文献或者咨询相关人员。
在深度学习出现之后,机器阅读理解技术发展迅速,利用自然语言处理技术辅助文书阅读的系统大量出现在司法文书阅读领域。例如一种现有技术中,利用bert技术对文书进行语义建模,以辅助法律工作人员更迅速地回答在文书中给出的问题。另一种现有技术中,利用ES数据库的覆盖全文的字段检索功能,提高了文书检索效率。但是,这些系统没有将自然语言处理技术中的语义特征和检索系统统一,也仅限于司法文书领域,没有泛化到所有领域文本中。
发明内容
针对现有技术的至少一个缺陷或改进需求,本发明提供了一种专业文书阅读的智能辅助方法、系统及存储介质,可以借助于专家知识和领域文档,形成一个机器理解的领域知识库,在用户阅读时自动从领域知识库中获取辅助阅读内容,帮助用户快速、高效地阅读专业文书。
为实现上述目的,按照本发明的第一方面,提供了一种专业文书阅读的智能辅助方法,包括步骤:
S1,获取专家知识和领域文档,构建领域知识库,该领域知识库中包括文档、术语、命名实体以及关系四类要素;
S2,基于领域知识库从待阅读专业文书中提取术语、命名实体和关系,根据提取的内容从领域知识库中获取辅助阅读内容,辅助阅读内容包括该待阅读专业文书中提取的术语、命名实体的知识以及待阅读专业文书中的术语、命名实体的关联知识。
优选的,所述S1包括子步骤:
S101,获取专家知识和领域文档,构建术语词典、命名实体词典、关系词典和文档库;
S102,分别将术语词典、命名实体词典、关系词典和文档库中数据通过关系一一对应,建立领域知识库。
优选的,所述S2包括子步骤:
S201,对待阅读专业文书进行预处理,预处理包括分词处理、词性标注处理和干扰词处理,获得分词列表;
S202,从分词列表中提取术语、命名实体和关系;
S203,根据提取的内容从领域知识库中获取辅助阅读内容,辅助阅读内容包括该待阅读专业文书中提取的术语、命名实体的知识以及与待阅读专业文书中的术语、命名实体的关联的知识。
优选的,从分词列表中提取术语包括步骤:
从领域知识库提取领域术语集;
将包含相同前缀的术语作为一个术语集合,在每个术语集合中,按照术语词长由长到短排序,并利用术语集合的前缀进行索引;
将分词列表中待识别的词作为关键词,来索引以该关键词为前缀的术语集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110731773.7/2.html,转载请声明来源钻瓜专利网。