[发明专利]一种基于倒排索引与Seq2Seq模型的法律法规推荐方法及系统在审
| 申请号: | 202011140053.5 | 申请日: | 2020-10-22 |
| 公开(公告)号: | CN112287066A | 公开(公告)日: | 2021-01-29 |
| 发明(设计)人: | 李石君;唐培根;余伟;杨济海;余放;杨俊成;李宇轩 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/335;G06N3/08;G06Q50/18 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 索引 seq2seq 模型 法律法规 推荐 方法 系统 | ||
本发明涉及一种基于倒排索引与Seq2Seq模型的法律法规推荐方法及系统,属于推荐系统的研究范畴,涉及倒排索引、RNN神经网络、Seq2Seq模型等领域,主要针对审计中涉及的法律法规、案例等数据构建倒排索引以及Seq2Seq神经网络模型,利用已经训练好的模型实现法律法规及相关案例的智能推荐任务。本发明的优点:可以自动根据场景、关键词智能推荐相关的法律法规以及案例,降低从业者的劳动负荷,提高劳动效率。
技术领域
本发明涉及有监督分类和智能推荐技术领域,具体涉及一种基于倒排索引与Seq2Seq模型的法律法规推荐方法及系统。
背景技术
审计:是对资料做出证据搜集及分析,以评估企业财务状况,然后就资料及一般公认准则之间的相关程度做出结论及报告。常见的财务审计有以下3种:运作审计(作业审计):检讨组织的运作程序及方法以评估其效率及效益;履行审计(遵行审计):评估组织是否遵守由更高权力机构所订的程序、守则或规条;财务报表审计:评估企业或团体的财务报表是否根据公认会计准则编制,一般由独立会计师进行。资讯科技审计:评估企业或机构的资讯系统的安全性,完整性、系统可靠性及一致性。
现有技术中,相关领域的做法主要是靠被动建立法律法规及案例的数据库,之后再由从业人员主动检索、比对相关的情节与法律法规的规定不符之处,这样的工作模式完全依赖于从业人员极高的专业素养。因此,现有技术中需要进行人工检索,无法实现法律法规推荐的问题。
发明内容
本发明提出一种基于倒排索引与Seq2Seq模型的法律法规推荐方法及系统,用于解决或者至少部分解决现有技术的方法存在的法律法规检索效率低的技术问题。
为了解决上述技术问题,本发明第一方面提供了一种基于倒排索引与Seq2Seq模型的法律法规推荐方法,包括:
S1:构建相关法律法规及案例文档的全文倒排索引;
S2:构建Seq2Seq神经网络模型,并对Seq2Seq神经网络模型进行训练,其中,Seq2Seq神经网络模型包括编码器和解码器,编码器用于根据检索词或违规行为经分词后的序列得到网络节点的状态,解码器用于根据编码器的输出生成检索词或违规行为名称对应的关键词序列,检索词或违规行为名称对应的关键词序列为针对法律法规及案例文档全文生成的倒排索引词典中的词序列;
S3:利用训练好的Seq2Seq神经网络模型进行法律法规推荐。
在一种实施方式中,步骤S1包括:
S1.1:基于Python读取法律法规及案例文档全文,以法条或案例为基本单位对其中的文字信息,利用正则表达式进行中文分词操作;
S1.2:对中文分词操作产生的词条结果进行归一化,形成词项词典;
S1.3:根据词项词典对所有文档按照其中出现的词项建立倒排索引。
在一种实施方式中,S2包括:
S2.1:构建中文常用词汇的one-hot编码;
S2.2:构建基于词汇的one-hot编码的编码器,其中,编码器的输入是检索词或违规行为经分词后的序列,
Si=(xi1,xi2,…,xiM)T,i∈1,2,3…N
其中,Si表示第i条记录的数据,xij表示其中的第j个词,M是Si的长度,N为数据条数;
编码器的输出ci:
ci=hiM,i∈1,2,3…N
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011140053.5/2.html,转载请声明来源钻瓜专利网。





