[发明专利]基于答案类别和句法指导的案情阅读理解方法在审
申请号: | 202110448963.8 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113076759A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 线岩团;何正海;相艳;王红斌;王蒙 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F40/295;G06F16/35;G06N3/04 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 何娇 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 答案 类别 句法 指导 案情 阅读 理解 方法 | ||
1.基于答案类别和句法指导的案情阅读理解方法,其特征在于:所述方法包括:
Step1、首先对训练数据中无答案类、是类否类进行数据扩充;
Step2、然后经过数据预处理将数据输入到词嵌入层,在词嵌入层对篇章和问题进行向量化;
Step3、紧接着在表示编码层将文本的词嵌入、词性、命名实体、二进制特性、词注意力、字符注意力以及MT-LSTM向量进行拼接综合文本的整体信息编码;
Step4、通过两层GRU进行上下文语义理解;
Step5、然后通过注意力及融合层进行重要信息提取同时做答案有无二分类;
Step6、最终利用输出层获取答案的起始位置和答案三分类。
2.根据权利要求1所述的基于答案类别和句法指导的案情阅读理解方法,其特征在于:所述Step1中,具体是把有答案片段的问题对应的篇章中的答案片段删去和该问题一起作为无答案类来扩充无答案数据,把是否类问题中的实体换成对应实体的英文表示来扩充是否类数据。
3.根据权利要求1所述的基于答案类别和句法指导的案情阅读理解方法,其特征在于:所述Step1中,输入是裁判文书的案情描述和相关的问题,分别为和经数据扩充及Step2的数据预处理得到相应的分词序列:P={p0,p1,...,pn-1}和Q={q0,q1,...,qm-1}、分字序列表示:
P={{p11,...,p1l},...,{pi1,...,pil},...,{pn1,...,pnl}}和
Q={{q11,...,q1l},...,{qi1,...,qil},...,{qm1,...,qml}}。
4.根据权利要求3所述的基于答案类别和句法指导的案情阅读理解方法,其特征在于:所述Step2中,在词嵌入层将文本的分词序列及分字序列输入到词嵌入层分别得词嵌入和字符词嵌入;
CiP=E(pi) (1)
CiQ=E(qi) (2)
Ci·P=E(pi) (3)
Ci·Q=E(qi) (4)
其中,表示篇章经词嵌入编码的词嵌入,表示问题经词嵌入编码的词嵌入,表示篇章经词嵌入编码的字符词嵌入,表示问题经词嵌入编码的字符词嵌入;
为了选出词组中最能代表词语意思的那个字,将字符词嵌入表示做以下处理:
此时的表示词语中最能代表词语意思的那个字,这个字表示用来和词级嵌入向量拼接融合作为整个模型的词嵌入表示,并且做下一步的字符注意力。
5.根据权利要求1所述的基于答案类别和句法指导的案情阅读理解方法,其特征在于:所述Step5中,在注意力及融合层,通过问题对篇章的注意力以及篇章自注意力增加与问题相关的信息权重,然后融合注意力及自注意力结果。
6.根据权利要求1所述的基于答案类别和句法指导的案情阅读理解方法,其特征在于:所述Step5中,在注意力及融合层,在问题对篇章的注意力之后基于答案标签对篇章用softmax作二分类,一类为有答案,另一类为无答案类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110448963.8/1.html,转载请声明来源钻瓜专利网。