[发明专利]一种融合短语先验知识的依存句法分析方法及装置有效
| 申请号: | 202011123436.1 | 申请日: | 2020-10-20 |
| 公开(公告)号: | CN112016301B | 公开(公告)日: | 2021-02-19 |
| 发明(设计)人: | 张丹;石霖;董晓飞;曹峰;孙明俊 | 申请(专利权)人: | 南京新一代人工智能研究院有限公司 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 短语 先验 知识 依存 句法 分析 方法 装置 | ||
1.一种融合短语先验知识的依存句法分析方法,其特征在于,包括步骤:
(1)根据依存句法关系对依存句法分析训练数据进行不同词性短语的边界标记,对不同词性短语进行依存句法分析,分别训练得到不同词性短语的句法分析模型;
(2)将边界标记后的不同词性短语作为短语识别训练语料,训练得到短语识别模型;
(3)对所述短语识别训练语料进行短语内的依存句法分析,得到短语内依存句法信息,构建包含短语内依存句法信息的句法分析训练语料,训练得到融合短语先验知识的句法分析模型;
(4)将待分析句子输入所述短语识别模型,识别出所述待分析句子中的不同词性短语,利用所述不同词性短语的句法分析模型识别出不同词性短语内部的依存句法关系,将识别出的不同词性短语内部的依存句法关系输入到所述融合短语先验知识的句法分析模型中,输出待分析句子的依存句法分析结果。
2.根据权利要求1所述的融合短语先验知识的依存句法分析方法,其特征在于:所述词性包括介词、名词。
3.根据权利要求1所述的融合短语先验知识的依存句法分析方法,其特征在于,所述依存句法分析训练数据为对句子进行分词、词性标注后的数据。
4.根据权利要求1所述的融合短语先验知识的依存句法分析方法,其特征在于,所述步骤(1)包括:根据依存句法关系得到依存句法树,判断依存于根节点且为状中关系的介词,找到依存于所述介词的最右节点,进行标记。
5.根据权利要求1所述的融合短语先验知识的依存句法分析方法,其特征在于,所述步骤(1)包括:根据依存句法关系得到依存句法树,判断依存于根节点且为主谓关系或动宾关系的名词是否存在依存于所述名词且为定中关系或复合名词修饰关系的词,若存在则找到依存于该词的最左及最右节点,进行标记。
6.一种基于权利要求1所述分析方法的依存句法分析装置,其特征在于,包括:
预处理模块,用于根据依存句法关系对依存句法分析训练数据进行不同词性短语的边界标记,构建短语识别训练语料;对所述短语识别训练语料进行短语内的依存句法分析,得到短语内依存句法信息,构建包含短语内依存句法信息的句法分析训练语料;
训练模块,用于对不同词性短语数据进行依存句法分析,分别训练得到对应词性短语的句法分析模型;利用构建的短语识别训练语料训练得到短语识别模型;利用构建的包含短语内依存句法信息的句法分析训练语料训练得到融合短语先验知识的句法分析模型;
分析模块,用于将待分析句子输入所述短语识别模型,识别出所述待分析句子中的不同词性短语,利用所述不同词性短语的句法分析模型识别出不同词性短语内部的依存句法关系,将识别出的不同词性短语内部的依存句法关系输入到所述融合短语先验知识的句法分析模型中,输出待分析句子的依存句法分析结果。
7.根据权利要求6所述的依存句法分析装置,其特征在于,所述预处理模块用于根据依存句法关系得到依存句法树,判断依存于根节点且为状中关系的介词,找到依存于所述介词的最右节点,进行介词短语边界标记,抽取介词短语句法分析训练语料;判断依存于根节点且为主谓关系或动宾关系的名词是否存在依存于所述名词且为定中关系或复合名词修饰关系的词,若存在则找到依存于该词的最左及最右节点,进行名词短语边界标记,抽取名词短语句法分析训练语料;根据标记后的边界抽取短语识别训练语料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京新一代人工智能研究院有限公司,未经南京新一代人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011123436.1/1.html,转载请声明来源钻瓜专利网。





