[发明专利]一种依存结构树库获取方法及系统有效
申请号: | 201611208593.6 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106598951B | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 武英波;杜建平;吕坤河 | 申请(专利权)人: | 北京金山办公软件股份有限公司;珠海金山办公软件有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种依存结构树库获取方法及系统,包括:调用第一树库,采用第一树库的转换工具将第一树库中的短语结构转换为依存结构;利用句法分析器对第一树库中的扁平结构的短语结构转换为依存结构;利用训练得到的依存关系映射模型,对第一树库中的依存结构进行依存关系转换,得到第二树库类型的依存结构树库,使得转换后的树库能与原有的依存结构树库合并,增大树库规模,提高句法分析器的性能。 | ||
搜索关键词: | 一种 依存 结构 获取 方法 系统 | ||
【主权项】:
1.一种依存结构树库获取方法,其特征在于,该方法包括:调用第一树库;所述第一树库为汉语短语结构树库;分别采用第一树库的转换工具以及句法分析器,将所述第一树库中的短语结构转换为依存结构;第二树库为依存结构的树库;所述句法分析器是利用所述第二树库中的短语进行训练的;其中,采用第一树库的转换工具将所述第一树库中的短语结构转换为依存结构包括:利用所述转换工具所提供的将第一树库中的短语结构转换为依存结构的规则,或对所述规则进行修正后所得到的规则,将所述短语结构转换为依存结构;以及,基于规则的方法进行归纳,将所述第一树库中的并列结构的短语结构转换为依存结构;其中,采用句法分析器,将所述第一树库中的短语结构转换为依存结构包括:利用句法分析器,将所述第一树库中的扁平结构的短语结构转换为依存结构;利用训练得到的依存关系映射模型,对所述第一树库中的依存结构进行依存关系转换,得到第二树库类型的依存结构树库;所述基于规则的方法进行归纳,将所述第一树库中的并列结构的短语结构转换为依存结构,具体包括:将所述并列结构的短语结构切分为多个片段;分别确定各个片段的核心节点,以及,将每个片段中除核心节点外的其他节点确定为依存于该片段中的核心节点;所述确定各个片段的核心节点包括:以所述短语结构所在语句作为分析对象,确定所述片段的各个节点的在所述语句上下文中的出现次数,根据不同节点出现次数的比较情况,确定出现次数满足要求的节点作为所述核心节点;将除第一个片段之外的其他片段的各个核心节点,确定为依存于所述第一个片段的核心节点;该方法进一步包括:利用互联网资源,搜索及统计转换后的所述依存结构的出现概率,依据所述概率确定所述扁平结构的短语结构转换为依存结构的转换准确率,依据所述准确率,对所述句法分析器进行调整训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山办公软件股份有限公司;珠海金山办公软件有限公司,未经北京金山办公软件股份有限公司;珠海金山办公软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611208593.6/,转载请声明来源钻瓜专利网。