[发明专利]一种自然语言句子的语义角色标注方法无效

专利信息
申请号: 200810243605.8 申请日: 2008-12-10
公开(公告)号: CN101446942A 公开(公告)日: 2009-06-03
发明(设计)人: 王红玲;朱巧明;钱培德;孔芳;李培峰;周国栋;钱龙华 申请(专利权)人: 苏州大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 苏州创元专利商标事务所有限公司 代理人: 陶海锋
地址: 215123江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种自然语言句子的语义角色标注方法,其特征在于:采用联合学习模型,同时实现中文句法分析和语义角色标注。本发明通过联合模型的使用,能够同时输出一个句子的句法分析结果和给定谓词的语义角色标注结果。在联合学习模型中,由于句法分析模型中增加了语义信息,使得训练出来的模型更适合于语义角色标注任务,因此由此模型输出的语义角色标注性能更高。同时联合模型输出的句法分析结果同单个句法分析模型的结果相比,两者性能不会有很大差别,甚至由于语义信息的加入,还能够提高句法分析的性能。
搜索关键词: 一种 自然语言 句子 语义 角色 标注 方法
【主权项】:
1. 一种自然语言句子的语义角色标注方法,其特征在于:采用联合学习模型,同时实现中文句法分析和语义角色标注,包括如下步骤:(1)生成语义角色标注模型:生成训练文件:从标注语料库中,根据下表中的特征抽取特征,生成所需的训练文件;位置 路径 中心词及其词性谓词 子类框架 句法成分类型句法成分首词和尾词 句法成分左兄弟结点类型 谓词语法框架动词类别 句法成分前一个词 句法成分父亲结点类型压缩路径 句法成分是否有右兄弟结点 句法成分左兄弟结点中心词类型修改的路径 路径中是否存在根结点模型生成:利用训练文件对最大熵分类器模型进行训练,得到语义角色标注模型文件;(2)生成联合学习模型:提取训练语料:从树库中,提取出句法分析训练语料,句法分析的训练事件中包含语义特征;生成训练文件:在句法分析模型常用特征基础上,添加语义特征,生成训练文件;所述句法分析模型常用特征由下表表示:第n棵树的中心词、成分标记和决策标记第n棵树的中心词词性、成分标记和决策标记第n棵树的成分标记和决策标记第n棵树的上下文特征所述语义特征由下表表示:谓词 当前谓语动词本身谓词类别 谓词所属的动词类别路径 当前句法成分到谓词的路径谓词角色 调用语义角色标注模型识别出的谓词语义角色语义特征的获取采用步骤(1)的语义角色标注模型实现;模型生成:利用训练文件对最大熵分类器模型进行训练,得到联合学习模型文件;(3)词性标记:调用词性标记模块,对给定句子进行词性标注,保留前N种最优的词性标记系列结果;(4)基本短语识别:调用基本短语识别模块,分别对步骤(3)输出的N种词性标记结果,进行基本短语识别,最后保留前N种最优的基本短语识别结果;(5)句法分析:调用联合学习模型,以步骤(4)输出的N种基本短语识别结果作为输入,输出最优的句法分析结果和语义角色标注结果;其中,N为10~20的整数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810243605.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top