[发明专利]语句标注方法及语句标注装置在审

专利信息
申请号: 201810362553.X 申请日: 2018-04-20
公开(公告)号: CN110390095A 公开(公告)日: 2019-10-29
发明(设计)人: 张驰;钟延;郭心语;李安新;陈岚;礒田佳德;小野隆哉 申请(专利权)人: 株式会社NTT都科摩
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 北京市柳沈律师事务所 11105 代理人: 于小宁
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语句 级联关系 标注 语句标注 二阶 方法和装置 关系确定 语义分析 装置提供 阶级 分析
【说明书】:

提供了一种语句标注方法和装置,该语句标注方法包括:基于对语句的分析,获取根词;确定所述根词具有的、与所述语句中的至少一个词之间的级联关系;以及根据所确定的级联关系,确定对所述语句的标注,其中,当所述根词为根据语义分析所获取的第一根词时,根据所确定的级联关系确定对所述语句的标注的步骤包括:基于所述根词的一阶级联关系确定对所述语句的标注;以及当确定没有标注时,所述方法还包括以下步骤中的至少一个:基于所述第一根词的二阶或者二阶以上的级联关系,确定对所述语句的标注;以及获取组合根词,根据所述组合根词与所述语句中的至少一个词的级联关系,确定对所述语句的标注。

技术领域

本公开总体涉及语句标注,更具体地,涉及语句标注方法及语句标注装置。

背景技术

现有的语句标注(label)是基于监督式方法或非监督式方法进行的。非监督式方法是可以基于词(word)进行标注的,然而,由于该方法无法综合利用多种信息对候选词进行排序,归纳性不强,所以效果上可能不如监督式方法。

监督式方法包括利用语义分析或句法分析的结果进行标注等。虽然现有的语义分析可以提供多于70种的标注类型,但是,由于现有的语义分析方法仅根据语句中的根词的一级级联关系来确定对语句的标注,因而会丢失根词与语句中的其它词之间的语义关系,从而,可能导致无法实现对语句的标注,不能取得良好效果。

图1例示了基于现有的语义依存分析对语句进行标注的示例情形。如图1所示,对于“我很抱歉做出了这个突然的决定”这一语句,基于语义依存分析可以获得根词(“抱歉”),并且,如图1所示,根词“抱歉”的一级级联关系包括:感事关系、程度标记、标点标记和嵌套客事关系。然而,利用现有的语义分析方法,由于上述一级级联关系中没有可以用于确定语句标注的级联关系,因此,无法确定对语句的标注,从而导致对于该语句的标注没有输出,进而无法实现对语句进行标注的目的。

对于现有的句法分析方法,虽然其对于语句的粗粒化(coarse grain)标注更为准确,但是由于现有的句法分析方法缺乏语义信息的利用,因此,对于语句的标注很难提供精细化的结果。

总之,现有技术中,单独使用语义分析或句法分析的方法,由于存在根词和级联关系的标注缺失等问题,从而导致很难取得期待的效果。

发明内容

至少针对以上问题提出本公开。

根据本公开的一个实施例,提供了一种语句标注方法,包括:基于对语句的分析,获取根词;确定所述根词具有的、与所述语句中的至少一个词之间的级联关系;以及根据所确定的级联关系,确定对所述语句的标注,其中,当所述根词为根据语义分析所获取的第一根词时,根据所确定的级联关系确定对所述语句的标注的步骤包括:基于所述根词的一阶级联关系确定对所述语句的标注;以及当确定没有标注时,所述方法还包括以下步骤中的至少一个:基于所述第一根词的两阶或者两阶以上的级联关系,确定对所述语句的标注;以及获取组合根词,根据所述组合根词与所述语句中的至少一个词的级联关系,确定对所述语句的标注。

根据本公开的另一实施例,提供了一种语句标注装置,包括:根词获取模块,用于基于对语句的分析获取根词;级联关系确定模块,用于确定所述根词具有的、与所述语句中的至少一个词之间的级联关系;以及标注确定模块,用于根据所确定的级联关系,确定对所述语句的标注,其中,当所述根词为根据语义分析所获取的第一根词时,所述标注确定模块用于:基于所述根词的一阶级联关系确定对所述语句的标注;以及当确定没有标注时,所述标注确定模块用于执行以下操作中的至少一个:基于所述第一根词的两阶或者两阶以上的级联关系,确定对所述语句的标注;以及根据所述根词获取模块获取到的组合根词与所述语句中的至少一个词的级联关系,确定对所述语句的标注。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社NTT都科摩,未经株式会社NTT都科摩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810362553.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top