[发明专利]一种面向机器翻译的日语动词识别方法有效
申请号: | 201310569693.1 | 申请日: | 2013-11-13 |
公开(公告)号: | CN103714053B | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 张孝飞;胡月卿;马伟;金善花;孟翔;李彦刚;王强 | 申请(专利权)人: | 北京中献电子技术开发中心 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 韩建伟,张永明 |
地址: | 100088*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向机器翻译的日语动词识别方法,属于自然语言处理领域。本发明通过分析日语动词的活用形规律,实现了一种基于规则和词典相结合的日语动词识别方法,可将文本中的动词完整地识别出来,并通过形态还原操作得到其基本型。本发明的日语动词识别方法利用一般的通用词典即可,具有较强的适用性和鲁棒性。该方法有效地提高了机器翻译中词法分析的准确性和双语词对齐效果,整体上提高了机器翻译的译文质量。 | ||
搜索关键词: | 一种 面向 机器翻译 日语 动词 识别 方法 | ||
【主权项】:
一种面向机器翻译的日语动词识别方法,其特征在于,包括以下步骤:步骤A,检索并标注包含候选动词查找时的左邻接标志和结尾标志的特殊词汇,不参与后续的动词识别,其中,左邻接标志为字符或字符串,结尾标志为字符;步骤B,检索左邻接标志和候选动词结尾标志,查找候选动词;步骤C,对查找到的候选动词进行还原,并通过查词典的方式验证其是否正确;步骤D,针对还原后且能够在词典内查到对应词条的候选动词,对其进行词性标注;其中,所述步骤B中进一步包括以下步骤:步骤B1,检索出候选动词的左邻接标志;步骤B2,在左邻接标志后的指定范围内查找候选动词的结尾标志字符;步骤B3,将左邻接标志的下一个字符至候选动词结尾标志字符的部分切分出来作为待还原候选动词;所述步骤C进一步包含以下步骤:C1,针对查找到的候选动词采用字符串前向最大匹配算法,检索出待还原候选动词的后缀,其中,当pkj…pkp′∈INFLEX且时,则提取pkj…pkP′,其中,pkj表示第j个后缀,pkp′表示最后一个后缀,pkj‑1表示第j‑1个后缀,INFLEX表示词典;C2,对检索出的候选动词的后缀,按其对应的还原规则进行还原处理;C3,将还原后的词条信息与词典中的对应词条信息进行比对,验证识别的正确与否;C4,若还原后的词条信息未在词典内查找到对应的词条信息时,对候选动词进行再次切分和还原处理,此时,若能够还原成功且在词典内查到还原后的词条,说明还原成功,否则不再对其进行处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中献电子技术开发中心,未经北京中献电子技术开发中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310569693.1/,转载请声明来源钻瓜专利网。
- 上一篇:医用器械装载筐
- 下一篇:一种多自由度并联机构式可控码垛机器人