[发明专利]一种基于双语语义映射的事件短语学习方法及装置有效
申请号: | 201710303450.1 | 申请日: | 2017-05-02 |
公开(公告)号: | CN107168950B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 熊德意;李方圆 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双语 语义 映射 事件 短语 学习方法 装置 | ||
1.一种基于双语语义映射的事件短语学习方法,其特征在于,包括:
获取学习到的动宾结构的事件短语,并提取出所述事件短语中包含的动词结构及名词结构;
利用预先获取的包含有多个paraphrase对的数据集确定出与每个动词结构及名词结构对应的paraphrase对集合及每个动词结构及名词结构对应的paraphrase对集合中每一个paraphrase对的质量分数,从每个动词结构及名词结构对应的paraphrase对集合中获取具有相同词性的转述词;
确定所述质量分数大于分数阈值的paraphrase对对应转述词为对应动词结构或名词结构的替换词,将同一事件短语中包含的动词结构、名词结构及对应替换词重新组成扩展短语,并利用所述事件短语及对应扩展短语实现事件短语学习;
利用所述扩展短语实现事件短语学习之前,还包括:
确定每个扩展短语在预先获取的语料集中出现的频率,并将该频率小于频率阈值的扩展短语删除;
将同一事件短语中包含的动词结构、名词结构及对应替换词组成扩展短语,包括:
将同一事件短语中包含的动词结构与该事件短语中包含的名词结构的各替换词分别组成扩展短语,并将同一事件短语中包含的名词结构与该事件短语中包含的动词结构的各替换词分别组成扩展短语;
利用所述扩展短语实现事件短语学习之前,还包括:
将与事件短语相同的扩展短语删除。
2.一种基于双语语义映射的事件短语学习装置,其特征在于,包括:
提取模块,用于:获取学习到的动宾结构的事件短语,并提取出所述事件短语中包含的动词结构及名词结构;
分析模块,paraphrase利用预先获取的包含有多个paraphrase对的数据集确定出与每个动词结构及名词结构对应的paraphrase对集合及每个动词结构及名词结构对应的paraphrase对集合中每一个paraphrase对的质量分数,从每个动词结构及名词结构对应的paraphrase对集合中获取具有相同词性的转述词;学习模块,用于:确定所述质量分数大于分数阈值的paraphrase对对应转述词为对应动词结构或名词结构的替换词,将同一事件短语中包含的动词结构、名词结构及对应替换词重新组成扩展短语,并利用所述事件短语及对应扩展短语实现事件短语学习;
所述装置还包括:
约束模块,用于:利用所述扩展短语实现事件短语学习之前,确定每个扩展短语在预先获取的语料集中出现的频率,并将该频率小于频率阈值的扩展短语删除;
所述学习模块包括:
重组单元,用于:将同一事件短语中包含的动词结构与该事件短语中包含的名词结构的各替换词分别组成扩展短语,并将同一事件短语中包含的名词结构与该事件短语中包含的动词结构的各替换词分别组成扩展短语;
所述装置还包括:
去重模块,用于:利用所述扩展短语实现事件短语学习之前,将与事件短语相同的扩展短语删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710303450.1/1.html,转载请声明来源钻瓜专利网。