[发明专利]一种自动识别同义术语的方法无效
申请号: | 201310095526.8 | 申请日: | 2013-03-25 |
公开(公告)号: | CN103218409A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | 于娟 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动识别 同义 术语 方法 | ||
1. 一种自动识别同义术语的方法,其特征在于,包括以下步骤:
S01:提供一同义术语列表;
S02:判断待识别的两个术语是否为所述同义术语列表中所列出的同义术语;若是则进入步骤S06,若不是则进入步骤S03;
S03:将所述两个术语分别进行原子词切分为对应的原子词串;
S04:判断所述两个术语对应的原子词串是否为所述同义术语列表中所列出的同义术语;若是则进入步骤S06,若不是则进入步骤S05;
S05:判断所述两个术语对应的子串序列是否为所述同义术语列表中所列出的同义术语;若是则进入步骤S06,若不是则进入步骤S07;
S06:判定所述两个术语为同义术语;
S07:判定所述两个术语为非同义术语。
2. 根据权利要求1所述的一种自动识别同义术语的方法,其特征在于:所述步骤S02具体的判断算法是: ;其中,A和B是待识别的两个术语;Thesaurus是同义术语列表;指的是:A和B是同义术语列表中所列出的同义术语;如果计算结果是1,那么所述待识别的两个术语A和B同义。
3. 根据权利要求1所述的一种自动识别同义术语的方法,其特征在于:所述步骤S04具体的判断算法是:;其中,是对A进行原子词切分所形成的原子词串的长度,是对B进行原子词切分所形成的原子词串的长度;是A对应的原子词串中的第i个原子词;是B对应的原子词串中的第i个原子词;如果计算结果是1,那么两个术语同义。
4. 根据权利要求1所述的一种自动识别同义术语的方法,其特征在于:所述步骤S05具体的判断算法是:;其中,是A的子串序列的长度,是B的子串序列的长度;是A对应的子串序列中的第i个子串;是B对应的子串序列中的第i个子串;如果计算结果是1,那么两个术语同义。
5. 根据权利要求1所述的一种自动识别同义术语的方法,其特征在于:所述同义术语列表取自同义词词林或者Hownet。
6. 根据权利要求1所述的一种自动识别同义术语的方法,其特征在于:所述步骤S06判定所述两个术语为同义术语后,自动将所述两个术语作为同义术语加入所述同义术语列表中。
7.根据权利要求1所述的一种自动识别同义术语的方法,其特征在于:所述步骤S06判定所述两个术语为同义术语后,进行人工修正,最终判定为同义术语后将所述两个术语作为同义术语加入所述同义术语列表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310095526.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种道路空间中设置的微型立交桥
- 下一篇:一种POI信息补充方法及装置