[发明专利]基于语言对称性和拓扑性的对联生成方法及系统在审

专利信息
申请号: 202111491276.0 申请日: 2021-12-08
公开(公告)号: CN114298027A 公开(公告)日: 2022-04-08
发明(设计)人: 赵川;贺鹏;吴畏;黄静雯;尹中;周宣志;涂德志;王圆圆;郑雪;唐健;岳鹏;朱洪波;陈永俊;李晓喆;杜玲;卢尧;李晓;彭敦峰;马源;李晟 申请(专利权)人: 成都理工大学
主分类号: G06F40/289 分类号: G06F40/289;G06F40/284;G06F40/30;G06K9/62
代理公司: 北京众合诚成知识产权代理有限公司 11246 代理人: 许富强
地址: 610059 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语言 对称性 拓扑 对联 生成 方法 系统
【权利要求书】:

1.一种基于语言对称性和拓扑性的对联生成方法,其特征在于,包括:

S1生成语料库;

S2获取对联的上联,基于统计及机器学习的分词方式对上联进行分词;

S3在语料库中搜索从上联中分出的词语编码,判断语料库中是否有相应的词语编码,

若有,则判断与该词匹配的语编码是否大于1个,若大于1个,则对所有义项进行相似度计算,取相似度最大者;若等于1个,则取该编码;若没有,则输出与分出词语对应字数的“*”符号;

S4查找所有编码前X层相同的词语,其中X初始值为3,是否多于或等于一个词,

若是,则删除候选词汇中与原词字数不同和有重复字的词语;

若否,则查找所有编码前X-1层相同的词语,是否多于或等于一个词,重复步骤4;

S5对所有备选词汇进行相似度计算,选取相似度在Y至Y+0.2之间的词,Y的初始值为0.6;

S6备选词数量与1的关系,

若大于1,则随机选取备选词中的一个词语,输出该词语;

若等于1,则输出该词语;

若小于1,则以Y=Y+0.1,判断Y+0.2≤1,若是,则重复步骤S5;若Y+0.2>1,则随机选取备选词中的一个词语,输出该词语;

S7组合所有词语,输出下联。

2.根据权利要求1所述的基于语言对称性和拓扑性的对联生成方法,其特征在于,生成语料库的方法具体包括:把“笠翁对韵”以“同义词词林扩展板”的五层编码方式编入语料库。

3.根据权利要求1所述的基于语言对称性和拓扑性的对联生成方法,其特征在于,词语相似度计算过程如下:

首先判断在同义词林中作为叶子节点的两个义项在哪一层分支,即两个义项的编号在哪一层不同;

从第1层开始判断,相同则乘1,否则在分支层乘以相应的系数,然后乘以调节参数其中n是分支层的节点总数,该调节参数的功能是把义项相似度控制在[0,1]之间;

词语所在树的密度,分支的多少直接影响到义项的相似度,密度较大的义项相似度的值相比密度小的相似度的值精确,再乘以一个控制参数(n-k+1)/n,其中n是分支层的节点总数,k是两个分支间的距离;两个义项的相似度用Sin表示

1)若两个义项不在同一棵树上

sin(A,B)=f

2)若两个义项在同一棵树上

a)若在第2层分支,权重为a

b)若在第3层分支,权重为b

c)若在第4层分支,权重为c

d)若在第5层分支,权重为d

4.根据权利要求1所述的基于语言对称性和拓扑性的对联生成方法,其特征在于,将权重初值设置为a=0.65,b=0.8,c=0.9,d=0.96。

5.一种基于语言对称性和拓扑性的对联生成系统,其特征在于,包括:

语料数据库,用于存储语料库;

分词单元,用于对获取对联的上联,基于统计及机器学习的分词方式对上联进行分词;

相似度计算单元,用于在语料库中搜索上联分出的词语编码,判断语料库中是否有相应的词语编码,

若有,则判断与该词匹配的语编码是否大于1个,若大于1个,则对所有义项进行相似度计算,取相似度最大者;若等于1个,则取该编码;若没有,则输出与分出词语对应字数的“*”符号;

若没有,则输出与分出词语对应字数*符号;

查找所有编码前X层相同的词语,其中X初始值为3,是否多于或等于一个词,

若是,则删除候选词汇中与原词字数不同和有重复字的词语;

若否,则查找所有编码前X-1层相同的词语,是否多于或等于一个词,重复步骤4;

下联生成单元,用于对所有备选词汇进行相似度计算,选取相似度在Y至Y+0.2之间的词,Y的初始值为0.6;判断备选词数量与1的关系,

若大于1,则随机选取备选词中的一个词语,输出该词语;

若等于1,则输出该词语;

若小于1,则以Y=Y+0.1,判断Y+0.2≤1,若是,则重复步骤S5;若Y+0.2>1,则随机选取备选词中的一个词语,输出该词语;

组合所有词语,生成下联。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都理工大学,未经成都理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111491276.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top