[发明专利]生成汉语对联无效
| 申请号: | 200680032133.0 | 申请日: | 2006-07-03 |
| 公开(公告)号: | CN101253496A | 公开(公告)日: | 2008-08-27 |
| 发明(设计)人: | M·周;H-Y·沈 | 申请(专利权)人: | 微软公司 |
| 主分类号: | G06F17/00 | 分类号: | G06F17/00 |
| 代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈斌 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 生成 汉语 对联 | ||
发明背景
人工智能是制造智能机器尤其是计算机程序的科学和工程。人工智能的应用 包括玩游戏诸如国际象棋以及语音识别。
称为“dui4-lian2”(在拼音中)的汉语对联被认为是重要的中国文化遗产。 千百年以来,对联的教学是传统汉语教学的重要方法。通常,对联包括用书法书写 在垂直的红色条幅上的两个短语或句子,通常放在门的两边或放在大厅里。这种对 联通常在诸如结婚或春节期间(即中国新年)的特殊场合期间展示。其他类型的对 联包括寿联、挽联、装饰联、行业或其他交际联等。对联也可以带有横批,通常放 在垂直条幅之间的门上方。横批一般包括相关联对联的概括主题。
汉语对联使用浓缩的语言,但是具有深刻的、有时是矛盾的或双重含义。组 成对联的两个句子可以被称为“上联”和“下联”。
汉语对联的一个示例是“海阔凭鱼跃”和“天高任鸟飞”,其中上联是“海 阔凭鱼跃”,而下联是“天高任鸟飞”。第一和第二句子的各个词语的对应关系如 下所示:
对联可以具有不同的长度。较短的对联可以包括一个或两个字,而较长的对联可以 达到几百个字。对联也可以具有不同的形式或相对的含义。例如,一种形式可以包 括具有相同含义的上联和下联。另一种形式可以包括具有相反含义的上下联句子。
然而,不论哪种形式,汉语对联一般符合以下规则或原理:
原理1:对联的两个句子通常具有相同数目的词语和汉字总数。在说话时,每个汉 字具有一个音节。汉语词语可以具有一个、两个或多个字,因此可以具有一个、两 个或多个音节的发音。上联的每个词语应该具有与下联中相应词语相同数量的汉 字。
原理2:声调(例如汉语中的“Ping”(平)和“Ze”(仄))一般是一致的且和谐的。 传统的习惯是上联结尾处的字应该是“仄”(在汉语中称为“Ze”声调)。这种 声调是用急剧下降的声调(sharp downward tone)发音。下联结尾处的字应该是“平” (在汉语中称为“Ping”声调)。这种声调是用水平声调发音。
原理3:下联中词语的词性应该与上联中相应的词语相同。换言之,上联中的名词 应该对应于下联中的名词。这对动词、形容词、数词、副词等也是一样的。此外, 对应的词语必须位于上联和下联中的相同位置中。
原理4:下联的内容应该与上联互相关联,且第一和下联中内容不能重复。
说汉语的人通常参与创作新对联作为一种形式的娱乐。一种形式的消遣是一 个人作出上联,并挑战其他人当场创作合适的下联。因此,创作下联挑战了参与者 的语言、创造性和其他智力能力。
相应地,自动生成汉语对联,具体是在给出上联后生成下联会是人工智能的 一种合适且倍受喜爱的应用。
以上讨论仅提供了一般的背景信息,并不旨在用于协助确定所作权利要求的 主题的范围。
发明内容
提出了一种在给出汉语对联的上联的情况下,生成下联的方法。方法包括构 造语言模型、词语类转换(word translation-like)模型以及诸如互信息值的词语关 联信息,互信息值稍后可用于生成汉语对联的下联。提出了隐马尔科夫模型 (HMM),可用于基于语言模型和词语类转换模型生成候选。同样地,词语关联 值或句子评分(诸如互信息)可用于改进候选的选择。接着可以使用最大熵(ME) 模型来重新排列候选者,以在给定上联的情况下生成一个或多个合理的下联。
提供该概述是为了以简化的形式引入各种概念,这些概念会在以下详细描述 中作进一步的描述。本概述并不旨在标识所作权利要求的主题的关键特征或必要特 征,也不旨在用于协助确定所作权利要求的主题的范围。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680032133.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种盐酸曲马多的合成方法
- 下一篇:同步整流自驱动电路





