[发明专利]自然语言的生成方法及系统在审
申请号: | 201310196659.4 | 申请日: | 2013-05-23 |
公开(公告)号: | CN104182059A | 公开(公告)日: | 2014-12-03 |
发明(设计)人: | 张杰;齐泉;张轶博 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自然语言 生成 方法 系统 | ||
技术领域
本发明涉及计算机科学领域,尤其涉及一种自然语言的生成方法及系统。
背景技术
随着计算机技术的发展,计算机已经逐渐成为多个领域中的不可或缺的办公设备。一般的,计算机之间的通信、或者计算机与开发人员之间的通信可以挺过机器语言完成。但是,对于一般用户而言,用户与计算机之间是通过自然语言进行交互的。自然语言处理是计算机科学领域中的一个方向,主要是研究能实现人与计算机之间用自然语言进行有效通信的理论和方法。
在很多领域中,信息都是以自然语言的文本形式记录存储的,并且以自然语言的形式呈现给用户。例如,在医院的病例数据库中,对于一个由于感冒引起发烧的病人,医务工作人员在记录该病人的病例数据时,需要依次输入:病症-发烧,诊断结论-感冒,治疗方案-某药物。
目前,当用户采用自然语言来录入数据时,需要用户手段录入自然语言,录入过程较为繁琐,且容易出错。
发明内容
本发明的实施例提供一种自然语言的生成方法及系统,能够解决现有技术中当用户采用自然语言来录入数据时,需要用户手段录入自然语言,录入过程较为繁琐,且容易出错的问题。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供了一种自然语言的生成方法,所述方法包括:
获取用户输入的第一关键词;
判定所述第一关键词所属的类别;
根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言。
在第一种可能的实现方式中,所述判定所述第一关键词所属的类别,包括:
基于预设规则,根据所述第一关键词的特定标识判定所述第一关键词所属的类别;
或者
基于历史统计结果,根据所述第一关键词在不同类别中出现的概率判定所述第一关键词所属的类别。
结合第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述方法还包括:
预先设定数据库,所述数据库用于存储各关键词的记录信息和各关键词的类别信息,所述记录信息包括:各关键词的共现词汇、所述共现词汇的类别和共现频率。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言之前,还包括:
从所述数据库中读取所述第一关键词的记录信息;
根据所述第一关键词的记录信息计算所述第一关键词和其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度。
结合第一方面或第一方面的第一种可能的实现方式、或第二种可能的实现方式、或第三种可能的实现方式,在第四种可能的实现方式中,所述根据所述第一关键词与其他关键词的关联度、以及所述第一关键词所属的类别与其他类别间的关联度,确定所述第一关键词对应的上下文关联词,根据所述第一关键词和上下文关联词生成自然语言,包括:
确定与所述第一关键词关联度最高的、以及与所述第一关键词所属类别关联度最高的一个或多个属于不同类别的关键词作为所述上下文关联词;
按照预设语言模板将所述第一关键词和上下文关联词组合为自然语言,其中,所述语言模板用于根据所述第一关键词的词性和上下文关联词的词性对所述第一关键词和上下文关键词进行符合常规语法结构的组合。
结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述方法还包括:
当生成的自然语言为多个时,以下拉框的形式对所述生成的多个自然语言进行显示以供用户确认;
或者
当生成的自然语言不被用户认可时,则提示用户手动输入待录入的自然语言,并对用户输入的自然语言进行分析以更新所述数据库。
结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,所述对用户输入的自然语言进行分析以更新所述数据库,包括:
获取用户输入的自然语言中的所有关键词;
建立词间相似度矩阵,根据所述词间相似度矩阵对所述用户输入的自然语言中的所有关键词进行分析,从而对所述数据库中各关键词的记录信息和各关键词所属的类别信息进行更新,其中,所述词间相似度矩阵用于表征所述数据库中任意两个关键词之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;,未经华为技术有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310196659.4/2.html,转载请声明来源钻瓜专利网。