[发明专利]基于多语义的集外词处理方法及装置有效

专利信息
申请号: 201811498210.2 申请日: 2018-12-07
公开(公告)号: CN109614618B 公开(公告)日: 2023-07-14
发明(设计)人: 杨凯程;李健铨;蒋宏飞 申请(专利权)人: 安徽省泰岳祥升软件有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/284;G06F16/332;G06F16/33
代理公司: 北京弘权知识产权代理有限公司 11363 代理人: 逯长明;许伟群
地址: 230088 安徽省合肥市高新区习友路333*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语义 集外词 处理 方法 装置
【说明书】:

本申请实施例提供了一种基于多语义的集外词处理方法及装置。所述方法包括:根据集外词在句子中的上下词,获取集外词的每个语义的权重;根据每个语义中义原的词向量,生成每个语义的语义向量;根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。本申请提供的技术方案生成的仿真词向量,能够实现在匹配句子句义的同时,兼顾到集外词的其他语义,使仿真词向量所表达的语义更丰富饱满,适应更丰富的语义环境;当仿真词向量用于智能交互系统中时,能够使应答与问题的关联度高,提高应答准确率,并适应更丰富的对话环境,使智能问答系统表现的更智能,极大地提高用户好感度,解决了现有技术中的集外词问题。

本申请要求在2018年6月1日提交中国专利局、申请号为201810556386.2、发明名称为“基于多语义的集外词处理方法、智能问答方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。

技术领域

本申请涉及自然语言处理技术领域,尤其涉及一种基于多语义的集外词处理方法及装置。

背景技术

随着自然语言处理技术的发展,基于自然语言处理技术建立起来的对话系统也得到了广泛的应用,常用的对话系统例如聊天机器人,能够根据用户输入的聊天内容,自动生成相应地应答。

现有技术中,对话系统根据不同的应答方法可分为基于知识库的检索式对话系统和基于深度学习模型的生成式对话系统。其中,基于深度学习模型的对话系统,通过建立一个基于RNN(递归神经网络:Recurrent Neural Networks)的对话模型,并使用该模型进行大量的语料训练,使对话模型能够从问答对中学习到对未知对话的潜在应答模式,从而其回答内容不仅局限于训练语料中已有的知识。

基于深度学习模型的对话系统在进行语料训练和语料应答时,以词向量为操作对象,词向量是对语料中分词的一种数学化的表达形式。词向量在深度学习中的贡献是:通过将两个词向量计算余弦夹角或欧氏距离,能够得到两个分词的距离,两个分词的距离越小,表示两个分词的相似度越高。在对话系统的训练过程中,会根据训练语料生成包含已知分词词向量的词向量空间;在对话系统的应答过程中,根据问题分词的词向量与已知分词的词向量之间的距离,并结合机器学习的算法生成问题的应答内容。

但是,基于语料训练得到的词向量空间对于专业领域的业务术语、方言词汇、外文、组合词的包含能力较差,因此,在问题内容不受限的开放式对话系统中,对话系统经常会遇到集外词(OOV:out-of-vocabulary),是指词向量空间中未包含的分词。当对话系统遇到包含集外词的问题时,其给出应答内容的准确率就会下降,这种情况被称为集外词(OOV)问题。目前,现有技术对集外词问题缺乏有效的解决办法。

发明内容

本申请实施例提供了一种基于多语义的集外词处理方法及装置,以解决现有技术中存在的问题。

第一方面,本申请实施例提供了一种基于多语义的集外词处理方法,包括:

根据集外词在句子中的上下词,获取集外词的每个语义的权重;所述上下词包括集外词在句子中的至少一个前序分词和至少一个后序分词;

根据每个语义中义原的词向量,生成每个语义的语义向量;

根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。

第二方面,本申请实施例提供了一种智能问答方法,应用于本申请实施例提供的基于多语义的集外词处理方法,包括:

从未知问题的分词结果中获取集外词;

基于所述集外词的多语义,生成所述集外词的仿真词向量;

根据所述仿真词向量和所述问题中其余分词的词向量,从已训练的问答模型中匹配问题答案。

第三方面,本申请实施例提供了一种基于多语义的集外词处理装置,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽省泰岳祥升软件有限公司,未经安徽省泰岳祥升软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811498210.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top