[发明专利]文本生成方法、文本生成装置以及已学习模型在审

专利信息
申请号: 201911343811.0 申请日: 2019-12-24
公开(公告)号: CN111382251A 公开(公告)日: 2020-07-07
发明(设计)人: 横手健一;岩山真 申请(专利权)人: 株式会社日立制作所
主分类号: G06F16/332 分类号: G06F16/332;G06F16/33;G06F40/151
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 程晨
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 生成 方法 装置 以及 学习 模型
【说明书】:

本发明涉及文本生成方法、文本生成装置以及已学习模型,减轻学习数据的构筑的困难性并且应对处理的复杂化。置换信息收集部决定辅助置换器的作用;辅助置换器教师数据生成部根据置换信息DB的参照结果,生成在辅助置换器的机器学习中使用的置换教师数据;辅助置换器生成部根据置换教师数据DB生成辅助置换器;辅助置换器文本生成器结合部将辅助置换器生成部生成的辅助置换器结合到未学习的文本生成器;文本生成信息收集部收集文本的生成前信息以及生成后信息;文本生成器教师数据生成部根据生成信息DB的参照结果,生成在文本生成器的机器学习中使用的生成教师数据;文本生成器生成部根据生成教师数据DB生成文本生成器。

技术领域

本发明涉及文本生成方法、文本生成装置以及已学习模型。

背景技术

在与自然语言处理有关的许多系统中,需要辨识2个文本的意思或意图是否相同。例如,考虑具有提问文和回答文的配对,接受来自用户的输入,在找到适合于该输入的提问文之后,输出与该提问文对应的回答的提问应答系统。

来自用户的输入未必成为与提问应答系统具有的提问文相同的文本。即使提问应答系统具有作为提问文的“请问车站的地点”、作为回答文的“往北200米”的配对,也有不是从用户输入“请问车站的地点”、而是“想知道车站的地点”这样的文本的情况。提问应答系统在根据是否与“请问车站的地点”完全一致而寻找相应的提问文的情况下,不能针对“想知道车站的地点”这样的输入而回答“往北200米”。

不限于所述事例,由于输入活用形的变动、具有相同的意思的其他单词,在提问应答系统中,可能引起尽管具有回答文,但不能将来自用户的输入与对应的提问文相关联这样的结果。

作为解决这样的问题的方法之一,有复述生成(Paraphrase Generation)。复述生成是在某个文本被提供时生成具有相同的意思的其他文本的技术。通过进行复述生成,针对一个回答文而将多个提问文对应起来,提问应答系统能够针对各种输入进行回答。

在非专利文献1~3中,公开了用以神经网络为首的端到端(End-to-End)架构进行复述生成的方法。例如,在如根据“想确认车站的地点”生成“想知道车站的地点”的处理那样,仅置换文本的一部分的动词的情况下,因为能够使用同义词词典等自动地构筑学习用数据,想要实现的处理也不复杂,所以与端到端架构的适合性良好。

现有技术文献

非专利文献

非专利文献1:Paraphrase Generation with Deep Reinforcement LearningZichao Li,Xin Jiang,Lifeng Shang,Hang Li,EMNLP 2018

非专利文献2:Neural Paraphrase Generation with Stacked Residual LSTMNetworks aaditya prakash,Sadid A.Hasan,Kathy Lee,VivekDatla,Ashequl Qadir,Joey Liu,Oladimeji Farri,COLING 2016

非专利文献3:Joint Copying and Restricted Generation for ParaphraseZiqiang Cao,Chuwei Luo,Wenjie Li,Sujian Li,AAAI 2017

发明内容

然而,例如,在如根据“车站的地点在哪”生成“想乘坐电车”的处理那样,变更文本的单词以及文体的情况下,因为想要实现的处理变得复杂,需要大量的学习数据,而且也难以自动地构筑学习数据,所以与端到端架构的适合性差。

本发明是鉴于上述情况而完成的,其目的在于提供一种能够减轻学习数据的构筑的困难性并且应对处理的复杂化的文本生成方法、文本生成装置以及已学习模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911343811.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top