[发明专利]自动生成相似问句的方法和装置有效
申请号: | 201810856231.0 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109033390B | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 潘晟锋;杨振宇;刘云峰;吴悦;陈正钦;胡晓;汶林丁 | 申请(专利权)人: | 深圳追一科技有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F40/279 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 张丹 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 生成 相似 问句 方法 装置 | ||
本申请涉及一种自动生成相似问句的方法和装置;所述方法包括获取初始问句;根据所述初始问句生成拓展问句;判断拓展问句是否为相似问句,并根据判断结果标记出相似问句。本申请提出一种利用计算机自动生成相似问句的方法,节省了人工标注相似问句所耗费的人力资源,能够降低机器人客服的成本;并且计算机生成的效率更高、花费时间更短,有利于临时增加FAQ的情况,使用更灵活。
技术领域
本申请涉及机器学习技术领域,具体涉及一种自动生成相似问句的方法和装置。
背景技术
现有的机器人客服,是采用计算机对客服场景中的用户提问进行判断并提供相应的回答,从而减少客服场景中的人工坐席参与,其目的在于减少客服中的人工成本。目前的机器人客服通常是对用户的每一个问句进行一个相应的回答,而这个回答的内容一般为预设的标准回答,这些标准回答是针对FAQ(Frequently Asked Questions,经常问到的问题)设计的。
目前,机器人客服的技术路线主要有两种,分别是搜索技术和机器学习技术。其中,搜索技术又分为基于句法模板的搜索和基于相似问句的搜索。而机器学习技术主要也是基于相似问句的机器学习,因此相似问句是多数客服机器人的学习依据。
一些典型的相似问句如下:
用户A:忘记密码了。
用户B:我的密码不记得了。
用户C:不记得密码,怎么办?
上面的例子中,不同的用户对同一个问题会有不同的说法,甚至问句中会包括一些错别字。而本质上,上面的问句都是同一个问题,即可以对应到 FAQ“忘记密码”,这些不同的问法便构成了相似问句。
在设计机器人客服的过程中,首先要收集大量的相似问句。之后,采用搜索技术的机器人将相似问句建入索引,当用户输入一个问句时,若当前用户问句与某一组相似问句的搜索相关性较高,则将这一组相似问句所对应的 FAQ,作为针对当前用户问句的回复。采用机器学习技术的机器人,用机器学习的方法判断当前用户问句和FAQ以及相似问句的匹配度,将匹配度较高的相似问句对应的FAQ,作为当前用户问句的回复。
可见,相似问句的收集获取,在整个智能客服机器人当中发挥了重要作用。相似问句的获取成本、准确度,决定了搭建客服机器人的成本和准确度。
当前收集获取相似问句的方式主要有两种:一是收集客服场景中的数据,例如用户访问客服的历史会话。将这些会话中的用户问句,通过人工标注的方式,对应到知识库FAQ上,一个问句只能对应一个FAQ。二是根据知识库中的每一个FAQ寻找与其对应的相似问句,或者编写可能的用户问法作为相似问句。
相关技术中,由于历史会话的数据量很大,人工标注的工作量也是巨大的,并且要求工作人员对相关领域的业务非常熟悉,因而人工成本非常高。此外,客服场景中经常会出现增减FAQ的情况,这时候人工构建相似问句不仅繁琐,而且会错过最佳时机。例如某电商客服场景下,假设在中秋节期间上线优惠活动,那么对其应的可能会增加FAQ,例如:中秋打折的优惠券如何领取。采用人工标注的方式对这些新增的FAQ构建足够的相似问句需要耗费较长的时间,有可能会影响生产经营。
发明内容
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种自动生成相似问句的方法和装置。
根据本申请实施例的第一方面,提供一种自动生成相似问句的方法,包括:
获取初始问句;
根据所述初始问句生成拓展问句;
判断拓展问句是否为相似问句,并根据判断结果标记出相似问句。
进一步地,所述拓展问句是由第一深度学习模型生成的。
进一步地,所述根据所述初始问句生成拓展问句,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810856231.0/2.html,转载请声明来源钻瓜专利网。