[发明专利]对话机器人的自学习方法、装置、系统、电子设备及介质有效
申请号: | 202010462950.1 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111368060B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 吴岳灏 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N20/00 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘进 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 机器人 自学习 方法 装置 系统 电子设备 介质 | ||
本说明书实施例公开了一种对话机器人的自学习方法,通过日志服务实时获取用户提问数据;通过分布式对实时获取的用户提问数据执行机器人自学习计算,所述执行机器人自学习计算步骤包括:使用局部敏感哈希对所述用户提问数据进行向量化处理,并对得到的所述用户提问数据的提问向量进行聚类,得到提问类簇集;利用所述用户提问数据的提问向量,针对所述提问类簇集构建倒排索引。
技术领域
本说明书实施例涉及对话机器人技术领域,尤其涉及一种对话机器人的自学习方法、装置、系统、电子设备及介质。
背景技术
随着移动电子设备的飞速发展,使得移动电子设备上的应用也越来越多,而使用应用的用户也越来越多,而用户在使用应用过程中会存在各种问题均需要解答,而人工解答的效率较低且成本较高,从而出现了对话机器人用于回答用户的提问。
现有技术中的对话机器人,通常是在获取用户与机器人的历史对话数据,然后离线对历史对话数据进行清洗计算,分析出对话知识库中未覆盖的问题和问法,然后在对话知识库中更新未覆盖问题的答复方案,使得对话机器人在使用更新后的对话知识库对用户的提问进行答复。
发明内容
本说明书实施例提供了一种对话机器人的自学习方法、装置、系统、电子设备及介质,能够快速的完成实时学习,提高机器人自学习的时效性。
本说明书实施例第一方面提供了一种对话机器人的自学习方法,包括:
通过日志服务实时获取用户提问数据;
采用分布式方式对实时获取的用户提问数据执行机器人自学习计算,所述执行机器人自学习计算步骤包括:
使用局部敏感哈希对所述用户提问数据进行向量化处理,对得到的所述用户提问数据的提问向量进行聚类,得到提问类簇集;
利用所述用户提问数据的提问向量,针对所述提问类簇集构建倒排索引。
本说明书实施例第二方面提供了一种对话机器人的自学习方法,包括:
获取当前用户的当前提问数据;
使用局部敏感哈希对所述当前提问数据进行向量化处理,得到所述当前提问数据的提问向量;
根据所述当前提问数据的提问向量和如第一方面提供的倒排索引,从如第一方面提供的提问类簇集中获取与所述当前提问数据相似的相似提问类簇;
将所述当前提问数据与所述相似提问类簇中每个提问类簇进行相似度计算,得到与所述当前提问数据匹配的目标提问类簇,其中,所述目标提问类簇与所述当前提问数据的相似度不小于预设相似度;更新所述目标提问类簇,并根据更新后的所述目标提问类簇,更新所述倒排索引。
本说明书实施例第三方面提供了一种对话机器人的自学习装置,包括:
提问数据获取单元,用于通过日志服务实时获取用户提问数据;
机器人自学习单元,用于采用分布式方式对实时获取的用户提问数据执行机器人自学习计算,所述执行机器人自学习计算步骤包括:使用局部敏感哈希对所述用户提问数据进行向量化处理,对得到的所述用户提问数据的提问向量进行聚类,得到提问类簇集;利用所述用户提问数据的提问向量,针对所述提问类簇集构建倒排索引。
本说明书实施例第四方面提供了一种对话机器人的自学习装置,包括:
当前数据获取单元,用于获取当前用户的当前提问数据;
向量化处理单元,用于使用局部敏感哈希对所述当前提问数据进行向量化处理,得到所述当前提问数据的提问向量;
相似提问类簇获取单元,用于根据所述当前提问数据的提问向量和如第一方面提供的倒排索引,从如第一方面提供的提问类簇集中获取与所述当前提问数据相似的相似提问类簇;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010462950.1/2.html,转载请声明来源钻瓜专利网。