[发明专利]一种智能分配隐私的问答机器人训练方法在审
申请号: | 202111161262.2 | 申请日: | 2021-09-30 |
公开(公告)号: | CN114020883A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 熊常春;李海良;王敬贵;李国元;刘昂;吴江川;李苗;熊桥峰;张富耕 | 申请(专利权)人: | 深圳季连科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/36;G06F21/62;G06F40/289;G06F40/30 |
代理公司: | 广州海藻专利代理事务所(普通合伙) 44386 | 代理人: | 张大保 |
地址: | 518000 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 分配 隐私 问答 机器人 训练 方法 | ||
本发明公开了一种智能分配隐私的问答机器人训练方法,构建每个用户填写资料、上传数据时产生的数据的数据权重;结合关键词技术预处理技术和数据权重预处理组群内所有的聊天记录,得到句子主干及引用数据的数据标签;标记所述聊天记录的上传者,系统判断结对聊天的两个用户之间对隐私重视程度的差异较大时,上传聊天记录至区块链作为聊天机器人训练素材;根据用户之间对隐私重视程度的差异初始化用户信誉度;根据所述相似度搜索技术和使用聊天机器人的用户对多维评分请求的评分反馈,动态更改所述聊天记录上传者的信誉度,从而保护数据隐私,提高聊天机器人训练素材的连续度。高效的保证训练聊天机器人的素材不涉及隐私。
【技术领域】
本申请涉及计算机技术领域,尤其涉及一种智能分配隐私的问答机器人训练方法。
【技术背景】
近年来,聊天机器人,也称为对话系统,由于客户需求的迅速增加,在我们的日常生活中发挥着重要作用,特别是在机器人聊天服务中。与传统的手动客户服务系统相比,聊天机器人解决方案具有许多优势,例如24/7可用性、即时响应和低劳动力成本,因此可用于许多业务场景,例如,Microsoft Xiaoice、Facebook Messenger Bots和来自阿里巴巴的AliMe。聊天机器人高效精准的服务是通过大量的聊天数据训练而来的,而大量的数据中往往容易包含很多隐私内容,如何精准的区分合格的训练数据和用户的隐私数据是目前比较突出的问题,针对以上问题本发明提供了以下解决方案。
【发明内容】
本发明的目的是为了解决上述现有技术的缺陷,提供一种智能分配隐私的问答机器人训练方法。
本发明的目的可以通过采取如下技术方案达到:
一种智能分配隐私的问答机器人训练方法,其特征在于,包括:
通过知识图谱技术,生成组群词库;
构建每个用户填写资料、上传数据时产生的数据的数据权重;
构建用户标签、数据标签和用户数据;
构建隐私值以及隐私权限阈值,同一数据标签下的数据的所述数据权重的均值为该数据标签的隐私值,无数据权重的数据则由管理员分配隐私值;
结合关键词技术预处理技术和数据权重预处理组群内所有的聊天记录,得到句子主干及引用数据的数据标签;
为所述聊天记录分配隐私值并根据所述隐私值判断是否能够上传;
标记所述聊天记录的上传者,系统判断结对聊天的两个用户之间对隐私重视程度的差异较大时,需要分别询问用户是否同意上传,将同意上传的用户标记为上传者,上传聊天记录至区块链作为聊天机器人训练素材;
根据用户之间对隐私重视程度的差异初始化用户信誉度;
根据所述相似度搜索技术和使用聊天机器人的用户对多维评分请求的评分反馈,动态更改所述聊天记录上传者的信誉度,从而保护数据隐私,提高聊天机器人训练素材的连续度。
优选的,所述通过知识图谱技术,生成组群词库,包括:
管理员设置单个课堂组群的科目主题、参考书目、所处城市和考试信息;计算机根据所述科目主题、所述参考书目、所述所处城市和所述考试信息通过所述知识图谱技术智能地生成所述词库,所述词库包含该科目的考点、课本术语、该年级的学习重点;所述知识图谱技术是通过输入的信息获得关键词,搜索引擎去寻找关键词并且进行语义的理解,最后返回搜索引擎在知识库中检索相应的实体之后,给出的完整知识体系。
优选的,所述构建每个用户填写资料、上传数据时产生的数据的数据权重,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳季连科技有限公司,未经深圳季连科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111161262.2/2.html,转载请声明来源钻瓜专利网。