[发明专利]测试数据集的更新方法和装置在审
申请号: | 201910873744.7 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110659208A | 公开(公告)日: | 2020-01-07 |
发明(设计)人: | 司文雷;苏少炜;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F8/65;G06F8/41 |
代理公司: | 11706 北京竹辰知识产权代理事务所(普通合伙) | 代理人: | 聂鹏 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开实施例公开了一种测试数据集的更新方法、装置、电子设备和计算机可读存储介质。其中该测试数据集的更新方法包括:获取自然语言解析数据;筛选出出现频率大于第一阈值的第一自然语言文本及所述第一自然语言文本的解析结果作为第一筛选结果;比较所述第一筛选结果和测试数据集中的数据得到第一筛选结果中的重复数据;从所述第一筛选结果中删除所述重复数据得到第二筛选结果;响应于接收到第一选择信号,从所述第二筛选结果中选择至少部分数据得到第三筛选结果;将所述第三筛选结果中的数据加入所述测试数据集中得到更新后的测试数据集。通过上述方法,解决了现有技术中测试数据集中的数据不准确的技术问题。 | ||
搜索关键词: | 筛选 测试数据集 测试数据 自然语言文本 重复数据 更新 计算机可读存储介质 自然语言解析 电子设备 解析结果 选择信号 删除 响应 | ||
【主权项】:
1.一种测试数据集的更新方法,包括:/n获取自然语言解析数据,其中所述自然语言解析数据包括自然语言文本和所述自然语言文本的解析结果;/n筛选出出现频率大于第一阈值的第一自然语言文本及所述第一自然语言文本的解析结果作为第一筛选结果;/n比较所述第一筛选结果和测试数据集中的数据,得到第一筛选结果中的重复数据,其中所述重复数据为已经存在于所述测试数据集中的第一筛选结果中的数据;/n从所述第一筛选结果中删除所述重复数据得到第二筛选结果;/n响应于接收到第一选择信号,从所述第二筛选结果中选择至少部分数据得到第三筛选结果;/n将所述第三筛选结果中的数据加入所述测试数据集中得到更新后的测试数据集。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910873744.7/,转载请声明来源钻瓜专利网。