[发明专利]一种标记方法、装置及存储介质有效
申请号: | 201710873160.0 | 申请日: | 2017-09-25 |
公开(公告)号: | CN107704542B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 卓雷 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/26 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 100085*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标记 方法 装置 存储 介质 | ||
本发明公开了一种标记方法,所述方法包括:获取表征用户不同特征的第一数据集和第二数据集;将所述第一数据集中的第一数据与所述第二数据集中的第二数据进行匹配,生成第三数据集;对所述第一数据进行第一标记,对所述第二数据进行第二标记;根据所述第一标记和所述第二标记,生成第三标记;根据所述第三标记对所述第三数据集中的第三数据进行标记。本发明还同时公开了一种标记装置。
技术领域
本发明涉及信息处理技术,尤其涉及一种标记方法、装置及存储介质。
背景技术
以机器学习、深度学习为基础的人工智能技术广泛应用于各个领域,传感器和其它监控装置正在变成许多人每天生活中的常见同伴。事实上,每个人日常利用的许多电子装置都包含多个传感器。例如,智能电话、平板计算机、智能电视中。此外,在最近的趋势中,传感器已经被加到可穿戴个人物品诸如智能衣服、智能手表、智能眼镜、智能手镯以及其它智能首饰和可穿戴个人物品上。
但是,在传感器数据分析中,特别是基于用户可穿戴设备的传感器数据分析中,进行数据标记的方法通常是通过人工预先设置标记,然后按照人工设置的标记人为模拟一些数据样本。采用这样的方法,往往难于对数据进行正确的理解和分类标记。不仅数据标记速度慢,而且用户在日常生活中的真实数据往往与人工模拟数据样本得到的数据有差距,无法得到有效的数据样本。因此,如何能够有效提高数据标记速度和得到有效数据数量为目前扼要解决的问题。
发明内容
有鉴于此,本发明实施例期望提供一种标记方法及装置,用于解决根据现有技术方案无法得到有效的数据样本的技术问题。
为达到上述目的,本发明实施例的技术方案是这样实现的:
根据本发明实施例的一方面,提供一种标记方法,所述方法包括:
获取表征用户不同特征的第一数据集和第二数据集;
将所述第一数据集中的第一数据与所述第二数据集中的第二数据进行匹配,生成第三数据集;
对所述第一数据进行第一标记,对所述第二数据进行第二标记;
根据所述第一标记和所述第二标记,生成第三标记;
根据所述第三标记对所述第三数据集中的第三数据进行标记。
上述方案中,所述获取表征用户不同特征的第一数据集和第二数据集,包括:
采集表征用户生理特征的生理数据和表征用户所处环境的物理数据;
根据所述生理数据和所述物理数据,生成所述第一数据集;
根据用户对终端实施的行为,获取表征用户行为特征的行为数据;
根据所述行为数据,生成所述第二数据集。
上述方案中,将所述第一数据集中的第一数据与所述第二数据集中的第二数据进行匹配,生成第三数据集,包括:
获取所述第一数据对应的第一时间戳和所述第二数据对应的第二时间戳;
将所述第一时间戳或所述第二时间戳确定为基准对象;
根据所述基准对象,将所述第一数据与所述第二数据进行匹配,生成第三数据集。
上述方案中,对所述第一数据进行第一标记,对所述第二数据进行第二标记,包括:
通过分类算法或聚类算法对所述第一数据和所述第二数据进行分类或聚类,以得到所述第一数据对应的第一状态标识和所述第二数据对应的第二状态标识;
根据所述第一状态标识对所述第一数据进行第一标记,根据所述第二状态标识对所述第二数据进行第二标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710873160.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电力特殊区域图形的管理方法和系统
- 下一篇:基于哈希值的文本处理系统