[发明专利]标签生成方法及装置有效
申请号: | 201810255380.1 | 申请日: | 2018-03-26 |
公开(公告)号: | CN108763242B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 钟朋恒 | 申请(专利权)人: | 广州视源电子科技股份有限公司;广州视臻信息科技有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡;周春枚 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 生成 方法 装置 | ||
本发明公开了一种标签生成方法及装置。其中,该方法包括:采集预设会议的多个特征信息,其中,特征信息是根据预设会议的会议内容得到的;对多个特征信息进行分析,得到预设会议在多个标签类别中每个标签类别下的概率;根据预设会议在多个标签类别中每个标签类别下的概率,生成与预设会议对应的标签。
技术领域
本发明涉及文件处理技术领域,具体而言,涉及一种标签生成方法及装置。
背景技术
相关技术,在文件系统中,用户可以给文件打上相关的标签,方便快速找到对应的文件或链接。但是这种通过标签查找文件的方式,缺乏自动生成标签功能,每次都需要用户手动输入对应的标签标记,这样就需要用户多次生成文件标签,用户根据该生成标签查找对应的文件效率较低。另外,在相关会议平板或教育平板中,若存在很多文件,想要翻查相关内容的文件相当麻烦,例如,若按文件名查找相关文件,用户需记住对应的文件的几个关键词,但会议平板和教育平板并不是每天都用到,容易遗忘关键词,这样就会导致无法查找文件,并且查找文件速度较慢;或者,当用户想找出某个相关的会议文件时,往往需要回忆起会议内容,根据会议内容反向回想会议日期、开会情景等线索,以找出对应的文件,但这种反向寻找的方法十分耗时,不易找到想要的文件,查找会议内容效率也是很低的,这样就会造成用户查找文件的体验感下降。
针对上述的相关技术中无法自动生成标签,导致用户查找文件效率低,用户体验感下降的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种标签生成方法及装置,以至少解决相关技术中无法自动生成标签,导致用户体验感下降的技术问题。
根据本发明实施例的一个方面,提供了一种标签生成方法,包括:采集预设会议的多个特征信息,其中,所述特征信息是根据所述预设会议的会议内容得到的;对所述多个特征信息进行分析,得到所述预设会议在多个标签类别中每个标签类别下的概率;根据所述预设会议在多个标签类别中每个标签类别下的概率,生成与所述预设会议对应的标签。
进一步地,在采集预设会议的多个特征信息之前,包括:获取多次会议所产生的历史文件数据,其中,所述历史文件数据为根据多次会议生成的特征信息,所述历史文件数据至少包括:会议文件大小、会议特征、会议时长、会议人员数量、会议工具使用信息;对每次会议所产生的历史文件数据进行过滤,得到待训练数据;对所述待训练数据进行分类,得到待训练数据集和待测试数据集;根据所述待训练数据集,确定所述待训练数据集中每个会议特征在多个标签类别中每个标签类别下的概率;根据所述待训练数据集中每个会议特征在多个标签类别中每个标签类别的概率,对所述待测试数据集进行分类,得到测试分类结果;根据所述测试分类结果和所述待测试数据的准确分类结果进行对比,得到目标训练结果;根据多个所述目标训练结果,确定预设分类器。
进一步地,根据所述待训练数据集中每个会议特征在多个标签类别中每个标签类别的概率,对所述待测试数据集进行分类,得到测试分类结果包括:获取所述待训练数据集中每个会议特征的权重值;根据所述待训练数据集中每个会议特征的权重值和所述待训练数据集中每个会议特征在多个标签类别中每个标签类别的概率,确定所述得到测试分类结果。
进一步地,获取所述待训练数据集中每个会议特征的权重值包括:获取会议工具使用信息;根据所述会议工具使用信息,确定与会议工具相关的会议特征;根据与会议工具相关的会议特征,确定与会议工具使用信息相关的会议特征的权重值。
进一步地,在确定预设分类器之后,所述方法还包括:将所述待测试数据集输入至所述预设分类器中;获取目标测试结果,其中,所述目标测试结果是利用所述预设分类器根据所述待测试数据和所述目标训练结果得到的;计算所述目标测试结果的准确率和召回率;根据所述目标测试结果的准确率和召回率,确定所述预设分类器的分类结果。
进一步地,在确定所述预设分类器的分类结果之后,所述方法还包括:根据所述预设分类器的分类结果,调整所述预设分类器的标签生成参数,其中,所述标签生成参数为预设分类器根据会议的特征信息确定与会议对应的标签的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视臻信息科技有限公司,未经广州视源电子科技股份有限公司;广州视臻信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810255380.1/2.html,转载请声明来源钻瓜专利网。