[发明专利]元数据管理谱系生成方法、装置、计算机设备和存储介质在审

专利信息
申请号: 201910419207.5 申请日: 2019-05-20
公开(公告)号: CN110232130A 公开(公告)日: 2019-09-13
发明(设计)人: 刘利 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/38 分类号: G06F16/38;G06F16/35
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 刘广;潘艳丽
地址: 518033 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请涉及大数据,提供一种元数据管理谱系生成方法、装置、计算机设备和存储介质,所述方法包括:获取训练样本和测试样本中的样本元数据;将训练样本和测试样本输入已训练的样本转换模型中,输出训练转换样本和测试转换样本,获取训练转换样本和测试转换样本中的转换元数据;将训练转换样本切分为多个子样本,将子样本输入基础模型中进行训练;直至所有子样本训练完毕,得到目标模型,获取目标模型中的模型元数据;将测试转换样本输入目标模型中进行测试,输出目标测试结果,获取目标测试结果中的测试元数据;将样本元数据、转换元数据、模型元数据和测试元数据进行数据拟合,生成元数据管理谱系,能够实时了解机器学习的进展情况。
搜索关键词: 样本 测试 转换 计算机设备 模型元数据 样本元数据 元数据管理 转换元数据 测试样本 存储介质 获取目标 目标模型 训练样本 元数据 子样本 数据管理 基础模型 机器学习 输出目标 数据拟合 样本输入 样本转换 大数据 生成元 输出 申请
【主权项】:
1.一种元数据管理谱系生成方法,所述方法包括:获取训练样本和测试样本,获取所述训练样本和所述测试样本中的样本元数据;将所述训练样本和所述测试样本输入已训练的样本转换模型中,输出所述训练样本对应的训练转换样本和所述测试样本对应的测试转换样本,获取所述训练转换样本和所述测试转换样本中的转换元数据;将所述训练转换样本切分为多个子样本,将所述子样本输入基础模型中进行训练;直至所有子样本训练完毕,得到目标模型,获取所述目标模型中的模型元数据;将所述测试转换样本输入所述目标模型中进行测试,输出目标测试结果,获取所述目标测试结果中的测试元数据;将所述样本元数据、转换元数据、模型元数据和测试元数据进行数据拟合,生成元数据管理谱系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910419207.5/,转载请声明来源钻瓜专利网。

同类专利
  • 一种学科图书的学术价值评价方法-201910525243.X
  • 徐小丽 - 东华大学
  • 2019-06-18 - 2019-11-01 - G06F16/38
  • 本发明公开了一种学科图书的学术价值评价方法,其特征在于,获取目标学科图书的文献出版数据及引文数据,并对数据进行清洗;构建学科文献表及图书引文表;根据学科文献表计算学科著者g指数;根据学科著者的学术地位,即g指数对图书引文表中同一种图书的每一条引文记录进行标记,然后对该种图书的引文记录根据学术地位值大小降序排列到一个序列集合,计算该种学科图书的学术价值为z;对同一种学科图书进行z值大小的比较,即得该学科图书学术价值的高低评价判断。本发明量化指标操作性强,可以帮助科研人员尽快掌握本学科高学术价值图书的列表,帮助科研人员关注学科科研成果及科研热点,以及帮助科研人员了解学科图书出版的空白领域。
  • 基于人工智能的文献数据检索方法、设备及可读存储介质-201910602168.2
  • 张浩春 - 武汉莱博信息技术有限公司
  • 2019-07-05 - 2019-10-22 - G06F16/38
  • 本发明公开了一种基于人工智能的文献数据检索方法、设备及可读存储介质,该方法包括:确定文献资料的主题词,基于所述主题词为所述文献资料添加对应的标签;将添加有标签的文献资料存储至数据库中;当接收到客户端发送的检索指令时,获取所述检索指令对应的关键词;根据所述关键词,确定目标标签;从所述数据库中获取携带有所述目标标签的目标文献资料;根据所述关键词,从所述目标文献资料中确定检索结果;将所述检索结果反馈至所述客户端。通过本发明,缩小了检索范围,从而缩短了检索所需时间,使得用户能更快的获取到其需要的资料。
  • 一种基于导师-学生二分网络的导师影响力评估方法-201910485980.1
  • 夏锋;郑文青;任静;刘嘉莹;孔祥杰 - 大连理工大学
  • 2019-06-05 - 2019-10-08 - G06F16/38
  • 本发明提供了一种基于导师‑学生二分网络的导师影响力评估方法,属于计算机软件领域。该方法通过多指标综合评价方法计算学生综合指标得分并建立导师与学生间的网络关系进行分析。本方法将微软数据集和Web of Science期刊影响因子数据集进行处理,提取出学生的各个评价指标,利用综合评价方法对这些指标进行综合评价打分,将这些得分通过学术年龄进行调节获取最终学生综合得分,然后建立导师‑学生二分网络,并将学生的综合得分带入二分网络中,通过随机游走的方式对导师的影响力进行计算,最后带入导师学术年龄进行调节,从而得到导师的影响力指数。
  • 一种实现快速庭审记录的方法-201910516829.X
  • 徐先胜 - 广州微声技术有限公司
  • 2019-06-14 - 2019-10-08 - G06F16/38
  • 本发明涉及一种实现快速庭审记录的方法,包括:庭审前在庭审文档编辑界面导入庭审案件信息以及框架模板,所述框架模板包括打点标签和事项文本;庭审开始时控制界面开庭按钮被触发以启动录音,在庭审中对应的事项开始时,触发所述框架模板中相应的打点标签,生成对应的时间标签,所述时间标签与从打点标签被触发开始的庭审录音片段关联,其中点击该时间标签自动跳转到播放该时间标签关联的庭审录音片段;庭审结束时所述控制界面闭庭按钮被触发以结束录音,生成框架笔录记录与庭审录音结合的庭审资料,本发明可实现快速回放审查,这样可以便于庭后校对,能够大幅减轻审判人员的工作负担,大大提高庭审效率。
  • 元数据管理谱系生成方法、装置、计算机设备和存储介质-201910419207.5
  • 刘利 - 平安科技(深圳)有限公司
  • 2019-05-20 - 2019-09-13 - G06F16/38
  • 本申请涉及大数据,提供一种元数据管理谱系生成方法、装置、计算机设备和存储介质,所述方法包括:获取训练样本和测试样本中的样本元数据;将训练样本和测试样本输入已训练的样本转换模型中,输出训练转换样本和测试转换样本,获取训练转换样本和测试转换样本中的转换元数据;将训练转换样本切分为多个子样本,将子样本输入基础模型中进行训练;直至所有子样本训练完毕,得到目标模型,获取目标模型中的模型元数据;将测试转换样本输入目标模型中进行测试,输出目标测试结果,获取目标测试结果中的测试元数据;将样本元数据、转换元数据、模型元数据和测试元数据进行数据拟合,生成元数据管理谱系,能够实时了解机器学习的进展情况。
  • 一种基于多维特征的论文影响力评估方法-201910490770.1
  • 周丰丰;李飞;刘确旺;马天放;汪虹宇;姚曌旻;段镁钰 - 北京百奥知信息科技有限公司
  • 2019-06-06 - 2019-09-06 - G06F16/38
  • 本发明公开了一种基于多维特征的论文影响力评估方法,该方法包括公式:其中Score为根据论文特征计算论文的评估分数,并以该评估分数判断论文的影响力;X1为论文所属期刊的影响因子;X2为论文的第一机构,及其排名;X3为论文的第一作者的H‑Index值;X4为论文发表时间距离当前年份的年数;X5为论文关键词热度;X6为论文被引用数;X7为论文参考文献列表的期刊影响因子的综合因子;X8为引用该论文的论文所发期刊影响因子的综合因子;n为总机构数。本发明根据除了引用量之外的其他特征获得相应的评估分数;对于一个论文的所有引用链接,其中优质引用给与更大的权值;从论文本身挖掘了所有的特征,来更优更全面的评估论文影响力。
  • 一种文档关系可视化处理方法及装置-201910307156.7
  • 冯田田 - 深圳壹账通智能科技有限公司
  • 2019-04-17 - 2019-08-16 - G06F16/38
  • 本发明实施例提供了一种文档关系可视化处理方法及装置,本发明涉及大数据技术领域,方法包括:从预设的文档数据库中提取每个文档的属性以及对应的文档引用关系,文档的属性至少包括文档编号、文档名称;将提取到的每个文档的属性以及文档引用关系与文档关联,并存储至预设的数据表中;基于预设的数据表中的数据构建文档图谱,其中,文档图谱包括节点和连接线,每个节点表示一个文档,每个连接线表示文档引用关系;获取预设文档的关系链查询指令,预设文档为文档图谱中的一个节点;响应于关系链查询指令,在文档图谱中可视化呈现与预设文档关联的多个文档及文档引用关系。本发明实施例提供的技术方案能够解决现有技术中文档管理效率低的问题。
  • 基于搜索的提供高质量评论信息的方法及装置-201510642305.7
  • 魏少俊 - 北京奇虎科技有限公司;奇智软件(北京)有限公司
  • 2015-09-30 - 2019-06-14 - G06F16/38
  • 本发明提供了一种基于搜索的提供高质量评论信息的方法及装置。该方法包括:在搜索结果页中设置高质量评论信息展示区域;当接收到用户通过搜索框输入的搜索词时,识别所述搜索词中的至少一个实体词;查找所述至少一个实体词与高质量评论信息的关联关系,召回与所述至少一个实体词相关联的一个或多个高质量评论信息;在所述高质量评论信息展示区域中绘制所述召回的一个或多个高质量评论信息。本发明实施例能够在搜索结果页中展示高质量评论信息,从而实现对用户输入的搜索词对应的实体词所延伸出来的深层次、个性化的解读的需求,给用户提供额外的帮助。
  • 一种海关编码智能搜索方法-201510463895.7
  • 崔凯 - 重庆龙工场跨境电子商务投资有限公司
  • 2015-07-31 - 2019-04-16 - G06F16/38
  • 本发明公开了一种海关编码智能搜索方法,其特征在于:所述搜索方法包括三个阶段,第一阶段是大数据采集,第二阶段是系统智能分析,第三阶段是用户输入特征属性后进行分析检索给出结果。本发明具有如下优点:通过周而复始大数据迭代概率统计,给用户在选择海关编码时提供高效的智能推荐。报关人员不需要通过查阅大量的海关税则,通过前人的归类经验规避错误风险,大大的降低了备案的门槛,为跨境电商阳光化通关解决了瓶颈性的问题。
  • 一种基于学术大数据的对科研单位影响力进行评估的方法-201811414500.4
  • 刘建国;王江盼;朱熹华;李超然;郭强;江明珠 - 上海财经大学
  • 2018-11-26 - 2019-04-12 - G06F16/38
  • 本发明公开了一种基于学术大数据对科研单位影响力进行评估的方法,主要利用学术论文数据库中的论文数据以及论文中所涉及的所有科研单位以及论文的引用数据,建立依赖科研单位的共引有向网络,以论文的共引权重衡量论文的重要性,并采用科研单位署名位置信息构建加权系数函数的方法定量评价所研究的科研单位的学术影响力。本发明根据学术论文引用数据建立有向网络,针对多个单位合作的论文采用加权系数的方法计算各个单位的影响力值,科学有效地评价各个科研单位的学术影响力,从而提供一种有效合理的科研单位学术影响力评价方法。
  • 医疗文献推送方法、系统、设备及存储介质-201811339084.6
  • 李林峰;张春宇 - 北京懿医云科技有限公司
  • 2018-11-12 - 2019-03-26 - G06F16/38
  • 本发明提供了医疗文献推送方法、系统、设备及存储介质,包括步骤:采集诊疗数据,在诊疗数据中提取当前医生的诊断疾病,以作为第一标签;在医疗文献数据库中获取并按相关度排列与第一标签关联的第一医疗文献;获取与诊断疾病对应的诊疗手段,以作为第二标签,在医疗文献数据库中获取并按相关度排列与第一标签以及第二标签共同关联的第二医疗文献;向医生推送前数个第一医疗文献以及前数个第二医疗文献,通过从诊疗数据中提取当前医生的诊断疾病,从而有针对性地获取当前医生的个性化标签,提高了医疗文献推送准确性,有效解决了冷启动问题。
  • 专利数据分析系统-201811288889.2
  • 李凤吉 - 大连今晨科技有限公司
  • 2018-10-31 - 2019-03-19 - G06F16/38
  • 本发明公开了一种专利数据分析系统,包括服务器(1)和用户端(2),所述服务器(1)包括用于存储专利文献的专利数据库模块(11),以及用于提取所述专利数据库模块(11)内专利文献的特征提取模块(12);所述用户端(2)包括用于输入需要检索的技术关键词并与所述特征提取模块(12)提取的所述专利文献的技术关键词进行匹配,并从所述专利数据库模块(11)中提取出与输入技术关键词匹配的专利文献的专利检索模块(21);所述用户端(2)还包括专利分析模块(22),所述专利分析模块(22)用于将专利检索模块(21)检索出的专利文献按照申请年份分别进行分类并存储。本发明使用方便,给用户带来了极大的便利,并且基于关键词进行搜索,在专利检索效率上有很大的提高。
  • 代码文件查询方法和装置-201410042833.4
  • 刘博;邬亮 - 日本电气株式会社
  • 2014-01-29 - 2019-03-19 - G06F16/38
  • 本发明公开了一种代码文件查询方法和装置,属于数据处理技术领域。所述方法包括:基于历史查询词向量以及每个代码文件的文本特征向量和代码特征向量构造的转换矩阵,对当前查询词向量和每个代码文件的代码特征向量进行转换,代码特征向量根据代码文件的代码块确定;根据当前查询词向量、转换后的查询词向量、每个代码文件转换后的代码特征向量以及每个代码文件的文本特征向量,计算每个代码文件与查询词之间的相似度,得到代码文件查询结果。本发明考虑到了代码文件的结构对语义的影响,充分挖掘代码文件的内容和结构,提高了特征提取的准确性,且在查询代码文件的过程中,基于该文本特征向量和代码特征向量计算相似度,提高了查询精度。
  • 一种文本内容与查询请求之间相关性的计算方法及装置-201410721370.4
  • 崔保良 - 阿里巴巴集团控股有限公司
  • 2014-12-02 - 2019-03-15 - G06F16/38
  • 本申请涉及互联网领域,公开了一种文本内容与查询请求之间相关性的计算方法及装置,用以提高用户查询效率。该方法为:分别针对每一个文本内容中的各个分词提取其分词特征,基于预设的序关系和分词特征之间的关联关系,分别确定每一个文本内容中各个分词在相应文本内容中的权重,以及在接收到用户查询请求后,确定用户查询中每一个分词的权重,然后,基于用户查询中每一个分词的权重和每一个文本内容中各个分词在相应文本内容中的权重,计算用户查询与每一个文本内容的文本相关性,进一步获得各个文本内容的显示排序。这样,更准确反映分词在文本内容中的重要程度,进而提高用户的搜索效率,提升系统的服务性能。
  • 搜索目标识别方法、装置及终端-201610224273.3
  • 汤奇峰;王万宝 - 晶赞广告(上海)有限公司
  • 2016-04-12 - 2019-03-12 - G06F16/38
  • 一种搜索目标识别方法、装置及终端,搜索目标识别方法包括:根据已知的词典库对搜索文本进行分词,得到多个目标关键词,其中,所述词典库包括多种词典,所述多个目标关键词与所述多种词典相对应;根据所述多个目标关键词各自对应的词典,将所述多个目标关键词中的至少一部分与预设词典模板进行匹配转换,以得到组合词;将所述组合词与未匹配转换的目标关键词组成搜索关键词,所述搜索关键词对应所述搜索目标;其中,所述词典模板为所述词典库中一种或多种词典的组合。本发明技术方案提高了搜索目标识别的效率。
  • 一种基于元数据的基础教育课程学习评测系统-201710679913.4
  • 不公告发明人 - 镇江雅迅软件有限责任公司
  • 2017-08-10 - 2019-02-26 - G06F16/38
  • 一种基于知识点分布匹配的学习管理系统,主要面向中小学的基础教育课程。根据任课教师在系统内导入的知识点内容及设置的知识点元数据,形成知识点分布。教师与学生可以基础分布的知识点进行互动,例如:教师可以设置题型与知识点的关联关系,学生可以在日常的学习中,根据知识点的掌握情况进行自评或者老师进行评测。最终在课业结束时,根据知识点分布的覆盖掌握情况可以评测出学生对于该课程的知识掌握程度,并进行有的放矢地补充学习,如此可大大提高学生的学习效率。
  • 一种基于图书目录的专题自动生成方法-201610188009.9
  • 鲁伟明;李彬;庄越挺;吴飞;魏宝刚 - 浙江大学
  • 2016-03-29 - 2019-02-12 - G06F16/38
  • 本发明公开了一种基于图书目录的专题自动生成方法。对每一本书,把目录中每个章节当作一个词语,提取出词语的特征,训练出一个分类器识别出书目录中的实体,对于书目录中每一对属于实体的上下级章节词抽取出符合上下位关系的章节对。根据上下位关系构建每个词的概念层次结构,对所有图书中相同的或相似的概念层次进行融合。对概念层次中的每一个概念词语,检索其在网页中和图书中的内容作为该词语的描述内容。最后,把概念层次及概念词内容组织成专题形式。本发明利用图书目录的结构化信息和机器学习相关算法实现了知识的抽取和重组,在编写专题时可以借鉴,可以大大减少相关工作的人力成本,具有较高的实用性。
  • 个人主页的查找方法-201510394587.3
  • 唐杰;刘德兵;杨宏;袁慧 - 清华大学
  • 2015-07-07 - 2019-02-05 - G06F16/38
  • 本发明公开了一种个人主页的查找方法,包括以下步骤:在搜索引擎中输入关键信息获得搜索结果,采用最接近关键信息的搜索结果作为数据集;从数据集中抽取部分数据文本进行标注;对已经标注过的数据文本分为训练集和测试集;对训练集抽取训练集特征信息;对训练集特征信息进行建模,得到第一模型;对测试集抽取测试集特征信息;利用第一模型对测试集特征信息进行分析,得到预测结果;对预测结果进行判断;通过十折交叉验证进行迭代,选取最优模型;采用最优模型判断搜索结果是否为目标人物的个人主页。本发明具有如下优点:适应性较强,可通过在实际应用过程中收集整理训练样本,更新及扩充训练集,进而提高本方法的适用性及查找准确率。
  • 一种通信地址查询邮政编码的系统及终端-201310377867.4
  • 王国印;贾西贝 - 深圳市华傲数据技术有限公司
  • 2013-08-27 - 2019-01-22 - G06F16/38
  • 本发明提供一种通信地址查询邮政编码的系统,该系统包括通信地址输入子系统和邮政编码查询子系统;所述地址输入子系统通过对用户输入文本进行实时提示,用户根据提示列表地址确定待查询的通信地址;所述邮政编码查询子系统将待查询的通信地址进行标准化并检索出最接近的标准化通信地址,同时返回该标准化通信地址对应的邮政编码。本发明通过帮助用户输入提示,使得查询格式更加自由;基于命名实体识别技术能够标识出用户输入地址元数据的级别,从而实现地址的逐级查询,同时对通信地址进行补全,使得查询结果更加精确,另外用户还可以将查询结果以二维码的方式获取,或者链接地图进行定位。另外,本发明还提供一种通信地址查询邮政编码的终端。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top