专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果30个,建议您升级VIP下载更多相关专利
  • [发明专利]表格文档的关键词检索方法及电子设备-CN202211515994.1在审
  • 姚贡之;程文渊 - 上海弘玑信息技术有限公司
  • 2022-11-29 - 2023-05-02 - G06F16/242
  • 本申请提供一种表格文档的关键词检索方法及电子设备,该方法包括:对表格文档进行解析,得到包含位置信息和文本内容的多个候选文字块;根据每个候选文字块的位置信息,将所有候选文字块划分成多个虚拟列;针对每个虚拟列,根据虚拟列中候选文字块的文本内容,确定虚拟列的列语义标签;根据待查询关键词包含的查询字段以及每个虚拟列的列语义标签,筛选出列语义标签与查询字段相同的虚拟列,构成语义匹配组;根据待查询关键词包含的查询内容,从语义匹配组包含的虚拟列中检索得到与查询内容匹配的有效文字块。该方案成本低、效率高,并且通过语义理解,降低误召回率的同时提升精准率。
  • 表格文档关键词检索方法电子设备
  • [发明专利]一种处理训练数据的方法、训练模型的方法及介质-CN202211538320.3在审
  • 黄熙宇;姚贡之 - 上海弘玑信息技术有限公司
  • 2022-12-01 - 2023-03-21 - G06F16/35
  • 本申请实施例提供一种处理训练数据的方法、训练模型的方法及介质,所述方法包括:从数据集中筛选出验证集,其中,所述验证集是根据第一原则对所述数据集中的数据进行筛选得到的,所述第一原则至少用于保证所述验证集对应的标签类别与所述数据集对应的标签类别的尽可能接近;将所述数据集中除所述验证集之外的标签和数据作为训练集。通过本申请的一些实施例可以有效解决自然语言处理多标签数据集不充分、差异大、难以标准化的技术问题,提升得到的训练数据的质量使得采用这些训练数据训练得到的模型(例如,自然语言处理模型)的性能更好。
  • 一种处理训练数据方法模型介质
  • [发明专利]一种处理训练数据的方法、存储介质以及电子设备-CN202211539116.3在审
  • 姚贡之;程文渊 - 上海弘玑信息技术有限公司
  • 2022-12-01 - 2023-03-21 - G06F18/24
  • 本申请实施例提供一种处理训练数据的方法、存储介质以及电子设备,该方法包括:从数据集中获取各个类别的标签,得到类别标签集合;为所述类别标签集合中的各个标签分别从所述数据集中选择一个多标签数据,将所述类别标签集合以及所选择的所有多标签数据作为基本验证集;根据所述基本验证集包括的数据总量与验证集所需的目标数据量之间的大小关系得到验证集;根据所述数据集中除所述验证集之外的数据得到训练集的数据。本申请的实施例这种标准化方法有效解决了多标签数据集划分的标签不合理问题,可以充分利用整个数据集合,从而利用现有的数据并训练出相对健壮(robust)的系统模型。
  • 一种处理训练数据方法存储介质以及电子设备
  • [发明专利]文档的检索词匹配方法及电子设备-CN202211517909.5在审
  • 姚贡之;程文渊 - 上海弘玑信息技术有限公司
  • 2022-11-29 - 2023-03-07 - G06F16/332
  • 本申请提供一种文档的检索词匹配方法及电子设备,该方法包括:通过对文档进行解析,获得包含文本内容的候选文字块;根据接收到的检索词,将每个候选文字块的文本内容与检索词进行匹配,确定每个候选文字块的文本内容与所述检索词之间的匹配度;从所有候选文字块中筛选出匹配度大于阈值的有效文字块;进而根据已构建的语义词库和有效文字块的文本内容,删除满足预设条件的有效文字块。该方案在基于匹配度筛选有效文字块的基础上,进一步基于语义词库,对有效文字块进行了过滤,降低了误召回率。
  • 文档检索匹配方法电子设备
  • [发明专利]一种训练多模态信息抽取模型的方法及信息抽取方法-CN202211294201.8在审
  • 薛永福;姚贡之;郝东 - 上海弘玑信息技术有限公司
  • 2022-10-21 - 2023-02-03 - G06F16/36
  • 本申请实施例提供一种训练多模态信息抽取模型的方法及信息抽取方法,该方法包括:根据目标领域的多模态预训练数据对第一多模态信息抽取模型进行预训练,得到第二多模态信息抽取模型,其中,所述多模态预训练数据是对预训练数据进行标注得到的,所述预训练数据是对所述目标领域的第一文档集合中的各文档进行文本抽取和文本框识别后得到的;根据所述目标领域的实体标注数据对所述第二多模态信息抽取模型进行微调,得到目标多模态实体信息抽取模型,其中,所述实体标注数据是对微调数据进行标注得到的,所述微调数据是对所述目标领域的第二文档集合中的各文档进行文本抽取和文本框识别后得到的。本申请一些实施例的多模态信息抽取模型泛化能力更好。
  • 一种训练多模态信息抽取模型方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top