专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果8个,建议您升级VIP下载更多相关专利
  • [发明专利]基于文章摘要句子的数据扩充方法以及PICOS抽取分类方法-CN202211116531.8在审
  • 柴龙涛;金霞;刘伟 - 杭州火石数智科技有限公司
  • 2022-09-14 - 2023-03-07 - G06F18/241
  • 本发明公开了一种基于文章摘要句子的数据扩充方法以及PICOS抽取分类方法。其中,数据扩充方法的过程如下:对多篇医学文章摘要进行分句,然后对分句后的每条句子进行类别标注,并标注好每条句子在该句子所属医学文章摘要中的顺序信息;将每条句子所属医学文章摘要编号以及该条句子的句子文本、句子位置以及句子类别共同组成一个数据样本;对同一医学文章摘要且为同一类别的句子进行随机拼接生成新句子;拼接后的新句子的句子位置采用拼接前首条句子的句子位置信息;将拼接后的新句子所属医学文章摘要编号以及该新句子的句子文本、句子位置以及句子类别共同组成一个新的数据样本。本发明有效地解决了PICOS抽取分类过程中模型数据获取困难的问题。
  • 基于文章摘要句子数据扩充方法以及picos抽取分类
  • [发明专利]对比学习的样本构造方法、装置、计算机设备及存储介质-CN202210985948.1有效
  • 张星;金霞;刘伟 - 杭州火石数智科技有限公司
  • 2022-08-17 - 2022-11-11 - G06F40/205
  • 本发明公开了一种对比学习的样本构造方法、装置、计算机设备及存储介质。本发明首先利用Bert将训练集问句数据转化为向量,用余弦相似度来衡量训练集问句数据之间的相似性,选择相似度值低于相似度阈值的不相似样本作为每个batch中的负样本,规避掉可能相似的样本被作为负样本,解决了因数据集中存在相似样本,导致SimCSE模型训练误差下降慢甚至推理不佳的技术问题。此外,本发明还提出了一种正样本的构造方法,利用每达到预设字符长度阈值,随机重复当前阈值范围内的一个或几个字符,从而构建对比学习的正样本,以克服模型在训练中可能会走入误区,倾向于两个有相近字符长度的句子更有相似性,而长度不同的句子间相似性较小的技术问题。
  • 对比学习样本构造方法装置计算机设备存储介质
  • [发明专利]对比学习的样本构造方法、装置及计算机设备-CN202210985929.9有效
  • 张星;金霞;刘伟 - 杭州火石数智科技有限公司
  • 2022-08-17 - 2022-11-11 - G06F40/20
  • 本发明属于医学领域和对比学习技术领域,公开了一种对比学习的样本构造方法、装置及计算机设备。其中,本发明方法样本构造通过MeSH医学术语词库匹配出数据文本中的医学术语,并通过医学术语体偏好词进行替换,依此来改变数据样本的字符长度,并且是利用医学偏好词进行替换,原数据文本的语义不会发生变化,再利用Dropout构造对比学习的正样本,通过对训练数据进行Embedding,转化为向量,对向量进行K‑Means聚类,训练时从各个簇中随机选择一个数据,并添加到同一个batch中,作为对比学习的负样本。通过以上样本构造方法,使得模型更加有效地学习样本数据表征,利于解决利用对比学习进行召回的过程中召回率较低的问题。
  • 对比学习样本构造方法装置计算机设备
  • [发明专利]一种海量短文本自适应分桶的反向去重方法-CN202011500654.2有效
  • 杨祎聪;金霞;杨红飞 - 杭州火石数智科技有限公司
  • 2020-12-17 - 2022-05-10 - G06F16/335
  • 本发明公开了一种海量短文本自适应分桶的反向去重方法,该方法包括以下步骤:首先对全量数据进行自适应分桶;然后对每个桶内的数据进行排序,去重时将排序靠后的数据去重,对排序后的数据进行两两比较,根据相似度判断两个数据之间是高度相似、相似还是不相似,不相似的数据不被去重,相似的数据直接被去重,高度相似的数据比较特征子串,将特征子串一样的去重。最后合并各个桶被去重的数据,从全量数据中剔除被去重的数据得到去重的全量数据。本发明可以在保证尽可能将相似的数据分到一个桶的情况下有效避免数据倾斜,解决了同一个桶内本应该被去重的数据遗漏的问题。
  • 一种海量文本自适应反向方法
  • [发明专利]一种基于图神经网络的表格结构识别方法-CN202010390152.2有效
  • 杨红飞;金霞;韩瑞峰 - 杭州火石数智科技有限公司
  • 2020-05-08 - 2021-09-03 - G06K9/00
  • 本发明公开了一种基于图神经网络的表格结构识别方法,该方法将pdf文档的每一页转为图像,对每一张输入的图像,识别出表格的位置,截取出表格区域;对表格区域识别文字blob块;对每个blob找到邻近的blob集合,从而建立blob图结构;对blob图建立对偶图结构,将图结点连接预测问题转变为图结点分类问题;训练图结点分类模型;对blob之间的关系整理,得到表格的单元格结构;本发明将图神经网络应用到表格结构识别中,将表格结构识别建模为图结点分类,并加入反馈调节网络及条件随机场,对图结点分类结果进行基于表格整体结构合理性的修正,提高了识别准确率。
  • 一种基于神经网络表格结构识别方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top