[发明专利]基于Bert字模型的数据表分类方法、装置及介质在审
申请号: | 202011347711.8 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112530597A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 谷兴龙 | 申请(专利权)人: | 山东健康医疗大数据有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H10/60;G06F16/31;G06F16/35 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 潘悦梅 |
地址: | 250117 山东省济南市槐*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于Bert字模型的数据表分类方法、装置及介质,属于文本信息挖掘技术领域,要解决的技术问题为如何高效的对医疗系统中元数据表进行准确归类。方法包括:对于元数据表中非中文的字段以及值域小于预设值的字段,基于预设的判别规则对字段进行内容类型判断,得到字段类型,所述预设的判别规则为基于历史元数据表中字段的内容配置的,用于基于字段的内容对字段进行类别判断;对于元数据表中值域等于或大于预设值的字段字段,通过Bert字模型对字段内容进行类别判断,得到字段类型以及字段属于各个类型的概率;基于元数据表中字段内容的所属类别,判断元数据表的所属类别。 | ||
搜索关键词: | 基于 bert 字模 数据表 分类 方法 装置 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东健康医疗大数据有限公司,未经山东健康医疗大数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011347711.8/,转载请声明来源钻瓜专利网。