[发明专利]一种广电知识图谱构建方法及装置在审

专利信息
申请号: 201811495424.4 申请日: 2018-12-07
公开(公告)号: CN111291191A 公开(公告)日: 2020-06-16
发明(设计)人: 万倩;欧阳峰;朱里越;赵明;牛妍华 申请(专利权)人: 国家新闻出版广电总局广播科学研究院
主分类号: G06F16/36 分类号: G06F16/36;G06F16/182;G06F16/9535
代理公司: 工业和信息化部电子专利中心 11010 代理人: 于金平
地址: 100866 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 广电 知识 图谱 构建 方法 装置
【权利要求书】:

1.一种广电知识图谱构建方法,其特征在于,包括:

对预设数据源进行分析处理,并存储在数据库中;

基于所述数据库,对用户、节目和套餐进行用户画像、节目标签和套餐标签的画像特征的可视化展示,并从所述数据库中获取人-人、人-节目、人-套餐之间的关系,分别进行知识图谱的可视化展示;

根据所述画像特征和所述知识图谱构建广电行业的知识图谱应用。

2.根据权利要求1所述的方法,其特征在于,

所述数据源包括广电内部的用户收视行为数据、用户订购行为数据、媒资系统数据,以及互联网公开的节目信息数据。

3.根据权利要求1所述的方法,其特征在于,对预设数据源进行分析处理,包括:

步骤一,建立Hive映射表,将HDFS中预处理后的用户收视行为、用户订购行为、媒资系统中的节目信息以及从互联网爬取得到的节目信息的数据导入到Hive数据仓库;

步骤二,用分布式计算框架Spark从用户收视行为和用户订购行为中分别抽取出用户基本属性信息和套餐基本属性信息,并将媒资系统和互联网的节目信息融合后给节目打标签,最后将生成的标签与节目基本属性信息合并后存入Mysql关系型数据库,同理,基于套餐基本属性信息中的包名用自然语言处理技术给套餐打标签,将套餐基本属性信息和套餐标签合并后存入Mysql;

步骤三,用Spark从用户收视行为和订购行为中对用户观看的节目和订购的套餐的标签进行词频统计,分别挑选次数最多的TopN作为用户观看节目的兴趣标签和用户订购套餐的兴趣标签,将用户基本属性信息和用户观看节目的兴趣标签和用户订购套餐的兴趣标签合并后存入Mysql。

4.根据权利要求3所述的方法,其特征在于,所述步骤三之后还包括:

将用Spark从用户收视行为和用户订购行为中抽取出用户-观看-节目,用户-订购-套餐的三元组关系并导入Neo4j图数据库中进行存储。

5.根据权利要求1所述的方法,其特征在于,还包括:构建节目标签。

6.根据权利要求5所述的方法,其特征在于,构建节目标签包括:

步骤一:对节目简介文本进行简繁转换,全部转换为中文后,进行分词处理;

步骤二:利用TF进行词频统计,得到基于所有节目简介分词结果统计的词语词频,并对词频列表进行频率从大到小的排序,使用该词频统计结果,对每个节目简介的分词结果进行过滤,仅保留频率大于预定数值的词语;

步骤三:对选取的高频词语进行去停用词处理;

步骤四:经过去停用词处理后,每个节目简介都会获得一个特征词表,以每个节目的特征词表作为一个样本,构建用于深度学习模型Word2Vec的训练数据;

步骤五:利用该词向量空间及其所提供的相似词语临近特性,应用Kmeans算法计算一个聚类结果;

步骤六:对于聚类结果的每个簇,选择其中最有代表性的一个特征词作为该簇的表示词,并最终对所有节目的特征词对应的表示词进行统计,以统计结果中较重要的表示词作为该节目的标签。

7.根据权利要求6所述的方法,其特征在于,所述步骤四包括:

通过Word2Vec的连续词袋CBOW模型和Hierarchical Softmax框架,利用节目的特征词表作为输入数据进行训练,进而得到了一个足以表征全部特征词的词向量空间,每一个特征词都获得了一个唯一的向量表示,所述CBOW模型包含三层:输入层,投影层和输出层。

8.根据权利要求6所述的方法,其特征在于,所述步骤五包括:

构建一个初始的多类别划分区域,通过计算各个划分区域的质心,在每一轮迭代时不断调整各个样本所属的簇分类,并在下一轮利用新的簇划分结果重新计算质心,如此反复迭代直至稳定,最终可获得一个可靠的聚类结果,以全部特征词在词向量空间中的表示作为输入,构建一个Kmeans模型,训练出特征词的聚类结果,每个特征词将属于一个特定的簇。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家新闻出版广电总局广播科学研究院,未经国家新闻出版广电总局广播科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811495424.4/1.html,转载请声明来源钻瓜专利网。

同类专利
  • 电力故障检测方法及装置-202310963365.3
  • 刘识;王耀影;李开阳;朱天佑;陈振宇;李继伟;任俊达;郑飞;陈飞 - 国家电网有限公司大数据中心
  • 2023-08-02 - 2023-10-27 - G06F16/36
  • 本公开实施例提供了一种电力故障检测方法及装置。该方法包括:获取电力故障实体信息;其中,所述电力故障实体信息包括电力故障器件、所述电力故障器件的部件、所述部件的故障类型以及故障处理策略中的任意两项;将所述电力故障实体信息输入至目标电力故障检测模型中,输出所述电力故障实体信息对应的目标故障路径以及目标故障路径的置信度;根据所述目标故障路径进行电力故障检测。本公开实施例,通过将所述电力故障实体信息输入至目标电力故障检测模型中,输出所述电力故障实体信息对应的目标故障路径以及目标故障路径的置信度;根据所述目标故障路径进行电力故障检测的方式,可以提高故障检测的准确率以及故障检测的可解释性。
  • 知识图谱的生成方法和装置、存储介质及电子设备-202310803471.5
  • 张子恒;林镇溪;吴贤 - 腾讯科技(深圳)有限公司
  • 2023-06-30 - 2023-10-27 - G06F16/36
  • 本申请公开了一种知识图谱的生成方法和装置、存储介质及电子设备。该方法包括:获取任务提示信息,任务提示信息中包括实体识别任务的任务描述信息以及目标文本;通过基于自然语言处理模型所构建的实体识别模型,对目标文本进行实体识别以得到目标文本中包含的对象实体及对象实体之间的关联关系,实体识别模型是利用任务文本语料对初始化的自然语言处理模型进行训练得到的,任务文本语料中包括用于确定对象实体之间不同的关联关系的任务指令;基于从目标文本中识别出的对象实体及对象实体之间的关联关系,生成与目标文本匹配的知识图。本申请解决了采用相关技术所生成的知识图谱依赖固有的构建框架,导致生成的知识图谱的应用灵活性较差的问题。
  • 意图识别方法、装置、电子设备及存储介质-202310907628.9
  • 宋亮;刘楚雄 - 重庆赛力斯新能源汽车设计院有限公司
  • 2023-07-21 - 2023-10-27 - G06F16/36
  • 本申请涉及人工智能技术领域,提供了一种意图识别方法、装置、电子设备及存储介质。该方法包括:获取用户指令,对用户指令进行语义解析,得到第一语义解析结果;基于第一语义解析结果识别用户意图;响应于基于第一语义解析结果无法确定用户意图,获取对用户上一轮指令进行语义解析的第二语义解析结果;基于第一语义解析结果和第二语义解析结果识别用户意图;响应于基于第一语义解析结果和第二语义解析结果无法确定用户意图,获取对用户上N轮指令进行语义解析的第三语义解析结果;基于第一语义解析结果和第三语义解析结果识别用户意图。该方法能提高意图识别的准确度,提升用户体验。
  • 基于小样本知识图谱补全的信息检索优化方法及其系统-202310940713.5
  • 周仁杰;马强;马浩男;杨畅;万健;蒋从锋;张伟 - 杭州电子科技大学
  • 2023-07-28 - 2023-10-27 - G06F16/36
  • 本发明公开基于小样本知识图谱补全的信息检索优化方法,构造小样本知识图谱补全模型GAKDN,利用门控和角色感知的邻居聚合器有效过滤邻居噪声信息,减少噪音信息在学习实体嵌入时的影响,通过角色识别网络学习实体和邻居关系的深层关联,识别实体在不同小样本关系下的角色;通过知识蒸馏提取小样本关系对应的实体对之间的结构信息,缓解样本表征不足的问题;利用自适应匹配处理器计算正负例查询集与支持集的得分,根据最高得分找到最适合的补全实体。本发明解决了噪声邻域、实体多角色和小样本场景下样本特征学习不足的问题,从而更准确地预测待补全的尾实体,提高小样本场景下知识图谱补全的准确率,以优化知识图谱的信息检索能力。
  • 知识图谱构建方法、装置、计算机可读介质及电子设备-202310150299.8
  • 张子恒;林镇溪;吴贤 - 腾讯科技(深圳)有限公司
  • 2023-02-09 - 2023-10-27 - G06F16/36
  • 本申请属于命名实体识别领域,涉及知识图谱构建方法、装置、计算机可读介质及电子设备,包括:获取待增添文本和第N轮训练数据,通过第N轮训练得到的命名实体识别模型对待增添文本进行类别标签迁移处理,获取第一标注信息,根据待增添文本和第一标注信息构建第N+1轮训练数据;根据第N轮训练数据和第N+1轮训练数据对命名实体识别模型进行第N+1轮训练;将各轮训练数据中的文本输入至第N+1轮训练得到的命名实体识别模型,获取全量标注信息,将全量实体标注信息与历史标注信息进行比对,获取增量标注信息;根据增量标注信息对历史标注信息对应的知识图谱进行更新,获取目标知识图谱。本申请能够提高知识图谱中实体及实体类别的覆盖度。
  • 基于知识图谱的知识融合方法、系统及存储介质-202310771262.7
  • 陈媛媛;高冉;陈莉;罗林;石翠丽;丁箭飞;魏冰蔗 - 中原工学院
  • 2023-06-27 - 2023-10-27 - G06F16/36
  • 本申请公开了一种基于知识图谱的知识融合方法、系统及存储介质。其首先获取来自于第一知识图谱的针对于第一实体的第一文本描述,接着,获取来自于第二知识图谱的针对于所述第一实体的第二文本描述,然后,对所述第一文本描述和所述第二文本描述进行语义编码融合以得到多源文本语义理解特征向量,最后,基于所述多源文本语义理解特征向量,生成针对于所述第一实体的融合文本描述。这样,可以避免因同一个实体在不同数据源中的不同描述方式所造成的语义偏差,从而造成的知识间冲突问题,进而提高知识图谱构建的准确性和效率。
  • 医疗知识图谱构建方法、装置、设备及介质-202310787158.7
  • 梁欣;倪渊 - 平安科技(深圳)有限公司
  • 2023-06-29 - 2023-10-27 - G06F16/36
  • 本发明涉及医疗数据处理领域,公开了一种医疗知识图谱构建方法、装置、设备及介质,方法包括:对医疗知识样本中的实体语句进行提取处理得到实体语句序列;对实体语句序列进行编码处理以生成实体向量;根据医疗知识样本在至少两个实体向量之间赋予关联向量,以表征对应的至少两个实体语句在医疗场景下的关系类别;根据实体向量、关联向量及预设重建规则生成重建医疗知识;根据重建医疗知识与图谱模板生成医疗知识图谱。本发明提供的医疗知识图谱构建方法结合医疗知识中的专有词汇以及在医疗场景下的各种语句关系生成完备而准确的医疗知识图谱,以为医生和患者提供优质的医学辅助服务。
  • 基于船舶规范知识图谱的智能检索方法、装置-202210753303.5
  • 张荷花;侯建国 - 清华大学
  • 2022-06-29 - 2023-10-27 - G06F16/36
  • 本发明实施例提供了一种基于船舶规范知识图谱的检索方法、装置,所述方法包括:接收第一查询请求,所述第一查询请求中携带第一查询词;响应于所述第一查询请求,基于所述第一查询词在预先构建的船舶规范知识图谱中进行检索,获取图谱查询数据;获取所述图谱查询数据对应的跨模态数据;返回所述图谱查询数据和所述跨模态数据。通过第一查询词在船舶规范知识图谱中的检索,以及图谱查询数据和跨模态数据的获取,实现了一种在船舶领域上知识图谱的检索方法的突破,提高了用户的检索效率和检索内容的准确性。
  • 文本匹配方法、装置、设备、存储介质及程序产品-202211399127.6
  • 林镇溪;张子恒 - 腾讯科技(深圳)有限公司
  • 2022-11-09 - 2023-10-27 - G06F16/36
  • 本申请公开了一种文本匹配方法、装置、设备、存储介质及程序产品,涉及计算机技术领域。所述方法包括:构建原始文本对应的连通图,连通图中包括至少两个节点,每个节点对应于原始文本中的一个实体,两个节点之间的边代表两个节点对应的实体之间具备关联性;确定原始文本对应的连通图与标准文本对应的连通图之间的匹配度,得到连通图匹配度;其中,连通图匹配度与两个连通图的节点之间匹配度和边之间匹配度有关;根据连通图匹配度,确定原始文本与标准文本之间的匹配结果。本申请通过构建连通图,以及进行对应的节点匹配和边匹配,使得到的匹配结果更具准确性和合理性。
  • 一种知识图谱处理方法及相关装置-202211428796.1
  • 杨韬 - 腾讯科技(深圳)有限公司
  • 2022-11-15 - 2023-10-27 - G06F16/36
  • 本申请实施例提供一种知识图谱处理方法及相关装置,该方法涉及人工智能技术领域,包括:获取预设的包含多个实体组的知识图谱,每个实体组中包含至少两个实体及其各自的实体描述信息,以及至少两个实体之间的关联关系;在多个实体组中筛选出缺失假设关联关系的目标实体,并将除目标实体外的其他实体作为候选实体;基于目标实体、目标实体描述信息,以及各候选实体各自关联的候选实体描述信息,分别获取各候选实体与目标实体之间相应的假设关联关系的预测值;筛选出符合预测值条件的目标预测值,并基于目标预测值关联的候选实体、目标实体和相应的假设关联关系,对知识图谱进行实体组处理。上述方法可以准确补偿知识图谱中缺少的信息。
  • 一种基于深度强化学习的知识图谱构建方法-202310729375.0
  • 苏中秋;陈鹏;王妍妍;周迅钊;朱翔鹰 - 中电莱斯信息系统有限公司
  • 2023-06-19 - 2023-10-27 - G06F16/36
  • 本发明公开了一种基于深度强化学习的知识图谱构建方法,利用强化学习对语料筛选,并将其用于深度神经网络训练抽取关系三元组,把成熟的网络用于抽取知识数据后导入图数据库的方法。本发明利用远监督和强化学习算法用于语料标注,并提出在文本数据包里再分堆的方法,找到语料实例的先验关系并对其标注,再用于深度神经网络训练;训练效果又将反作用于强化学习模块修改策略参数,以提升文本数据分类质量。准确的标注语料将提升神经网络的训练效果,从而提高神经网络自动抽取关系三元组的质量用于构建知识图谱。
  • 期货产业链知识图谱构建方法、装置及计算机设备-202310449192.3
  • 吴福文;康维鹏;唐逐时;杨胜利 - 浙商期货有限公司
  • 2023-04-24 - 2023-10-27 - G06F16/36
  • 本发明实施例公开了期货产业链知识图谱构建方法、装置及计算机设备。所述方法包括:获取期货产业链的多种异构形式的原始数据;对所述原始数据进行文本化转化和提取,以得到提取结果;利用所述提取结果抽取期货产业链实体关系,以得到实体以及实体对属性关系;根据所述实体以及实体对属性关系构建期货产业链知识图谱。通过实施本发明实施例的方法可实现从多源异构数据中抽取构建期货产业链知识图谱,形成体系化知识逻辑。
  • 图谱校验方法、装置和存储介质及电子设备-202310072762.1
  • 张子恒;林镇溪;吴贤 - 腾讯云计算(长沙)有限责任公司
  • 2023-01-12 - 2023-10-27 - G06F16/36
  • 本申请公开了一种图谱校验方法、装置和存储介质及电子设备。其中,该方法包括:获取第一文本信息库,其中,第一文信息本库中的文本信息属于目标知识领域;在已构建目标知识图谱的情况下,确定目标知识图谱中的各个知识实体与第一文本信息库中的文本信息之间的映射关系,其中,目标知识图谱为依据第二文本信息库中的文本信息构建得到的、用于表示目标知识领域下的各个知识实体之间关系的图数据结构,第二文本信息库中的文本信息属于目标知识领域;基于映射关系,利用第一文本信息库中的文本信息对目标知识图谱进行校验。本申请解决了图谱校验准确性较低的技术问题。
  • 知识图谱的数据增强方法、装置及电子设备-202311213014.7
  • 张建伟;刘靖楠;姜东基 - 首都信息发展股份有限公司
  • 2023-09-20 - 2023-10-27 - G06F16/36
  • 本发明提供了一种知识图谱的数据增强方法、装置及电子设备,获取待处理知识图谱;其实体之间的关系为双向关系;逻辑规则为关系路径到关系的映射;采用随机游走的方式,获取逻辑规则和数据分布信息,进而遍历待处理知识图谱中的每个已有三元组,针对每个已有三元组,确定该已有三元组对应的至少一个候选三元组;计算每个候选三元组的分值,以确定其对应的增强三元组,并更新至待处理知识图谱中。该方式定义了待处理知识图谱中的逻辑规则,并采用随机游走的方式,学习该逻辑规则和待处理知识图谱中的数据分布信息,再利用学习到的逻辑规则和数据分布信息对待处理知识图谱进行数据增强,可以达到充分利用信息、提升辅助预测准确度的目的。
  • 问题生成方法、装置、设备及存储介质-202210399656.X
  • 叶碧荣;王硕佳;郭鲁宁;姜洪韬 - 腾讯科技(深圳)有限公司
  • 2022-04-15 - 2023-10-27 - G06F16/36
  • 本申请公开了一种问题生成方法、装置、设备及存储介质,可以应用于云技术、人工智能、智慧交通、车联网等各种场景,所述方法包括:获取目标对象的目标流调属性信息;基于所述目标流调属性信息,确定目标流调知识图谱;基于所述目标流调知识图谱,确定所述目标对象的初始问题;根据所述目标对象的初始语句,确定初始关键词;基于所述目标流调知识图谱,确定与所述初始关键词匹配的目标流调关键词;根据所述目标流调关键词,生成目标问题。本申请实现了自动生成流调问题,提高了流调的效率。
  • 一种基于非隐私数据关联的知识图谱分析方法-202310889681.0
  • 李建刚;尚进;肖彤;李洋 - 上海企卓元科技合伙企业(有限合伙)
  • 2023-07-19 - 2023-10-27 - G06F16/36
  • 本发明涉及数据处理技术领域,提供一种基于非隐私数据关联的知识图谱分析方法,方法包括:获取非隐私数据集,生成语料数据库;获取第一文本实体集合;获取第一知识图谱;获取第一分析目标,确定多个数据源,输出标识实体集合;得到数据缺失度;输出语料补充库;输出目标分析结果,解决由于隐私数据缺失造成的信息分析不准确技术问题,实现有效地从大规模的非结构化文本数据中提取实体和关系,并转化为知识图谱表示,同时,针对隐私数据缺失引起的非隐私数据不完整,采用特征点融合预测缺损率,补充图谱信息缺失度,提高知识图谱的质量,快速、高效地构建和更新知识图谱,从多个数据源中提取和整合知识,提高数据分析的效率和准确性技术效果。
  • 企业知识图谱构建系统及其方法-202311032868.5
  • 罗文俊;陈杏茹;柯学斌;庄雷;林卫;陈章 - 公诚管理咨询有限公司
  • 2023-08-16 - 2023-10-27 - G06F16/36
  • 本发明公开了一种企业知识图谱构建系统及其方法,涉及知识图谱技术领域。该系统包括依次通信连接且用于采集企业内部数据并对其进行数据处理,获取企业源数据的采集处理模块、用于根据企业源数据提取知识要素的知识提取模块、用于对知识要素进行语义表示的知识表示模块、用于消除知识要素与事实对象之间的歧义,生成知识图谱的知识融合模块和用于对知识图谱进行推理和扩展,生成企业知识库的知识推理模块。本发明通过构建知识图谱来组织和关联知识节点,实现企业内部知识的整合与知识网络的形成;并通过优化公司各业务的流程效率和服务质量水平,促进知识在企业内部的流通与使用。
  • 知识图谱构建方法、装置和可读存储介质-202210753324.7
  • 张荷花;侯建国 - 清华大学
  • 2022-06-29 - 2023-10-27 - G06F16/36
  • 本发明实施例提供了一种知识图谱构建方法、装置和可读存储介质,所述方法包括:识别船舶规范文本中的船舶实体;在确定识别得到的所述船舶实体中存在第一实体对的情况下,将所述第一实体对和所述船舶规范文本输入关系预测模型,通过所述关系预测模型输出所述第一实体对的关系预测结果;在所述第一实体对的关系预测结果中确定目标预测关系;构建船舶知识三元组;根据所述船舶规范文本和所述船舶知识三元组,构建知识图谱。本发明通过对规范文本中实体的识别和实体关系的预测以及预测关系的校正,提高了构建知识图谱的准确率和效率,有助于为技术人员提供高效的船舶领域知识服务,提高船舶行业的生产质量和效率。
  • 一种基于知识图谱的人格预测方法-202310771026.5
  • 吴斌;刘旭;朱洋甫 - 北京邮电大学
  • 2023-06-28 - 2023-10-27 - G06F16/36
  • 本发明提出一种基于知识图谱的人格预测方法,包括,利用心理语言学知识,构建人格知识图谱;获取用户社交文本,对社交文本进行数据预处理,得到预处理数据;对预处理数据的词类特征进行特征抽取,基于LIWC词类得到词频关系;根据词频关系将预处理数据与所述人格知识图谱的语义对齐,得到人格异质图;在人格异质图上实施行走策略,得到人格异质图嵌入;根据人格异质图嵌入构建模型,并基于模型输出五人格评分。本发明提出的方法充分利用了知识图谱知识,实现了自动化人格预测,有效提升了五人格预测结果。
  • 一种基于知识图谱和神经网络的推荐算法-202310815731.0
  • 李钝;马立远;张海洋;郑志蕴 - 郑州大学
  • 2023-07-05 - 2023-10-27 - G06F16/36
  • 本发明涉及人工智能领域中推荐系统方向,公开了一种基于知识图谱和神经网络的推荐算法。算法分为四部分:知识图谱构建、知识图谱嵌入、特征信息传播和推荐。知识图谱构建部分,分别构建协同知识图谱、用户知识图谱和项目知识图谱。知识图谱嵌入部分,引入多尺度空洞卷积捕获实体在多个尺度空间下的特征信息,使用残差网络技术防止卷积过程中丢失信息,利用注意力机制对多尺度卷积结果进行聚合,完成实体和关系的嵌入表示。特征信息传播部分,利用多头图注意力网络和衰减机制传播并聚合实体邻域信息。推荐部分,根据用户和项目表示的内积计算交互概率,生成推荐列表。本推荐算法具有良好的可解释性,能够更好地捕获用户偏好并提高推荐的准确率。
  • 一种基于知识图谱的数据处理方法、相关装置及存储介质-202310555659.2
  • 黄剑辉 - 腾讯科技(深圳)有限公司
  • 2023-05-16 - 2023-10-27 - G06F16/36
  • 本申请公开了一种基于知识图谱的数据处理方法、相关装置及存储介质。本申请方法包括:基于目标知识图谱构建三元组正样本;对第一实体以及第二实体进行语义编码,得到第一实体向量以及第二实体向量;采用至少一个矩阵对第一实体向量以及第二实体向量进行特征融合,生成三元组正样本所对应的融合语义向量;基于融合语义向量,通过分类网络获取三元组正样本所对应的关系预测向量;根据三元组正样本所对应的关系预测向量以及第一标注向量,对分类网络的模型参数、第一实体向量以及第二实体向量进行更新量。本申请基于多维度实体向量交互机制得到的融合语义向量,对实体关系向量以及实体向量进行更新,从而提高知识图谱特征表示的精确度。
  • 一种图谱构建方法、装置及存储介质-202210392930.0
  • 廖雨根 - 中移物联网有限公司;中国移动通信集团有限公司
  • 2022-04-14 - 2023-10-27 - G06F16/36
  • 本发明公开了一种图谱构建方法、装置及存储介质,方法包括:从监控系统存储的目标数据源中,获取目标业务系统的节点连接数据;利用节点连接数据,分析出目标业务系统中存在连接关系的每个节点,得到多个节点;从节点连接数据中,提取多个节点中每个节点对应的一组监听数据,得到多组监听数据;对多组监听数据聚合去重,得到多个节点的连接关系数据,并利用连接关系数据构建多个节点的业务拓扑知识图谱。通过上述技术方案,提高了图谱构建的效率。
  • 一种标签消歧方法、装置、设备和计算机可读存储介质-202011148559.0
  • 陈扬;陆惠国;顾文斌;陆争辉;祝志伟 - 上海恒生聚源数据服务有限公司
  • 2020-10-23 - 2023-10-27 - G06F16/36
  • 本申请公开了一种标签消歧方法、装置、设备和计算机可读存储介质,从预先构建的知识图谱中获取与歧义标签对应的子图。在指示词与歧义标签在资讯中的位置关系,与在样本资讯中的位置关系一致的情况下,利用指示词与歧义标签的语义相似度、以及指示词与资讯的关联度,计算指示词的语义维度权重。利用语义维度权重和边权重属性,计算各个子图的权重。比较各个子图的权重,选出目标子图。将目标子图中所包含的目标类别,作为歧义标签所属的类别。本申请参考了指示词与歧义词的关联度、指示词与歧义词的语义相似度、指示词与资讯的关联度、以及类别与指示词的关联度,能够从多方面来解析歧义标签所指示的实体,使得歧义判断结果具有可靠性。
  • 一种基于知识平台的图谱管理系统及计算机可读存储介质-202211501630.8
  • 杨娟;杨再飞;翟士丹;冯正;李田田 - 北京海致星图科技有限公司
  • 2022-11-28 - 2023-10-27 - G06F16/36
  • 本发明涉及知识图谱技术领域。一种基于知识平台的图谱管理系统包括图本体模型管理模块、数据源管理模块、数据接入管理模块和数据概览管理模块,其中,图本体模型管理模块用于创建图实例以及对创建的所述图实例进行管理;数据源管理模块被配置为:响应于所述图实例,为所述图实例配置图数据库,建立所述图数据库加载到所述图实例中的目标路径;数据接入管理模块被配置为:响应于所述目标路径,将图实例对应的数据接入所述图数据库中,所述目标路径对应位置,并对接入的数据进行管理;数据概览管理模块被配置为:预览所述图实例以及所述图实例的查询定位;其中,所述图实例、所述目标路径以及所述数据管理进行可视化操作。
  • 多语言刑事判决书知识图谱的构建方法-201910909778.7
  • 赵小兵;袁乌日嘎;赖文;包乌格德勒 - 中央民族大学
  • 2019-09-25 - 2023-10-27 - G06F16/36
  • 本发明提供一种多语言刑事判决书知识图谱的构建方法,涉及计算语言学领域。通过本发明构建的汉语、民族语融合的刑事判决书知识图谱,能使现有刑事判决书的制作、校对获得更为客观合理的表达方式,助力于提升完善司法从业人员的教育培训方式与内容。同时本发明的方法能够更细致地提供规范化写作模式,实现专业知识跨语言对比查询,可广泛应用于汉语与民族语裁判文书与先进智能领域。
  • 基于数据模型构建数据图谱的方法及构建数据图谱的系统-201911074301.8
  • 苏川川;房爱印;王勇强;刘功胜;路中振 - 浪潮软件集团有限公司
  • 2019-11-06 - 2023-10-27 - G06F16/36
  • 本发明公开了一种基于数据模型构建数据图谱的方法及构建数据图谱的系统,属于数据图谱领域,要解决的技术问题为如何将数据以数据图谱的形式进行存储以提高数据查询效率。方法包括:对数据资源进行聚类分析;根据上述聚类分析得到的类结合不同的业务场景建立本体模型;结合场景对上述聚类分析得到的类进行关联分析,得到领域模型;对本体模型属性和数据库字段进行对应,得到数据映射关系;生成图谱数据并得到数据图谱;得到超级档案。系统包括聚类分析模块、本体模型构建模块、本体模型构建模块、领域模型构建模块、数据映射模块、数据抽取模块以及超级档案构建模块。
  • 知识图谱构建方法、装置、电子设备及可读存储介质-202010226149.7
  • 黄晓萌;安旭;王溪 - 中金智汇科技有限责任公司
  • 2020-03-25 - 2023-10-27 - G06F16/36
  • 本申请提供一种知识图谱构建方法、装置、电子设备及可读存储介质,包括:根据依存语法树对原始文本进行处理,获得原始文本对应的多个初选扩充文本,初选扩充文本由原始文本通过分词顺序调换组成;获取原始文本中的分词的至少一个近同词,分词为组成原始文本的词;对多个初选扩充文本中的每个初选扩充文本,根据预设规则进行近同词替换,获得多个次选扩充文本;根据多个次选扩充文本以及知识图谱关联关系,对原始知识图谱进行扩充,得到扩充后的知识图谱。与原有的知识图谱相比,实体数量更多,实体之间的相互关系更复杂;且利用依存语法树得到初选扩充文本,改善了现有技术受限于文本长度或复杂度的影响,相对时间复杂度较高的问题。
  • 一种数据处理方法和装置-202010884964.2
  • 杨帆;刘岩 - 泰康保险集团股份有限公司
  • 2020-08-28 - 2023-10-27 - G06F16/36
  • 本发明公开了数据处理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括通过外部存储器和外部存储器接口获取领域文件文本,生成文件文本集合,以将文件文本中的词添加到词列表中,计算每个词的权重,提取关键词,进而调用聚类引擎,计算得到类别主题,根据所述类别主题构建主题实体以形成主题子图谱;根据领域文件在数据库中的数据表,构建信息子图谱;调用外部存储器接口,获取预设的通用知识图谱,根据关键词生成概念子图谱;将主题子图谱、信息子图谱、概念子图谱进行融合,生成领域知识图谱并通过系统接口输出。从而,本发明的实施方式能够解决现有领域知识图谱构建效率低、成本高的问题。
  • 自动分割文本的方法、系统和存储介质-201811197349.3
  • S·海恩德拉夫;N·利普卡 - 奥多比公司
  • 2018-10-15 - 2023-10-27 - G06F16/36
  • 各种实施例描述了使用预测模型以分割来自指令手册的内容的分割应用。在一个示例中,分割应用接收包括训练标签和从指令手册可获得的步骤的训练数据。分割应用基于训练数据和损失函数来训练预测模型。训练包括通过预测模型来生成子步骤是否是步骤的开始的预测,并且基于预测与训练标签的比较来最小化损失函数。在训练完成时,分割应用标识电子源和指示特定步骤的开始的开始指示符。响应于来自客户端设备的、关于对象的查询,分割应用提供从开始指示符生成的步骤。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top