[发明专利]用于基于语义关系来将自由文本临床文档建模为层次图状数据结构的系统和方法有效

申请号：	201780032398.9	申请日：	2017-05-15
公开（公告）号：	CN109313648B	公开（公告）日：	2023-06-09
发明（设计）人：	L·D·M·奥利韦拉;D·H·特奥多罗	申请（专利权）人：	皇家飞利浦有限公司
主分类号：	G06F16/30	分类号：	G06F16/30
代理公司：	永新专利商标代理有限公司 72002	代理人：	李光颖;王英
地址：	荷兰艾***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	本公开涉及基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构。一种方法包括解析、识别并且标注自由文本临床文档内的临床术语。这通过将识别的临床术语存储在概念节点中来完成。所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构。自由文本临床文档的临床概念被分类为临床事件类别。所述自由文本临床文档包括与临床概念种类相关联的临床术语。对临床概念进行分类包括将自由文本临床文档组织为描述自由文本临床文档的特定方面的节段，所述自由文本临床文档包括所述文档的临床方面、技术方面或者管理方面中的一个或多个。提供临床概念之间的链接，使得个体临床概念对应于个体概念节点。
搜索关键词：	用于基于语义关系自由文本临床文档建模层次数据结构系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种被配置用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构的系统，所述系统包括：一个或多个硬件处理器，其由机器可读指令配置为：使用自然语言处理用于解析、识别并且标注自由文本临床文档内的临床术语；将识别的临床术语存储在概念节点中，所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构；将自由文本临床文档的临床概念分类为临床事件类别，所述自由文本临床文档包括与临床概念种类相关联的临床术语，其中，对临床概念进行分类包括将自由文本临床文档组织为描述所述自由文本临床文档的特定方面的节段，所述自由文本临床文档包括所述文档的临床方面、技术方面或者管理方面中的一个或多个；并且提供临床概念之间的链接，使得个体临床概念对应于个体概念节点，所述链接是概念边，所述概念边具有进一步表征对应的临床节点对之间的关系的属性，其中，表征所述关系包括(1)使用临床概念之间的语义关系来计算所述概念边并且(2)提供边分数来指示两个临床概念之间的相似性。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司，未经皇家飞利浦有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201780032398.9/，转载请声明来源钻瓜专利网。

同类专利

会话数据处理方法、装置、设备和存储介质-202310922740.X
发明人：于鹏 -专利权人：北京仁科互动网络技术有限公司
申请日： 2023-07-26 - 公布日： 2023-10-13 - 主分类号： G06F16/30
摘要：本发明涉及数据处理技术领域，提供一种会话数据处理方法、装置、设备和存储介质，该方法包括：获取待处理的目标会话数据；对目标会话数据进行预处理，得到目标会话数据对应的目标文本；利用大语言模型根据目标文本和原始提示词，得到目标会话数据对应的第一提示结果；原始提示词中至少包含标签；大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型；利用大语言模型根据第一提示结果，进行相应的业务处理操作。本发明提高了对目标会话数据进行分析处理的效率。

一种知识图谱的布局方法、装置、设备及介质-202310763025.6
发明人：周虹;康健梓;陈小军;李俊杰 -专利权人：深圳大学
申请日： 2023-06-27 - 公布日： 2023-09-26 - 主分类号： G06F16/30
摘要：本申请适用于知识图谱技术领域，提供一种知识图谱的布局方法、装置、设备及介质。方法包括：获取已构建的知识图谱；根据知识图谱中各个节点的标签类型，得到每个节点受到的同吸异排力；其中，任意一个目标节点受到的同吸异排力等于目标节点周边预设范围内的每个节点对目标节点施加的吸引力或排斥力的合力，目标节点周边预设范围内的每个与目标节点的标签类型相同的节点对目标节点施加的力为吸引力，目标节点周边预设范围内的每个与目标节点的标签类型不同的节点对目标节点施加的力为排斥力；对各个节点施加同吸异排力，得到布局后的知识图谱。本申请对各个节点施加同吸异排力，令标签类型相同各个节点的分布较为聚集，提高了知识图谱的可读性。

业务处理方法以及装置-202110160323.7
发明人：许瑾 -专利权人：蚂蚁胜信（上海）信息技术有限公司
申请日： 2021-02-05 - 公布日： 2023-09-19 - 主分类号： G06F16/30
摘要：本说明书实施例提供业务处理方法以及装置，其中所述业务处理方法包括：获取目标业务中包含至少两个对话角色的历史多媒体业务数据，并将所述历史多媒体业务数据转换为文本信息，将所述文本信息划分为文本片段，根据所述文本片段的语义信息对所述文本片段进行对话角色划分，并根据对话角色划分结果以及所述语义信息确定目标对话角色，获取所述文本片段中所述目标对话角色的问题文本间的关联关系，根据所述关联关系筛选所述文本片段中所述目标对话角色的目标问题文本，并基于所述目标问题文本构建所述目标业务的话术知识库。

一种基于多标签驱动的专题数据构建方法及系统-202310814079.0
发明人：钱力;张彧;谢靖;王颖;贾海清;徐浩亮;张茹敏;常志军;霍诗漫;许丽媛 -专利权人：中国科学院文献情报中心
申请日： 2023-07-05 - 公布日： 2023-09-01 - 主分类号： G06F16/30
摘要：本发明公开了一种基于多标签驱动的专题数据构建方法及系统，属于知识工程领域，所述方法包括：基于初始专题集，构建专题知识结构树；当满足预设更新周期，根据专题数据自动遴选规则，遍历专题知识结构树进行专题数据遴选，采集专题数据集；对专题数据集进行多标签配置，生成多标签标识结果；根据多标签标识结果和专题数据集对初始专题数据集进行更新，生成专题数据库。本申请解决了现有技术中构建专题数据库效率低、效果差、实时性差的技术问题，实现了专题数据库构建的自动化和智能化，达到了自动智能地获取、分类、标注、添加、更新数据，从而高效、精准、动态地构建专题数据库的技术效果。

一种电力线通信噪音库构建方法及系统-202310475975.9
发明人：施展;李星南;李波;邓晓智;梁宇图;曾瑛;张健 -专利权人：广东电网有限责任公司;广东电网有限责任公司电力调度控制中心
申请日： 2023-04-28 - 公布日： 2023-08-22 - 主分类号： G06F16/30
摘要：本发明公开了一种电力线通信噪音库构建方法及系统，包括：通过各边缘服务器，分别利用云侧噪声时序知识图谱中的所有第一邻居实体集合和所有第二邻居实体集合，结合噪声数据特征集合和多模映射关系模型，对边侧噪声时序知识图谱的边侧四元组中的第一主实体集合和第一客实体集合进行补全，获得第二主实体集合和第二客实体集合；通过云服务器，接收各个边缘服务器上传的补全后的边侧噪声时序知识图谱，并将所有补全后的边侧四元组进行聚合，然后根据聚合结果对云侧噪声时序知识图谱进行补全，以更新云侧噪音库并将更新后的云侧噪音库作为电力线通信噪音库。本发明利用云服务器和多个边缘服务器之间的云边协同，提升电力线通信噪音库的构建精度。

一种游戏运营数据分析方法、系统及存储介质-202210450364.4
发明人：郭喜龙 -专利权人：深圳爱玩网络科技股份有限公司;江苏果米文化发展有限公司
申请日： 2022-04-26 - 公布日： 2023-08-01 - 主分类号： G06F16/30
摘要：本发明公开提供的一种游戏运营数据分析方法、系统及存储介质。该游戏运营数据分析方法包括获取游戏平台对应的注册用户数目和各注册用户对应的基本注册信息；从游戏平台后台提取各注册用户对应的反馈数据；对游戏平台对应的各预设优化方向进行优化权重设置；对游戏平台对应的各优化阶段和各预设优化方向进行解析；本法发明有效的解决了当前技术没有从用户体验感层面进行分析的问题，并且凸显了当前游戏平台存在的问题，从而为游戏平台自身完善提供了可靠的参考依据和明确的方向，大幅度提升了用户与游戏平台的粘性和忠实度，同时还大幅度提升了用户对应的游戏体验感，并且在一定程度上提高了游戏平台的运营效率。

构建中文事件库及基于该元事件库对元事件分析预测的方法及系统-202310001827.3
发明人：乔春庚;刘永志;王洪俊 -专利权人：拓尔思信息技术股份有限公司
申请日： 2023-01-03 - 公布日： 2023-07-04 - 主分类号： G06F16/30
摘要：本发明提出了一种构建中文事件库及基于该元事件库对元事件分析预测的方法及系统。构建中文事件库的方法具体步骤包括：S1：元事件抽取；S2：元事件共指；S3：元事件关联；S4：元事件聚合；S5：最终通过S1‑S4形成元事件抽取库、元事件共指库、元事件关联库、元事件专题库，共同构成中文事件库。基于该元事件库形成的一种元事件可视化分析预测的方法，具体步骤包括：S1：元事件库检索；S2：元事件专题分析；S3：元事件预测分析。本发明构建一种适合中文新闻及情报数据处理、分析、预测的中文事件库，不局限于数据统计，实现对事件的语义分析，并通过该中文事件库，可视化元事件脉络，使中文元事件识别更准确，并可预测元事件的下一步发展趋势。

用于基于语义关系来将自由文本临床文档建模为层次图状数据结构的系统和方法-201780032398.9
发明人： L·D·M·奥利韦拉;D·H·特奥多罗 -专利权人：皇家飞利浦有限公司
申请日： 2017-05-15 - 公布日： 2023-06-09 - 主分类号： G06F16/30
摘要：本公开涉及基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构。一种方法包括解析、识别并且标注自由文本临床文档内的临床术语。这通过将识别的临床术语存储在概念节点中来完成。所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构。自由文本临床文档的临床概念被分类为临床事件类别。所述自由文本临床文档包括与临床概念种类相关联的临床术语。对临床概念进行分类包括将自由文本临床文档组织为描述自由文本临床文档的特定方面的节段，所述自由文本临床文档包括所述文档的临床方面、技术方面或者管理方面中的一个或多个。提供临床概念之间的链接，使得个体临床概念对应于个体概念节点。

一种多系统电网模型设备ID匹配装置及方法-201710469732.9
发明人：高红娟;徐睿;袁磊平;王昆;缪秋;卢红;吴康;顾甜;刘志仁 -专利权人：国网江苏省电力公司无锡供电公司;国家电网公司
申请日： 2017-06-20 - 公布日： 2023-06-09 - 主分类号： G06F16/30
摘要：本发明公开了一种多系统电网模型设备ID匹配装置，其中，包括：线路数据采集电路，用于采集调度自动化系统d5000中的线路数据信息；逻辑判断电路，用于根据所述线路数据信息中的每个线路ID确定该线路ID的主变开关；计量点数据采集电路，所述计量点数据采集电路用于采集电量采集系统PBS3000中的计量点ID；控制电路，所述控制电路用于找到所有计量点ID中与该开关设备ID对应的计量点ID；文本生成电路，所述文本生成电路用于根据生成对应文本文件；输出电路，所述输出电路用于输出所述对应文本文件。本发明还公开了一种多系统电网模型设备ID匹配方法。本发明提供的多系统电网模型设备ID匹配装置大幅提高工作效率及正确率。

分析与非结构化文档相关联的去重复数据块-202211503382.0
发明人： M·巴斯勒;T·汉普-班穆勒;Y·萨耶 -专利权人：国际商业机器公司
申请日： 2022-11-28 - 公布日： 2023-05-30 - 主分类号： G06F16/30
摘要：本文描述了与非结构化文档处理相关的技术。一种相关联的计算机实现的方法包括：识别与非结构化文档集合相关联的多个去重复数据块。该方法还包括：基于至少一个块频率度量，按降序对多个去重复数据块排序；选择排序最高的未处理的去重复数据块；将文本分析应用于所选择的去重复数据块；以及将文本分析的至少一个结果应用于非结构化文档集合之中的包括所选择的去重复数据块的任何文档。该方法响应于满足至少一个停止条件而被终止。

文本处理方法、装置、设备及存储介质-202011632673.0
发明人：闫莉;万根顺;高建清;刘聪;王智国;胡国平 -专利权人：科大讯飞股份有限公司
申请日： 2020-12-31 - 公布日： 2023-05-30 - 主分类号： G06F16/30
摘要：本申请实施例公开了一种文本处理方法，根据文本中的各个句子的文本特征对文本中的各个句子进行处理，得到边界位置序列；该边界位置序列中的每个边界位置指示一个有效片段的起始句子或结束句子，其中，第K个有效片段的起始句子基于第K‑1个有效片段的结束句子确定，第K个有效片段的结束句子基于第K个有效片段的起始句子确定；基于边界位置序列，获取文本中的有效片段以构成目标文本。基于本申请的方案，实现了文本中的有效片段的自动提取，提高了对文本进行规整的效率。

应对VR跑步机的智能化数据处理方法及系统-202310155999.6
发明人：阳序运;刘卓;郭志刚 -专利权人：广州卓远虚拟现实科技有限公司
申请日： 2023-02-23 - 公布日： 2023-05-16 - 主分类号： G06F16/30
摘要：本申请实施例提供的应对VR跑步机的智能化数据处理方法及系统，在挖掘VR跑步机状态识别记录时考虑VR跑步机传感数据流的全部内容，可以保障VR跑步机状态识别记录的全面性，在挖掘运动强度状态识别记录时仅考虑运动强度传感数据流，能够减少VR跑步机传感数据流中的其他数据对运动强度的分析干扰，基于此，在确定VR跑步机传感数据流的坡度速度调节参考过程中，不仅考虑了VR跑步机状态识别记录，还引入了运动强度状态识别记录，这样可以基于VR跑步机层面和用户层面进行跑步机调节标签的综合确定，以便基于跑步机调节标签从预设数据库中确定出坡度速度调节参考，如此，能够通过坡度速度调节参考自适应且智能化地调节VR跑步机的坡度和速度。

一种基于Subword词表的能源数据清洗方法及装置-202310134265.X
发明人：彭勃;左婧;龚贤夫;李耀东;李作红;张姣;李欣洋;谢敏 -专利权人：广东电网有限责任公司
申请日： 2023-02-17 - 公布日： 2023-05-12 - 主分类号： G06F16/30
摘要：本发明公开了一种基于Subword词表的能源数据清洗方法及装置，所述方法包括：在获取能源数据后，利用预设的Subwrod词表将所述能源数据的每个文本转换成第一文本嵌入矩阵，所述Subwrod词表是字符粒度级别的文本列表；将所述第一文本嵌入矩阵转换成符合模型输入格式的综合矩阵；将所述综合矩阵输入至预设的神经网络模型进行清洗处理，得到清洗数据。本发明可以利用字符粒度级别的Subwrod词表从能源数据中提取句子和序号并将其转换成模型的输入矩阵，再将输入矩阵输入至模型进行清洗处理得到清洗后的数据，由于Subwrod词表是字符粒度级别，不但规模小而且转换处理不会损失数据的信息量，进而能节省后续清洗计算的数据量，以缩短计算的处理耗时，提升清洗数据的处理效率。

文本问题的数学化处理方法、装置、设备和存储介质-201710687829.7
发明人：刘晓江;王䶮;史树明 -专利权人：深圳市腾讯计算机系统有限公司
申请日： 2017-08-11 - 公布日： 2023-05-05 - 主分类号： G06F16/30
摘要：本发明涉及一种文本问题的数学化处理方法、装置、计算机设备和存储介质，该方法包括：获取问题文本序列；映射所述问题文本序列中的数字为表达式词汇；将包括所述表达式词汇的问题文本序列编码为语义向量；解码所述语义向量，生成包括所述表达式词汇的表达式；将所述表达式中的所述表达式词汇替换为所映射的数字。本申请的方案提高了用于答题的表达式的准确性。

语料数据库、语料数据库的维护方法、装置、设备和介质-202211443162.3
发明人：林余楚;古树桦 -专利权人：深译信息科技（珠海）有限公司
申请日： 2022-11-18 - 公布日： 2023-04-07 - 主分类号： G06F16/30
摘要：本发明公开了一种语料数据库、语料数据库的维护方法、装置、设备和介质，包括：对写入到语料数据库的基础数据集从不同维度进行细粒度分析，确定基础数据集的应用类型，维度为预先设置好的，应用类型包括通用性型和特定任务型；基于应用类型，对基础数据集进行聚合操作，得到基础数据集对应的训练任务；根据训练任务，采用预训练语言模型对基础数据集进行分析训练，得到目标数据集；在接收到数据交互指令时，采用各个目标数据集进行数据交互，实现通过对写入的基础数据集进行分析聚合和交互，使得写入数据集对于各种任务具有较强适应性，提高数据集的质量。

法条数据处理方法、装置、存储介质及电子设备-201811542431.5
发明人：高留杰;张君福;赵文 -专利权人：北京北大软件工程股份有限公司
申请日： 2018-12-17 - 公布日： 2023-03-10 - 主分类号： G06F16/30
摘要：本申请涉及法条数据处理方法、装置、存储介质及电子设备，属于数据处理技术领域。本申请包括：获取数据库中的法条数据；通过预设的规则确定法条的句式复杂程度，所述句式复杂程度包括：句式简单或者句式复杂；根据确定出的所述句式复杂程度对法条进行拆分处理。通过本申请可以实现根据法条的句式复杂程度对法条进行相应的拆分处理，有助于满足对法条的拆分处理精准度需求。

面向海量大数据的存储服务处理方法、系统及云平台-202211534159.2
发明人：马寅;黄宗灿 -专利权人：马寅
申请日： 2022-12-02 - 公布日： 2023-02-03 - 主分类号： G06F16/30
摘要：本发明提供的面向海量大数据的存储服务处理方法、系统及云平台，涉及数据处理技术领域。在本发明中，从待存储文本数据中提取出候选关键文本数据，候选关键文本数据属于待存储文本数据中的至少一部分文本数据；依据预先通过进行网络优化处理形成的关键文本数据识别神经网络，对候选关键文本数据进行识别提取处理，以识别出候选关键文本数据中的目标关键文本数据，目标关键文本数据属于候选关键文本数据中的至少一部分文本数据；对目标关键文本数据和待存储文本数据中目标关键文本数据以外的非目标关键文本数据分别进行存储。基于上述内容，可以改善现有技术中存在的数据的存储管控效果不佳的问题。

试题资源分析方法、装置、电子设备和存储介质-202011580551.1
发明人：王金树;苏喻;付瑞吉;王士进;魏思;胡国平 -专利权人：科大讯飞股份有限公司
申请日： 2020-12-28 - 公布日： 2023-01-17 - 主分类号： G06F16/30
摘要：本发明提供一种试题资源分析方法、装置、电子设备和存储介质，其中方法包括：确定待分析的试题资源；对试题资源进行错误率分析，得到错误率分析结果；将试题资源输入使用频次预估模型，得到使用频次预估模型输出的适用性分析结果，使用频次预估模型是基于样本试题资源，以及样本试题资源在目标应用场景下的适用性标签训练得到的；基于错误率分析结果和适用性分析结果，确定试题资源的分析结果。本发明提供的方法、装置、电子设备和存储介质，能够得到能够从规范性、完善性、周期适用性等层面上表征试题资源质量的分析结果，实现了全面、客观的试题资源质量分析，有助于合理分配试题资源加工资源，实现高效率的试题资源加工。

基于房地产行业的大数据处理及系统-201810146273.5
发明人：董纪昌;郑长敬;刘颖;李秀婷;董志 -专利权人：郑长敬
申请日： 2018-02-12 - 公布日： 2023-01-03 - 主分类号： G06F16/30
摘要：本发明实施例公开了一种基于房地产行业的大数据处理方法及系统，方法包括：通过网络爬虫获取原始数据；对原始数据进行数据清洗及筛选处理，以得到关键词数据库及房地产公众舆情数据库；根据关键词数据库及房地产公众舆情数据库建立训练模型；通过网络爬虫获取待处理数据；将待处理数据输入所述训练模型以得到处理结果。实施本发明实施例，实现了对数据的精细化处理，为后续基于该数据进行房地产行业预期的准确性提供了保证。

一种文本相似度获取方法和装置-201910749755.4
发明人：罗莎;季成晖;梅秋艳;卢俊之;杨璧嘉;杨玥;陈永全 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-08-14 - 公布日： 2022-11-29 - 主分类号： G06F16/30
摘要：本申请实施例公开了一种文本相似度获取方法和装置，所述方法涉及人工智能领域中的自然语言处理方向，所述方法包括：分别对两个待区分文本进行特征提取，得到每个待区分文本对应的文本特征信息，获取每个待区分文本对应的待区分文本图像，根据待区分文本图像中相邻像素之间的差异值，构建待区分文本图像对应的图像特征信息，将文本特征信息和图像特征信息进行融合，得到待区分文本的融合特征信息，基于待区分文本的融合特征信息，获取两个待区分文本之间的相似度。该方案可以通过提取出文本多个模态的特征，从而提升文本相似度获取的准确性。

文档处理方法和装置-202210344851.2
发明人：施登亮;郝嘉然;祝慧佳;刘思亮 -专利权人：支付宝（杭州）信息技术有限公司
申请日： 2022-04-02 - 公布日： 2022-07-29 - 主分类号： G06F16/30
摘要：本说明书实施例提供了一种文档处理方法及装置。该方法包括：从待处理的文档中提取出至少两个文本块；将每一个文本块作为一个节点，并得到每一个节点的至少一种特征；根据每一个节点的至少一种特征，得到该节点的初始表征向量；根据每一个节点的初始表征向量、该节点对应的文本块与其他各节点对应的文本块在待处理的文档中的位置关系，得到每一个节点的最终表征向量。本说明书实施例能够更为准确地得到表征文档中的信息的向量。

主数据映射处理方法、装置、计算机设备及存储介质-201911052600.1
发明人：龙乐乐 -专利权人：望海康信（北京）科技股份公司
申请日： 2019-10-31 - 公布日： 2022-07-05 - 主分类号： G06F16/30
摘要：本申请公开了一种主数据映射处理方法、装置、计算机设备及存储介质，包括，获取待映射的目标数据，其中，目标数据包括第一属性文件；计算第一属性文件与预设的参考数据的第二属性文件的第一相似度值，其中，第一属性文件设置有多个，第二属性文件也设置有多个，第一属性文件与第二属性文件一一映射，从而得到多个第一相似度值；根据多个第一相似度值生成表征目标数据与参考数据重合度的总相似度值；根据总相似度值对目标数据进行映射处理。本申请通过对不同的属性文件分别进行相似度计算，再计算总的相似度，使获得的总相似度值，使相似度计算更为客观，消除人为干扰，且映射方式更方便、快捷。

文本信息提取方法、装置、介质及电子设备-202210267699.2
发明人：刘婷婷;李子龙;章梦云 -专利权人：医渡云（北京）技术有限公司
申请日： 2018-11-09 - 公布日： 2022-06-14 - 主分类号： G06F16/30
摘要：本发明实施例提供了一种文本信息提取方法、装置、介质及电子设备，该方法包括：获取医疗数据平台中的源文本信息；获取用于标识所述源文本信息中的信息段落的特征标记，以供用户选择；根据用户选择的所述特征标记，从所述源文本信息中提取所述特征标记对应的所述信息段落，或者，提取所述特征标记中记录的信息段落；根据提取的所述信息段落再次提取源文本信息中待标记信息段落，以生成目标文本。本发明实施例的技术方案可以提高文本信息提取的效率。

一种基于用户评论与满意层面嵌入的商品推荐方法-202010046965.X
发明人：张星明;曹人华 -专利权人：华南理工大学
申请日： 2020-01-16 - 公布日： 2022-06-14 - 主分类号： G06F16/30
摘要：本发明公开了一种基于用户评论与满意层面嵌入的商品推荐方法，包括步骤：1)收集用户历史的评论评分行为，组成训练集；2)在训练中，预处理训练集中的每条评论，计算其语义向量；3)在训练中，利用步骤2)中的语义向量通过层面嵌入计算评价向量s；通过知识图谱的建模方法生成推断的评价向量结合s计算评价生成损失Lg；4)在训练中，利用回归模型以s为输入计算预测评分结合真实评分ru,i计算评分预测损失Lr，计算回归模型复杂度损失Lθ，组合Lr、Lθ与步骤3)的Lg计算整体损失L，利用L对模型进行训练；5)在测试中，利用回归模型以为输入计算预测评分根据生成推荐结果。本发明解决传统方法训练效率低下，模型的透明性、可解释性和准确性不足的问题。

一种数据中心非结构化数据接入方法-202210070479.0
发明人：马海鑫;张伟;谢虎;谢型浪;余杰文;宋学清;韩吉安 -专利权人：南方电网数字电网研究院有限公司
申请日： 2022-01-21 - 公布日： 2022-06-10 - 主分类号： G06F16/30
摘要：本发明公开了一种数据中心非结构化数据接入方法，包括以下步骤，通过控制模块向数据采集模块发出采集指令，数据采集模块采集的数据通过数据分析模块进行分析处理，通过数据质量检查校验模块对数据进行校验，本发明的有益效果是：本发明通过数据采集模块对数据进行采集处理，然后通过数据质量检查校验模块对数据进行校验处理，提高对数据的处理效率，通过设置数据转化模块和数据压缩模块进一步对数据进行处理，提高作业流程的稳定性，通过设置数据推送模块将实时接收到的数据，经处理后将数据直接推送至客户端，实现对数据实时更新，满足客户端对数据实时性的需求以及提高用户体验度、友好性。

文本信息提取方法、装置、介质及电子设备-201811331351.5
发明人：刘婷婷;李子龙;章梦云 -专利权人：医渡云（北京）技术有限公司
申请日： 2018-11-09 - 公布日： 2022-04-08 - 主分类号： G06F16/30
摘要：本发明实施例提供了一种文本信息提取方法、装置、介质及电子设备，该方法包括：获取医疗数据平台中的源文本信息；获取用于标识所述源文本信息中的信息段落的特征标记，以供用户选择；根据用户选择的所述特征标记从所述源文本信息中提取所述信息段落；根据提取的所述信息段落再次提取源文本信息中待标记信息段落，以生成目标文本。本发明实施例的技术方案可以提高文本信息提取的效率。

评论生成方法、装置、服务器及存储介质-201910536822.4
发明人：潘禄;陈玉光;彭卫华;罗雨;刘远圳;韩翠云;施茜;黄俊衡;李法远 -专利权人：北京百度网讯科技有限公司
申请日： 2019-06-20 - 公布日： 2022-04-01 - 主分类号： G06F16/30
摘要：本发明实施例公开了一种评论生成方法、装置、服务器及存储介质。该方法包括：从目标文章中提取至少一个目标关键词，并从预先构建的百科知识库中获取每个目标关键词的背景知识文本；将每个目标关键词转化为关键词向量；得到句子所属的背景知识文本的背景知识特征向量；获取目标文章的语义特征向量，并将语义特征向量、每个目标关键词的关键词向量及其背景知识特征向量进行拼接，输入评论生成模型生成目标文章的评论。本发明实施例通过在评论生成过程中融入关键词以及关键词的背景知识，并结合文章的语义特征通过评论生成模型生成评论，从而使生成的评论与文章具有更高的关联性，并提高了评论生成的泛化能力和准确性。

一种基于空洞卷积的自适应认知诊断测试设备及方法-202210170060.2
发明人：梁效宁;舒琴;刘娟;李建飞 -专利权人：四川科星引擎教育科技有限责任公司
申请日： 2022-02-24 - 公布日： 2022-03-25 - 主分类号： G06F16/30
摘要：本发明提供了一种基于空洞卷积的自适应认知诊断测试设备及方法，其测试设备包括测试台，通过测试台设置微控模块、登录系统和Redis存储系统；微控模块包括基于注意力机制的空洞卷积模块、多通道基于注意力机制的空洞卷积模块、注意力残差块、多通道特征提取模块，并设计基于注意力机制的空洞卷积神经网络。本发明使用了空洞卷积，从多种不同用户标签中提取单个测试试题的特征信息，利用注意力残差块提取试题库信息，充分利用单个测试试题特征信息之间的相关性，使得测试更加准确，此外，采用了Redis储存系统，利于数据长期存储、查看及维护。

基于RapidMiner的文本数据挖掘方法及系统-202110643096.3
发明人：刘欢庆;董春生;李婷婷 -专利权人：刘欢庆
申请日： 2021-06-09 - 公布日： 2021-08-10 - 主分类号： G06F16/30
摘要：本发明公开了基于RapidMiner的文本数据挖掘方法及系统，包括以下步骤：S1.根据挖掘目标建立一个RapidMiner挖掘流程，并将文本数据和分析目标之间建立矩阵，得到第一矩阵；S2.通过第一矩阵模型对每一个文本数据进行遍历，统计并分析每个文本数据中的分析目标；S3.当将整个文本库遍历完成后，得到第二矩阵；S4.将每个记录中不同字段的值转化为二值属性，得到第三矩阵；S5.根据第三矩阵，进行多种不同维度的挖掘分析。本发明提出的方法是Rapidminer工具在文本数据挖掘方面的创新使用，该方法只需要整理需要挖掘的文本数据，明确挖掘目标，就可以进行医疗、生活、办公等领域的文本挖掘，简单、高效、实用。

一种针对论坛文本的主题挖掘方法-201810418998.5
发明人：田贤忠;姚明超;顾思义 -专利权人：浙江工业大学
申请日： 2018-05-04 - 公布日： 2021-08-03 - 主分类号： G06F16/30
摘要：一种针对论坛文本的主题挖掘方法，所述方法包括以下步骤：步骤1：爬取论坛的数据，利用文本处理手段找出大概率可能是无意义的回复，并做好标记；步骤2：对论坛文本按照句子切割，之后进行分词，根据词性删除无用的词，去停用词；步骤3：对现有的文本根据BBS‑LDA主题模型使用Gibbs Sampling进行参数估计，最终得到属于每个主题可能性最大的词语。本发明对论坛的这些特点，基于LDA提出一种新的主题模型BBS‑LDA，更有效地挖掘论坛文本中的主题，以提高论坛文本主题挖掘的能力。

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于基于语义关系来将自由文本临床文档建模为层次图状数据结构的系统和方法有效

专利文献下载