[发明专利]图文匹配方法、装置及存储介质有效

专利信息
申请号: 201910228456.6 申请日: 2019-03-25
公开(公告)号: CN109933802B 公开(公告)日: 2023-05-26
发明(设计)人: 杨皓;卢菁;李彪;王亚雄 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F40/205 分类号: G06F40/205;G06F40/284;G06F16/53
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 王仲凯
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请实施例提供一种图文匹配方法、装置及存储介质,本申请可以线下训练好用来估计图片与文本信息相关度的图文匹配预估模型,该图文匹配预估模型能够建立文本与图片之间更加可靠的关联,这样,在需要线上为某文章配图的情况下,可以向服务器上传相应的待配图文本,以使服务器先从图库中筛选与待配图文本关联的多个候选图片,之后,再利用该图文匹配模型,从这多个候选图片中,精确选择与待配图文本相关度较高的第一数量个候选图片,并反馈至客户端进行展示,此时,用户只需要从服务器反馈的有限个与待发布文章相关度较高的候选图片中,选择所需图片即可,不需要从大量图片中进行选择,极大减小了配图工作量,且提高了图文匹配正确率。
搜索关键词: 图文 匹配 方法 装置 存储 介质
【主权项】:
1.一种图文匹配方法,其特征在于,所述方法包括:获取客户端发送的待配图文本;筛选与所述待配图文本关联的多个候选图片;将所述多个候选图片及所述待配图文本输入图文匹配模型,得到相应候选图片与所述待配图文本的相关度,所述图文匹配模型是依据注意力机制及三元组损失函数,利用样本图片中物体区域的视觉特征和位置特征,以及样本文件的单词特征和/或文本特征,进行深度学习网络训练得到的;将相关度较大的第一数量个候选图片反馈至所述客户端进行展示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910228456.6/,转载请声明来源钻瓜专利网。

同类专利
  • 一种确定特定词的数据处理系统-202310943695.6
  • 王姣平;郭云祺;董霖;孙勇韬 - 杭州云深科技有限公司
  • 2023-07-28 - 2023-10-27 - G06F40/205
  • 本发明涉及一种确定特定词的数据处理系统,系统包括:初始文本集、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取候选文本集,根据候选文本集,获取关键词集,根据初始文本集,获取初始词集,根据关键词集和初始词集,获取候文本集对应的目标词,获取中间文本集,根据中间文本集,获取中间文本集对应的中间词集,根据目标词集和中间词集,确定目标词集中的特定词,本发明,能够遍历文本中全部的词,使得获取到的新词足够全面,同时,文本来源未局限于同一文本数据库,能与其它文本数据库进行对比,使得获取到的特定词的准确度较高。
  • 交互信息生成方法、装置及存储介质-202310581569.0
  • 胡瑞珍;苏泽嘉;樊庆楠;陈学霖;黄惠 - 深圳市腾讯计算机系统有限公司
  • 2023-05-22 - 2023-10-27 - G06F40/205
  • 本公开的实施例提供了一种交互信息生成方法、装置和存储介质,所述方法包括:获取当前交互场景的场景图、连续的多个交互场景的整体文本描述、以及历史交互信息;基于场景图,获取场景图特征,其中,场景图中包括多个对象,场景图特征包括多个对象的对象特征;基于整体文本描述和历史交互信息,获取第一描述特征;基于历史交互信息生成历史交互信息文本描述,并基于整体文本描述和历史交互信息文本描述获取第二描述特征;以及基于对象特征、第一描述特征和第二描述特征来预测用于下一交互场景的交互信息。通过本公开的方法能够生成合理性和可执行性都较高的交互信息。
  • 文本标准化方法、装置、电子设备及存储介质-202211432895.7
  • 林镇溪;张子恒;吴贤 - 腾讯科技(深圳)有限公司
  • 2022-11-16 - 2023-10-27 - G06F40/205
  • 本申请涉及计算机技术领域,提供一种文本标准化方法、装置、电子设备及存储介质,用以提升文本标准化质量,可用于智慧医疗。该方法包括:选取出原始文本对应的多个候选标准文本;针对每个文本,将该文本包含的各名词作为节点,按照各名词间的逻辑层级结构连接各节点,生成目标术语运算树;在预设类型的节点位置处添加相应的标识符,将目标术语运算树转换为目标字符序列;基于各目标字符序列计算文本相似度,选取出一个目标标准文本。由于目标术语运算树保留了各名词间的逻辑层级结构和关联关系,丰富了文本涵盖的知识,从而提高文本标准化质量,且目标字符序列不仅保留了目标术语运算树的图结构,且能够提取丰富的特征,进一步提升标准化质量。
  • 一种基于人工智能的报告单自动判读分析系统及方法-202310793559.3
  • 高应山 - 无锡丰瑞软件开发有限公司
  • 2023-06-30 - 2023-10-27 - G06F40/205
  • 本发明公开了一种基于人工智能的报告单自动判读分析系统及方法,属于信息分析技术领域。本发明包括:S10:对检测物的检测目的进行确定,根据确定的检测目的对检测项目的指示类型、指示标准进行配置,以及对配置报告单判读规则的依赖项进行确定;S20:根据各检测项目对应的检测值,以及S10中确定的依赖项的实际取值,对检测项目进行自动匹配组合,根据自动匹配结果对报告单的检测结果进行预判;S30:根据S20中预判的报告单的检测结果对报告单的指示内容进行确定,以及对指示标注和指标说明信息进行确定。本发明保证就检者能够自主理解报告单的检测结果,且在检测结果较为正常的情况下,就检者能够通过报告单中记载的生活环境信息,进行自我身体调节。
  • 结构化查询语言数据的解析方法、装置和电子设备-202210371577.8
  • 贺斌;任启强;姚利 - 北京百度网讯科技有限公司
  • 2022-04-08 - 2023-10-27 - G06F40/205
  • 本公开提供了一种结构化查询语言数据的解析方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及大数据、数据治理和数据血缘分析等技术领域,可应用于云计算场景下。具体实现方案为:对结构化查询语言数据进行解析,得到抽象语法树;根据抽象语法树,确定表信息和字段信息;根据表信息和字段信息,确定原始血缘树;以及根据元数据,对原始血缘树进行扩展,得到目标血缘树,作为解析结果。
  • 文本处理方法、装置、计算机设备和存储介质-202010156931.6
  • 缪畅宇 - 腾讯科技(深圳)有限公司
  • 2020-03-09 - 2023-10-27 - G06F40/205
  • 本申请涉及一种文本处理方法、装置、计算机设备和存储介质。所述方法包括:获取包括至少两个文本分词的原始文本;基于各个所述文本分词在所述原始文本中的上下文信息,确定各个所述文本分词对应的编辑方式;根据各个所述文本分词对应的编辑方式,对所述原始文本进行过滤,得到包括至少两个待改写文本分词的精简文本;根据各个所述待改写文本分词在所述精简文本中的上下文信息,确定各个所述待改写文本分词对应的目标文本分词;根据各个所述待改写文本分词对应的编辑方式和各个所述待改写文本分词对应的目标文本分词,对所述精简文本进行编辑操作,得到改写后文本。本方法涉及人工智能技术领域,采用本方案能够提高文本处理过程中的处理效率。
  • 一种信息处理方法及装置、存储介质及电子设备-202210369363.7
  • 袁润红 - 北京京东振世信息技术有限公司
  • 2022-04-08 - 2023-10-24 - G06F40/205
  • 本公开提供了一种信息处理方法、装置、电子设备及存储介质,涉及计算机技术领域。该方法包括:利用语义识别算法对待处理文本信息进行解析,提取出待处理文本信息对应的目标特征;基于特征与行为之间的关联关系,根据目标特征,预测与待处理文本信息相关的目标行为,进而定位到目标行为对应的目标数据库;在目标行为对应的目标数据库中,对待处理文本信息进行搜索查询,获得查询结果;根据查询结果,获取待处理文本信息中包含的目标文本信息,对目标文本信息进行处理。该方法可以预测出与待处理文本信息相关的目标行为,进而在目标行为对应的目标数据库中进行搜索查询,能够缩小数据库的查询范围,快速准确查询出目标文本信息。
  • 文本召回方法、装置、计算机设备及存储介质-202310707098.3
  • 李志韬;叶童;王健宗;程宁 - 平安科技(深圳)有限公司
  • 2023-06-15 - 2023-10-24 - G06F40/205
  • 本发明公开一种文本召回方法,该方法:通过改写模块对初始文本和完整文本进行特征编码,得到初始向量和完整向量;通过召回模块对初始向量和完整向量进行文本召回,得到第一召回文本和第二召回文本;对第一召回文本和第二召回文本进行特征编码,得到第一向量和第二向量;根据初始向量、完整向量、第一向量和第二向量,确定预测损失值;达到预设收敛条件时,记录为文本召回模型;通过文本召回模型对待召回文本进行文本召回,得到文本召回结果。本发明通过端到端的建模方式,实现了将改写阶段的信息传到召回阶段,避免了关键信息的丢失。通过在隐空间下学习完整的话语,使得金融等领域中文本生成的语义更加完整,提升了金融等领域中文本召回精度。
  • 一种数据抽取方法及装置-202210331529.6
  • 周煜桦 - 北京国双科技有限公司
  • 2022-03-31 - 2023-10-24 - G06F40/205
  • 本发明公开了一种数据抽取方法及装置,包括:对待处理的目标PDF文件进行字符解析,获得字符信息;基于所述字符信息,对所述目标PDF文件进行段落识别,获得段落信息;基于所述段落信息,对所述目标PDF文件中的段落进行元数据抽取,获得目标元数据信息。本发明基于字符信息还原了PDF文件的段落分布,然后实现了对元数据的抽取,能够有效处理不同格式的PDF文献,无需制定复杂的提取规则,提升了元数据抽取的效率和准确性。
  • 生成式模型解码方法、装置、设备及介质-202310760749.5
  • 谯轶轩 - 平安科技(深圳)有限公司
  • 2023-06-26 - 2023-10-20 - G06F40/205
  • 本发明涉及人工智能及医疗健康技术领域,公开了一种生成式模型解码方法、装置、设备及介质,该方法包括:获取待识别的目标语句与生成式语言模型所含的解码模型;将字符序列输入到解码模型,根据解码模型的网络结构从头至尾依次对网络层进行计算,确定至少一部分网络层的置信度;若检测到当前任一网络层的置信度大于预设置信度,则终止计算相对当前任一网络层的下一网络层的置信度,并将当前网络层的置信度作为字符的预测值,直至确定字符序列所有字符的预测值;依据字符序列将各字符所对应的预测值进行组合,确定解码结果,避免解码模型只能在最后一个网络层预测输出,通过跳过后续网络层的计算过程,大幅度地降低了计算时间,提高了解码效率。
  • 一种基于自然语言处理的评论分析报告生成方法-202311170693.4
  • 张健 - 深圳联友科技有限公司
  • 2023-09-12 - 2023-10-20 - G06F40/205
  • 本发明公开了一种基于自然语言处理的评论分析报告生成方法,从宏观层面入手,挖掘关键评论话题,汇总关键话题、话题热度和话题情感值等数据形成关于评论集的话题清单;从微观层面,挖掘细分需求项,汇总需求关注度、需求满意度、需求分类、需求相关建议等数据形成关于评论集的需求分析清单;将模型、质量屋与文本挖掘有机结合起来,首先基于文本挖掘计算各个需求项在模型两个维度(用户关注度与用户满意度)上的数值,进而完成需求项的分类;然后基于需求项的分类、需求项的关注度、需求项的满意度,综合计算需求项在质量屋中的权重,并结合专家打分完成质量屋的构建;合并话题清单、需求分析清单与质量功能展开图生成评论分析报告。
  • 数据生成方法、装置、电子设备及存储介质-202310956207.5
  • 郭宁;王浩;孙奇;李昕 - 北京高德云信科技有限公司
  • 2023-08-01 - 2023-10-20 - G06F40/205
  • 本公开实施例公开了一种数据生成方法、装置、电子设备及存储介质,该方法包括:获取任务数据,所述任务数据包括已有数据和缺失数据类型;使用预先训练好的第一大规模语言模型,根据所述任务数据,生成数据生成思维链,所述数据生成思维链用于描述基于所述已有数据生成所述缺失数据类型对应的缺失数据的处理链路;使用预先训练好的第二大规模语言模型,根据所述数据生成思维链从所述已有数据中提取关键数据;使用预先训练好的第三大规模语言模型,根据所述关键数据和所述数据生成思维链生成所述缺失数据。该技术方案可以快速、高质量和准确地生成数据。
  • 基于多个机器学习模型的自然语言处理方法、装置和设备-202011182212.8
  • 骆加维;吴信朝;周宸;周宝;陈远旭 - 平安科技(深圳)有限公司
  • 2020-10-29 - 2023-10-20 - G06F40/205
  • 本申请涉及人工智能领域,揭示了一种基于多个机器学习模型的自然语言处理方法、装置和设备,其中方法包括:将待识别的文本数据输入到多个不同的词向量训练机器学习模型,得到基于每个词的多个相互独立的词向量训练结果;基于每个词的多个训练结果,计算每个词的词向量的中心向量和偏正向量;根据每个词对应的所述中心向量和所述偏正向量,计算得到每个词的纠偏词向量;基于每个词的纠偏词向量进行自然语言处理任务。本申请的基于多个机器学习模型的自然语言处理方法、装置和设备,通过定义中心向量和偏正向量,得到偏差纠正的纠偏词向量,然后利用所述纠偏词向量进行NLP任务,可以降低机器学习模型发生偏差决策的概率,减少AI决策偏见。
  • 一种基于计算机视觉的可拓展文档内容结构化方法及系统-202310944218.1
  • 李迪;邱娟;李莉华;孟兆海;张贵发;孙建中;曲佳博 - 赛飞特工程技术集团有限公司
  • 2023-07-28 - 2023-10-17 - G06F40/205
  • 本发明涉及一种基于计算机视觉的可拓展文档内容结构化方法及系统,该方法包括以下步骤:定义通用型层级文档结构、通用文档元素和专用文档元素,构建通用型文档结构识别模型;获取训练组文档的图像序列,对训练组文档的图像序列进行预标注,构建专用文档结构识别数据集,对通用型文档结构识别模型进行数据训练形成专用型文档识别模型;获取结构化图像序列;使用专用型文档识别模型识别待结构化图像序列,将待结构化图像序列转化为结构化文档信息并输出。本发明所提供文档内容结构化方法具有拓展性,能够适应不同类型文档的结构化解析需求,将非结构化数据分层转化为能够直接被业务应用处理的结构化数据,提升数据采集效率。
  • 基于大数据的计算机数据挖掘方法-202310113188.X
  • 尹大伟;杨霞 - 莱芜职业技术学院
  • 2023-02-15 - 2023-10-17 - G06F40/205
  • 本发明涉及一种基于大数据的计算机数据挖掘方法,涉及数据挖掘技术领域。包括以下步骤:获取描述产品的文本信息;根据文本信息提取产品的多个属性;通过计算机获取描述该产品的待挖掘文本信息,形成待挖掘大数据;获取每个属性的依赖度;对每个属性的依赖度进行归一化获取归一化后的依赖度;获取每个属性的加权信息熵增益值;根据每个属性的加权信息熵增益值构建产品属性的决策树,根据决策树对待挖掘大数据进行提纯。本发明通过产品的属性以及收集到的对待挖掘大数据,利用加权信息熵增益值对待挖掘大数据进行提纯,再通过提纯后数据匹配来实现产品营销数据挖掘的精准化。
  • 事件处理方法、装置及设备、存储介质-202310876813.6
  • 请求不公布姓名 - 摩尔线程智能科技(北京)有限责任公司
  • 2023-07-17 - 2023-10-13 - G06F40/205
  • 本公开实施例提供了一种事件处理方法、装置及设备、存储介质,其中,所述方法包括:获取事件列表;该事件列表通过对文本语料进行事件抽取得到,包括至少一个事件;针对至少一个事件对,对该事件对进行顺承关系分类,得到该事件对中两个事件之间的顺承关系类别;事件对由事件列表中两个不同的事件构成;基于至少一个事件对分别对应的顺承关系类别,对事件列表中的各事件进行排序,得到排序后的事件列表。根据本公开实施例,能够对从文本语料中抽取的事件自动进行排序、减少对人工的依赖,并能提高事件排序的准确性。
  • 项目制品依赖关系的展示方法及装置-202310789596.7
  • 肖鹏 - 奇安信科技集团股份有限公司
  • 2023-06-29 - 2023-10-13 - G06F40/205
  • 本申请公开一种项目制品依赖关系的展示方法及装置,涉及计算机技术领域。本申请的方法包括:从项目编译流水线中获取项目文本,其中,所述项目文本用于表征在进行项目编译时所需的项目制品,以及每个所述项目制品关联的其他项目制品;将所述项目文本进行解析,并基于每个所述项目制品及其关联的其他项目制品,构建项目依赖关系;对所述项目制品对应的项目依赖关系执行输出操作,所述输出操作用于按照所述项目依赖关系对所述项目制品以及关联的其他项目制品进行展示。
  • 一种观点提取方法、装置及终端设备-202310687196.5
  • 许先才;肖荣昌;张家栋;熊磊 - 深圳市云积分科技有限公司
  • 2023-06-09 - 2023-10-13 - G06F40/205
  • 本申请适用于神经网络模型技术领域,提供了一种观点提取方法、装置及终端设备,方法包括:获取与目标工作模式相对应的待处理数据,根据待处理数据确定对应的训练样本数据集,将待处理数据和训练样本数据集输入至预训练的语言生成模型中处理,得到响应结果,对响应结果进行转换处理,得到待处理数据的观点提取结果。本申请通过获取与工作模式相对的待处理数据并确定对应的训练样本数据集,将待处理数据和训练样本数据集输入至预训练的语言生成模型中处理,实现根据预训练语言生成模型基于少量的训练样本数据集,来简单、快速、高效得到高精度的待处理数据的四元组观点提取结果。
  • 基于语言模型的百科内容管理方法及装置-202310685088.4
  • 胡云齐;李鉴庭 - 深圳派氪司科技有限公司
  • 2023-06-09 - 2023-10-13 - G06F40/205
  • 本申请提供一种基于语言模型的百科内容管理方法及装置,其特征在于,所述方法包括:从企业内部系统获取第一内容集合,所述第一内容集合包括至少一个百科内容,对所述第一内容集合进行预处理,得到第二内容集合,基于所述第二内容集合,对第一语言模型进行训练,得到第二语言模型,基于第二语言模型向第一用户展示第三内容集合,所述第三内容集合包括至少一个百科内容,所述第一用户为所述企业内部系统的任一用户。本申请提供的技术方案可以降低百科系统创建和维护的成本,提升用户的使用体验。
  • 基于虚拟对抗的地址相关性判断方法、装置、设备及介质-202310579841.1
  • 邹游 - 重庆特斯联启智科技有限公司
  • 2023-05-22 - 2023-10-10 - G06F40/205
  • 本发明涉及人工智能技术领域,公开了一种基于虚拟对抗的地址相关性判断方法、装置、设备及介质,包括:获取训练文本数据,对训练文本数据中各个字对应的字向量并正则化处理,得到正则文本向量;将正则文本向量输入至地址相关性判断模型,对地址相关性判断模型进行无监督训练,得到文本数据的隐含特征向量;使用训练文本数据数据对全连接神经网络进行虚拟对抗预训练;使用训练文本数据数据对全连接神经网络进行虚拟对抗微调训练,生成用于文本分类的神经网络模型。在地址相关性任务中,大大提高模型的鲁棒性与泛化能力。
  • 事件抽取模型的训练方法、抽取方法、装置、设备及介质-202310841713.X
  • 姚顺雨 - 中国电信股份有限公司技术创新中心;中国电信股份有限公司
  • 2023-07-10 - 2023-10-10 - G06F40/205
  • 本公开涉及一种事件抽取模型的训练方法、事件抽取方法、装置、电子设备及计算机可读介质,属于自然语言处理技术领域。该事件抽取模型的训练方法包括:从训练样本文档中获取训练数据,包括每个事件中的触发词和论元以及无关实体;将训练数据输入语言模型中得到触发词向量、论元向量和无关实体向量;基于同一事件中的触发词向量和论元向量得到正样本对,基于无关实体向量以及不同事件中的触发词向量和论元向量得到负样本对;将正负样本对的样本相似度与样本标签进行对比,计算模型损失;根据模型损失对模型进行训练得到预训练语言模型,基于预训练语言模型进一步得到事件抽取模型。本公开通过计算正负样本对的相似度,可以提高事件抽取模型的性能。
  • 一种会计凭证模板的表达式解析方法、设备及介质-202310896588.2
  • 赵民;潘鲁川 - 浪潮通用软件有限公司
  • 2023-07-20 - 2023-10-03 - G06F40/205
  • 本申请公开了一种会计凭证模板的表达式解析方法、设备及介质,用以解决现有的会计凭证模板无法实现对多种复杂的解析式进行解析,会计凭证模板的使用率较低,对复杂表达式进行解析的准确性较低的技术问题。方法包括:确定业务数据源以及业务需求,通过业务数据源确定对应的业务单据,并根据业务需求配置对应的会计凭证模板;在会计凭证模板中配置业务场景对应的待解析表达式,并根据待解析表达式的表达式类型,确定待解析表达式对应的解析方式;根据对应的解析方式,对待解析表达式进行解析,根据解析结果并按照会计凭证模板,生成业务单据对应的会计凭证。通过上述方法能够提高会计凭证模板的通用性,提升会计凭证模板的使用频率。
  • 文本特征的解码方法和装置、存储介质及电子设备-202311103289.5
  • 杨韬 - 腾讯科技(深圳)有限公司
  • 2023-08-30 - 2023-10-03 - G06F40/205
  • 本公开提供了一种文本特征的解码方法和装置、存储介质及电子设备。其中,该方法包括:获取文本特征解码模型中第i‑1层特征解码层输出的文本特征;获取与第i层特征解码层对应的k个全局特征向量,k个全局特征向量用于表征文本特征中的字符向量之间关联关系;依次获取文本特征中的每一个字符向量与k个全局特征向量中的每一个全局特征向量的向量相似度,并基于对应于同一个字符向量的k个向量相似度将每一个字符向量依次更新为参考字符向量;将参考字符向量拼接得到的参考字符向量序列确定为解码得到的目标文本特征。本公开解决了文本特征解码效率低的技术问题。
  • 文本向量生成方法及设备-202210267855.5
  • 费志辉;陈超群;万明阳;马国俊 - 北京字跳网络技术有限公司
  • 2022-03-17 - 2023-09-29 - G06F40/205
  • 本公开提供一种文本向量生成方法及设备,涉及计算机处理技术领域。该方法包括:从目标文本中提取关键词;根据两个关键词之间的相似度,确定两个关键词对应的权重,权重与对应的相似度负相关;根据权重和关键词的第一向量确定关键词的第二向量,第一向量用于表示关键词的语义信息;根据各关键词的第二向量生成目标文本的向量。本公开可以通过目标文本的关键词生成目标文本的向量,使目标文本的向量去除了目标文本中的冗余信息。在对同一信息进行描述时,即使整个语句的描述方式有差异,但是关键词的差异较小。从而对不同渠道通过不同描述方式表述的语义接近的目标文本,通过关键词生成的向量也接近,从而可以提高目标文本的向量准确度。
  • 广播剧信息处理方法、装置、电子设备和计算机可读介质-202311085372.4
  • 钱达;董建丰;刘恩玉;李婷 - 深圳有咖互动科技有限公司
  • 2023-08-28 - 2023-09-29 - G06F40/205
  • 本公开的实施例公开了广播剧信息处理方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:响应于检测到终端设备发送的广播剧项目发布请求,对广播剧项目发布请求进行解析,得到广播剧项目信息;响应于确定发布用户信息满足预设发布条件,对广播剧项目发布请求进行审核处理,得到审核结果;响应于确定审核结果满足预设通过条件,对广播剧项目发布请求对应的广播剧项目进行发布处理;响应于确定审核结果不满足预设通过条件,生成广播剧项目修改信息;将广播剧项目修改信息发送至终端设备。该实施方式可以使得发布用户针对一项广播剧制作任务发布招募信息,同时可以对广播剧招募信息进行自动审核。
  • 针对领域特定的小语料库生成可解释嵌入的系统和方法-202310312433.X
  • G·里沙巴 - 罗伯特·博世有限公司;罗伯特·博世工程和商业方案私人有限公司
  • 2023-03-27 - 2023-09-29 - G06F40/205
  • 针对领域特定的小语料库生成可解释嵌入的系统和方法。描述了用于针对基于文本的文档的领域特定的小语料库生成可解释和嵌入的方法(200)和系统(100)。处理模块(102)可以获得多个基于文本的文档,并且执行对多个基于文本的文档中的每一个的基本清理。此外,语义注入模块(104)可以使用语义注入技术来生成语义注入的语料库。嵌入生成模块(106)被配置成使用word2vec技术来计算注入语料库的最优维数d并且生成注入的最优维度嵌入EInfOPT。此外,嵌入生成模块106被配置成生成基线最优维度嵌入EOPT,该基线最优维度嵌入EOPT可以用于在可解释性和下游分类任务性能方面评估ESEMIE
  • 基于对比学习的汉-老、泰平行句对抽取方法及装置-202311113316.7
  • 毛存礼;张思琦;高盛祥;黄于欣;王振晗;沈政 - 小语智能信息科技(云南)有限公司
  • 2023-08-31 - 2023-09-29 - G06F40/205
  • 本发明涉及基于对比学习的汉‑老、泰平行句对抽取方法及装置,属自然语言处理领域。汉‑泰和汉‑老平行句对数据稀缺,从可比语料中抽取平行句对是提升低资源神经机器翻译质量的有效手段。针对现有的平行句对抽取方法应用到汉‑泰、汉‑老上时,泰语和老挝语训练数据稀缺导致模型对泰语和老挝语的表征能力弱、抽取效果不好的问题,本发明方法包括文本数据预处理、训练基于对比学习的汉语‑老挝语、泰语平行句对抽取模型、进行汉语‑老挝语、泰语平行句对抽取三部分。根据这三个功能模块化制成基于对比学习的平行句对抽取装置,从汉语‑泰语及汉语‑老挝语可比语料中抽取平行句对,本发明有效提升了汉‑泰和汉‑老平行句对抽取效果。
  • 日志解析方法及装置、设备、存储介质-202210878029.4
  • 刘维友 - 中移(苏州)软件技术有限公司;中国移动通信集团有限公司
  • 2022-07-25 - 2023-09-29 - G06F40/205
  • 本申请公开了日志解析方法及装置、设备、存储介质;其中,所述方法包括:将待解析的第一日志中的变量进行标识符替换,得到第二日志;其中,变量包括语义变量和/或非语义变量;不同的语义变量对应的第一标识符不同,不同的非语义变量对应的第二标识符相同;从预先构建的第一日志模板库中查找与第二日志相匹配的目标日志模板;其中,所述第一日志模板库是通过对第二日志模板库进行去重处理后得到的,所述第二日志模板库包括至少一条第二日志模板,所述第二日志模板是通过对第三日志中的变量进行所述标识符替换得到的;根据所述目标日志模板,确定所述第一日志的解析结果;如此,减少了第二日志需要进行匹配的日志模板数量,提高了日志解析速度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top