[发明专利]标题生成方法、装置、电子设备和存储介质有效

申请号：	202110114237.2	申请日：	2021-01-27
公开（公告）号：	CN112818984B	公开（公告）日：	2023-10-24
发明（设计）人：	姚晓宇;李海;谭颖	申请（专利权）人：	北京奇艺世纪科技有限公司
主分类号：	G06V20/30	分类号：	G06V20/30;G06V20/40;G06F40/30;G06F40/253
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	吕俊秀
地址：	100080 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种标题生成方法、装置、电子设备和存储介质，所述方法包括：获取目标视频，从所述目标视频的多个图像帧中，分别检测具有标题特性的区域，得到区域位置，根据所述多个图像帧对应的所述区域位置，确定标题候选区域在图像帧中的位置，对所述多个图像帧中的所述标题候选区域进行文本识别，得到所述目标视频的目标标题，使得根据目标视频的多个图像帧，分析得到视频的标题可能出现的标题候选区域，排除了视频中众多的混淆信息，提高了标题确定时的准确性，然后对标题候选区域进行文本识别，从而自动生成目标视频的目标标题，降低了生成标题时的人工干预程度，提高了为视频生成标题的效率。
搜索关键词：	标题生成方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司，未经北京奇艺世纪科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202110114237.2/，转载请声明来源钻瓜专利网。

同类专利

一种图像处理方法、装置、电子设备及存储介质-202110720175.X
发明人：尹天舒 -专利权人：北京奇艺世纪科技有限公司
申请日： 2021-06-28 - 公布日： 2023-10-27 - 主分类号： G06V20/30
摘要：本发明实施例提供了一种图像处理方法、装置、电子设备及存储介质，通过确定待处理图像中各文本内容各自对应的文本框，文本框为文本内容的最小外接矩形。基于各文本框各自对应的正外接矩形，从各文本框中确定目标文本框组，目标文本框组中包括至少两个待处理文本框，目标文本框中的任意相邻的两个文本框的正外接矩形之间的重叠度大于预设阈值，对目标文本框组中的待处理文本框进行截断处理，得到待处理图像中的文本识别区域。基于上述处理，可以在一定程度上提高提取到的文本框的图像特征信息的准确度。后续，基于各文本框的图像特征信息对文本检测模型进行训练，可以提高文本检测模型的检测精确度。

标题生成方法、装置、电子设备和存储介质-202110114237.2
发明人：姚晓宇;李海;谭颖 -专利权人：北京奇艺世纪科技有限公司
申请日： 2021-01-27 - 公布日： 2023-10-24 - 主分类号： G06V20/30
摘要：本发明公开了一种标题生成方法、装置、电子设备和存储介质，所述方法包括：获取目标视频，从所述目标视频的多个图像帧中，分别检测具有标题特性的区域，得到区域位置，根据所述多个图像帧对应的所述区域位置，确定标题候选区域在图像帧中的位置，对所述多个图像帧中的所述标题候选区域进行文本识别，得到所述目标视频的目标标题，使得根据目标视频的多个图像帧，分析得到视频的标题可能出现的标题候选区域，排除了视频中众多的混淆信息，提高了标题确定时的准确性，然后对标题候选区域进行文本识别，从而自动生成目标视频的目标标题，降低了生成标题时的人工干预程度，提高了为视频生成标题的效率。

一种对页面前端进行数据采集的方法、装置及电子设备-202310787638.3
发明人：刘宇明 -专利权人：平安银行股份有限公司
申请日： 2023-06-28 - 公布日： 2023-09-29 - 主分类号： G06V20/30
摘要：本发明公开了一种对页面前端进行数据采集的方法、装置及电子设备，方法包括：获取页面前端图像；基于深度学习算法对页面前端图像的样式进行识别，得到页面前端样式；基于页面前端样式对数据进行采集，根据采集的数据，生成数据采集需求列表。本发明实施例能够降低数据采集需求产出的难度，用户只需要上传前端页面设计稿即可完成数据采集需求的识别；通过自动化识别需求模板，减少不同用户因理解差异产生的个性化配置，保证平台需求统一、规范；可以识别从未见过的前端样式，提升因页面设计个性化的识别率，减少人工的配置操作。

检测水印的方法、装置、终端及存储介质-201911365673.6
发明人：孙莹莹 -专利权人： OPPO广东移动通信有限公司
申请日： 2019-12-26 - 公布日： 2023-08-25 - 主分类号： G06V20/30
摘要：本申请实施例公开了一种检测水印的方法、装置、终端及存储介质，属于图像处理技术领域，本申请实施例提供的检测水印的方法能够提取目标图片的第一特征图，通过空洞卷积层得到感受野大于第一特征图的第二特征图，再根据第二特征图确定目标图片中是否存在水印区域，当目标图片中存在水印区域时，本申请实施例能够确定目标图片中的水印区域。由于本申请能够从目标图片中的提取高级语义信息时平衡特征图的分辨率和感受野，在同样分辨率的目标图片下能获得较高的感受野，提高了确定水印位置的速度和准确度。

基于深度学习的OCR图像文字识别与段落输出方法-202110884424.9
发明人：卢红波 -专利权人：全知科技（杭州）有限责任公司
申请日： 2021-08-03 - 公布日： 2023-08-22 - 主分类号： G06V20/30
摘要：本发明公开了基于深度学习的OCR图像文字识别与段落输出方法，具体涉及OCR文字识别领域，具体操作步骤如下：S1、读入图像：将待识别的图像上传/导入，得到可编辑图像；S2、图像预处理：将步骤S1中得到的可编辑图像进行编辑，调整该图像到指定大小；S3、加载CTPN预训练模型：加载CTPN模型，先通过VGG16提取图像中的局部图像特征，再使用BLSTM提取上下文特征，然后用全连接层和多预测分支得到坐标值和概率值，最后合并字符为文本检测框。本发明在深度学习检测模型CTPN的基础上，对复杂图像进行分栏分段识别；在复杂的多栏场景下对图像中的文字进行识别并段落输出，根本上解决已有OCR识别中的结果杂糅问题，大大提升结果的可读性。

基于边界预测的多方向文本区域检测方法和装置-202011295447.8
发明人：刘超;喻民;梁小霞;姜建国;刘超超;黄伟庆 -专利权人：中国科学院信息工程研究所
申请日： 2020-11-18 - 公布日： 2023-08-04 - 主分类号： G06V20/30
摘要：本发明实施例提供一种基于边界预测的多方向文本区域检测方法和装置，该方法包括：确定待测图像；将待测图像输入检测模型，输出文本分数图、上边界分数图、下边界分数图、左边界分数图和右边界分数图；其中，检测模型是基于样本文本图像和对应的文本区域标注框标签、上边界标注框标签、下边界标注框标签、左边界标注框标签和右边界标注框标签进行训练得到的；基于预设的文本分数阈值、上边界分数阈值、下边界分数阈值、左边界分数阈值、右边界分数阈值、所述文本分数图、上边界分数图、下边界分数图、左边界分数图和右边界分数图确定文本区域。本发明实施例提供的方法和装置，实现了多方向的文本区域检测和分离近距离的文本区域。

5G富媒体信息的图片审查系统、方法、电子设备及介质-202310437410.1
发明人：沈浩;黄海量;吴东进;韩松乔;吴优 -专利权人：上海帜讯信息技术股份有限公司
申请日： 2023-04-23 - 公布日： 2023-07-25 - 主分类号： G06V20/30
摘要：本发明实施例公开了一种5G富媒体信息的图片审查系统、方法、电子设备及介质，包括：构建图片消息信息集合Z；将图片消息信息集合Z中的图片依次输入图片分类模型判断图片是否合规；基于图片特征提取模型对图片消息信息集合Z中的敏感图片进行纹理特征提取、边缘特征提取以及SIFT特征提取得到三种不同特征提取集合，将三种不同特征提取集合进行融合得到图片中疑似敏感特征的图片区域；将图片中疑似敏感特征的图片区域输入图片分类模型判断图片是否合规。该5G富媒体信息的图片审查方法解决现有技术中使用图片分类模型对不合规图片进行筛查，只能针对图片整体合规性进行审查，无法针对图片内特定元素进行审查的问题。

面向目标检测任务的数据处理方法和数据处理装置-202111663277.9
发明人：彭翼;王峥 -专利权人：中国科学院深圳先进技术研究院
申请日： 2021-12-31 - 公布日： 2023-07-14 - 主分类号： G06V20/30
摘要：本申请提供了一种面向目标检测任务的数据处理方法和面向目标检测任务的数据处理装置、计算机存储介质。该面向目标检测任务的数据处理方法包括：实时读取待处理数据；按照待处理数据的读取顺序获取若干组数据集，其中，数据集中包括第一预设数量的第一数据子集和第二预设数量的第二数据子集；将第二数据子集输入选择模块，以获取第二数据子集中的满足预设条件的选择数据；将第一数据子集输入算框模块进行整理，以及基于选择数据确定整理后的第一数据子集是否需要进行预设处理。通过上述方式，本申请的面向目标检测任务的数据处理方法通过数据分发机制实现数据的快速处理，降低了处理成本的功耗，提高了数据处理效率。

数据集拆分方法和数据集拆分装置-202111673444.8
发明人：冯小雪;韩锋;涂威威 -专利权人：第四范式（北京）技术有限公司
申请日： 2021-12-31 - 公布日： 2023-07-14 - 主分类号： G06V20/30
摘要：提供一种数据集拆分方法和数据集拆分装置。数据集拆分方法包括：获取图像数据集；确定所述图像数据集中的至少一个对象类别；基于所述图像数据集中的所述至少一个对象类别中的每个对象类别的分布情况，将所述图像数据集拆分为N个子数据集，其中，N为大于1的整数。

评论数据处理方法、装置、电子设备及存储介质-202310450051.3
发明人：吴小强 -专利权人：北京达佳互联信息技术有限公司
申请日： 2023-04-24 - 公布日： 2023-07-11 - 主分类号： G06V20/30
摘要：本公开实施例提供一种评论数据处理方法、装置、电子设备及存储介质。该方法包括：获取待处理的评论数据集合，其中所述评论数据集合中的每个评论数据均包括目标图像；对所述目标图像进行图像识别，确定所述目标图像的图像类别；若所述目标图像的图像类别属于预设类别，则对所述评论数据集合中的所有评论数据进行标记处理。该方法针对包括同一目标图像的评论数据，可以实现快速批量处理，从而提高了评论数据的处理效率。

一种基于场景上下文感知的图像隐私预测方法-202310270840.9
发明人：李红波;李钊;袁霖;高新波 -专利权人：重庆邮电大学
申请日： 2023-03-20 - 公布日： 2023-06-23 - 主分类号： G06V20/30
摘要：本发明属于图像处理技术，特别涉及一种基于场景上下文感知的图像隐私预测方法，包括获取待分享的图像，以及图像的场景上下文信息，即分享该图像时的分享时间、分享地点以及分享目标人群；构建隐私标签预测网络，利用该网络预测待分享图像的隐私标签；构建基于场景上下文感知的跨模态图像隐私预测网络，将待分享图像、图像的隐私标签以图像的场景上下文信息输入该网络，预测图像是否属于隐私图像；本发明预测模型仅需要两个小规模的深度神经网络模型即可完成隐私预测任务，比现有技术效率更高，并且本发明可支持不同用户对于图像隐私的个性化设置。

一种人员相关性度量方法及装置-201910214594.9
发明人：郑伟健;裘沙怡;施海清 -专利权人：杭州海康威视系统技术有限公司
申请日： 2019-03-20 - 公布日： 2023-06-02 - 主分类号： G06V20/30
摘要：本发明实施例提供了一种人员相关性度量方法及装置，利用抓拍到的各人员图像，分别获得各人员的轨迹数据，统计并根据各地点信息下抓拍的人员的数目，确定各地点信息对应的场所热度，根据任意两个人员的轨迹数据及各地点信息对应的场所热度，确定两个人员的相关性。基于抓拍技术以及目标识别技术，实现了对人员的准确定位，这样，在进行人员相关性度量时，保证了人员的轨迹数据的可靠性和准确性，并且，每个地点信息下抓拍到的人员的数目表征了各地点信息下的场所热度，数目越多则场所热度越高，在进行人员相关性度量时，结合场所热度，提高了人员相关性度量的准确性。

一种垃圾图像的大数据收集方法-202010054601.6
发明人：薛强 -专利权人：小圾（上海）环保科技有限公司
申请日： 2020-01-17 - 公布日： 2023-05-26 - 主分类号： G06V20/30
摘要：本发明公开了一种垃圾图像的大数据收集方法，属于数据采集处理技术领域，包括如下步骤：步骤S1：在垃圾分类箱上或者其周围或者其旁边楼宇上，安装红外感应模块，设置并划定红外感应模块的感应区域，用于感应监控进入或靠近感应区域的居民；步骤S2：倒垃圾的居民靠近感应区域，则触发红外感应模块，红外感应模块启动视频接入模块，并打开垃圾分类箱投递仓门等，该垃圾图像的大数据收集方法不需要专人进行操作、值守，极大的节省了人力、物力和财力，解决了目前人工垃圾分类效率低，使用材料识别技术进行智能化分类不完整的缺陷，能够在人工智能化方面的发展提供了数据保障，能够更快的促进人工智能在垃圾分类方向的应用。

用于智能识别轨道交通车辆图像中车辆零部件的编码方法-201810650791.0
发明人：赵延军;杨勇;李申 -专利权人：北京飞鸿云际科技有限公司
申请日： 2018-06-22 - 公布日： 2023-05-02 - 主分类号： G06V20/30
摘要：本发明公开了一种用于智能识别轨道交通车辆图像中车辆零部件的编码方法，包括如下步骤：S11，将车辆检视部位按照结构及功能进行初步划分并进行初步编码，得到零部件编码标签列表；S12，根据零部件编码标签列表对样本库中的图像进行标签标注，得到训练样本库；S13，将训练样本库进行训练得到故障检测模型；S14，将检视部位的测试样本输入到所述故障检测模型中进行检测，得到疑似故障图像集；S15，判断疑似故障图像集中是否存在故障部件遗漏，如果存在，则转向S16；否则，编码完成；S16，根据遗漏的故障部件对初步划分零部件小区域进行细划分，并对得到的优化零部件小区域进行优化编码，更新零部件编码标签列表，转向S12。该方法经过反复探索、修正、优化制订出有效的用于构建智能识别轨道交通车辆图像深度学习训练模型的零部件编码标签列表。

将对象区分优先级以用于对象辨识-201880055042.1
发明人：王雷;毕宁;罗纳德·卡里奥迪萨;陈颖 -专利权人：高通股份有限公司
申请日： 2018-08-22 - 公布日： 2023-05-02 - 主分类号： G06V20/30
摘要：本发明提供用于在一或多个视频帧中将对象区分优先级以用于对象辨识的技术和系统。举例来说，获得当前视频帧，且在所述当前视频帧中检测对象。确定与所述对象相关联的状态信息。也可确定所述对象的优先级。举例来说，可针对对象基于与所述对象相关联的状态信息确定优先级。针对来自所述对象的至少一个对象基于针对所述至少一个对象确定的优先级执行对象辨识。举例来说，可针对具有较高优先级的对象在具有较低优先级的对象之前执行对象辨识。

视频字幕添加方法、装置、计算设备及计算机存储介质-202110677601.6
发明人：郭宝 -专利权人：咪咕数字传媒有限公司;咪咕文化科技有限公司;中国移动通信集团有限公司
申请日： 2021-06-18 - 公布日： 2023-04-18 - 主分类号： G06V20/30
摘要：本发明公开了一种视频字幕添加方法、装置、计算设备及计算机存储介质。方法包括：识别视频帧中的发音对象及对话对象，确定发音对象本体区域、对话对象本体区域以及对话对象关联区域，根据发音对象本体区域、对话对象本体区域以及对话对象关联区域确定发音对象对应的视频字幕的禁示区域，继而根据禁示区域确定发音对象对应的视频字幕的显示区域，最终将发音对象对应的视频字幕添加至显示区域。采用本方案，视频字幕无法遮挡发音对象及对话对象，从而提升用户观看体验；并且能够避免用户对视频字幕所对应的发音对象产生混淆，便于用户分辨视频字幕所对应的发音对象，以及便于用户准确地理解视频内容，继而提升用户体验。

信息识别方法、装置及电子设备-201710884606.X
发明人：朱碧军;贾海军;李文龙 -专利权人：阿里巴巴集团控股有限公司
申请日： 2017-09-26 - 公布日： 2023-04-07 - 主分类号： G06V20/30
摘要：本申请实施例提供一种信息识别方法、装置及电子设备，涉及计算机应用技术领域。其中，对采集获得的图像进行检测，以确定至少一个当前目标对象；判断所述至少一个当前目标对象是否与历史检测结果中的历史目标对象相同；对与历史检测结果中的历史目标对象不同的当前目标对象进行识别，本申请实施例提供的技术方案减少了不必要的时间，提高了识别效率。

基于行人识别的室内行人寻迹方法、装置、计算机设备及存储介质-201811573978.1
发明人：钱久超;邵华青;陈俊泓;朱肖光;陶政;刘佩林;应忍冬;耿相铭;文飞 -专利权人：上海交通大学
申请日： 2018-12-21 - 公布日： 2023-03-24 - 主分类号： G06V20/30
摘要：本发明公开了一种基于行人识别的室内行人寻迹方法，该种室内行人寻迹方法首先判断场景图像中行人的身份信息，在确定后该行人的身份信息之后，再使用深度学习的方法判断标记有该身份信息的行人全身图与连续的场景图像中的行人是否为同一人，如果为同一人则求出该行人的像素坐标，之后将该像素坐标转换为室内的世界坐标，对室内的世界坐标进行曲线拟合即可得到室内行人的轨迹，利用深度学习的算法，行人识别及定位的精度高，运算量小，本方法也不需要行人随身携带用于辅助定位的设备(如移动传感器等)。本发明还提供了一种基于行人识别的室内行人寻迹装置、计算机设备及存储介质。

基于九宫格赋权算法的降低光线干扰图像相似度检测方法-201910608029.0
发明人：魏晓林;许凯翔;陈宏亮;黄平 -专利权人：上海天诚比集科技有限公司
申请日： 2019-07-08 - 公布日： 2023-03-17 - 主分类号： G06V20/30
摘要：本发明公开了一种基于九宫格赋权算法的降低光线干扰图像相似度检测方法，通过设定相似度阈值，对九宫格内的每一个矩形图片区域进行相似度检测，当大于该阈值时，则该区域图片的权值为1，否则将对应区域的相似度作为其权值，最后对着九个区域的图片进行权值平均值计算，作为图片相似度检测结果，从而降低光线的干扰，提高检测准确性。本发明的基于九宫格赋权算法的降低光线干扰图像相似度检测方法可以减少光线的干扰，提高检测精度，同时还可以对检测区域异常目标物体的大小做阈值，即可以设定检测区域违规物体大小的判断，扩展检测功能的灵活性。本发明具有准确度高，检测功能灵活的优点。

一种基于话题图像化的谣言检测方法-202211322158.1
发明人：韦世红;李薛宏;庞育才;李暾;李茜;肖寒春;肖云鹏 -专利权人：重庆邮电大学
申请日： 2022-10-27 - 公布日： 2023-01-31 - 主分类号： G06V20/30
摘要：本发明属于社交网络分析领域，具体涉及一种基于话题图像化的谣言检测方法，包括：对获取的数据进行数据清洗处理；将评论拓扑网络二维图像化，将每一个评论节点映射到图像中的每一个像素点；通过用户内外因素建立情感互影响函数，结合演化博弈理论构建情感互影响模型并量化评论情感；量化后的情感嵌入到话题图像中对应的像素点上，通过卷积神经网络对话题二维话题图像进行卷积，利用函数将网络的输出转换为两个类别的概率值，最大概率值对应的类别作为预测结果。本发明将评论拓扑网络图像化挖掘出谣言话题评论中的隐秘性，提高了谣言检测的精确度，同时为社交网络谣言的机制的研究提供了新的方向。

图像分类方法、装置、电子设备和存储介质-202110815559.X
发明人：吴展豪;程宝平;谢小燕 -专利权人：中移（杭州）信息技术有限公司;中国移动通信集团有限公司
申请日： 2021-07-19 - 公布日： 2023-01-24 - 主分类号： G06V20/30
摘要：本申请公开了一种图像分类方法、装置、电子设备和存储介质。其中，方法包括：获取待分类的第一图像；利用人脸识别算法，确定所述第一图像对应的聚类结果；所述聚类结果表征所述第一图像中的人物；利用第一分类模型，确定所述第一图像对应的分类结果；所述第一分类模型用于确定所述第一图像对应的至少一个类型；至少基于所述分类结果和所述聚类结果，确定所述第一图像对应的类别。本申请提供的方案，针对待分类的图像，利用人脸识别算法和分类模型分别得到对应的聚类结果和分类结果，再至少结合分类结果和聚类结果来对图像进行分类。如此，能够避免图像中的人脸错误识别，提高了图像分类的准确性。

一种计算机数据挖掘探索方法及系统-202211104713.3
发明人：王月南;方金花;段华;董力强 -专利权人：王月南
申请日： 2022-09-09 - 公布日： 2023-01-03 - 主分类号： G06V20/30
摘要：本发明提供的一种计算机数据挖掘探索方法及系统，涉及数据处理技术领域。在本发明中，针对每一个目标互联网终端设备，获取该目标互联网终端设备发送的待处理图像，得到对应的图像数据集合，并对该图像数据集合进行筛选，得到对应的目标图像数据集合；针对每两个目标互联网终端设备，基于该两个目标互联网终端设备对应的目标图像数据集合包括的目标图像，计算得到该两个目标互联网终端设备对应的集合相关度；针对每两个目标互联网终端设备，基于该两个目标互联网终端设备对应的集合相关度，确定对应的设备用户之间的用户相关度。基于上述方法，可以改善现有技术中挖掘的用户相关度的可靠度不佳的问题。

内容识别方法、装置以及电子设备-202110706063.9
发明人：徐思琪 -专利权人： OPPO广东移动通信有限公司
申请日： 2021-06-24 - 公布日： 2022-12-27 - 主分类号： G06V20/30
摘要：本申请实施例公开了一种内容识别方法、装置以及电子设备。所述方法包括：对采集的图像进行实时显示；若所显示的图像包括有指定内容，在所述指定内容处显示提示标识；响应作用于所述提示标识的触控操作，对所述指定内容进行识别；输出识别结果。从而通过上述方式使得在电子设备在实时的对所采集的图像进行显示的状态下，在电子设备自动通过提示标识的方式，对实时显示的图像中所出现的指定内容进行标识后，通过作用于提示标识的触控操作，就可以直接触发电子设备对指定内容进行识别，从而简化了触发对图像进行识别的操作过程，提升了用户体验。

基于非对称解耦和动态合成的素描-照片识别方法及系统-202210999421.4
发明人：叶茫;陈翠群 -专利权人：武汉大学
申请日： 2022-08-19 - 公布日： 2022-12-06 - 主分类号： G06V20/30
摘要：本发明公开了一种基于非对称解耦和动态合成的素描‑照片识别方法及系统，提出了一种非对称解耦方案，基于自动编码器将照片模态特征分解为与素描图相关表征和与素描图无关表征。为了获得信息对称的跨模态特征嵌入空间，本发明提出利用知识迁移技术将素描图表征和照片模态中的素描图无关表征进行融合，得到与照片模态表征信息对称的更新后素描图表征。最后，我们的模型在对齐后的特征嵌入空间上执行度量学习，从而促进模态不变特征学习。此外，本发明提出从照片模态中生成一种动态可更新和可学习的辅助素描图(A‑sketch)模态，来指导照片模态的非对称解耦。本发明在不增加推理时间的情况下，极大提高了素描‑照片识别任务的检索准确率。

一种基于Logo识别的侵权商标检测方法-202210380237.1
发明人：朱越琦;雷馨月;嵇睿嘉;夏思宇 -专利权人：东南大学
申请日： 2022-04-12 - 公布日： 2022-11-25 - 主分类号： G06V20/30
摘要：本发明公开了一种基于Logo识别的侵权商标检测方法，该方法包括：使用含有数据库正版商标信息的数据集训练目标检测神经网络，并使用神经网络检测图片中与正版Logo相同或相似Logo的出现位置并对其进行提取；将提取出的Logo分为纯文本、纯图形和图文混合三类；对不同类别的Logo进行相对应的特征相似度比较，判别商标是否可能对已注册的正版商标造成侵权，本发明通过Logo识别，能够实现商标侵权的检测。

一种抗原试剂检测结果识别方法、装置、设备和介质-202210922527.4
发明人：李良斌 -专利权人：北京声智科技有限公司
申请日： 2022-08-02 - 公布日： 2022-11-01 - 主分类号： G06V20/30
摘要：本公开涉及一种抗原试剂检测结果识别方法、装置、设备和介质，包括：响应于目标对象在应用终端触发的关联操作，获取关联操作对应的至少两条关联数据，其中，每一关联数据包括用户标识和抗原试剂标识；获取目标对象在应用终端上传的图像数据，其中，图像数据至少包括抗原试剂标识和采样结果；根据图像数据与关联数据的对应关系，确定图像数据对应的目标用户以及目标用户的抗原试剂采样结果，实现当目标对象在应用终端关联至少两条关联数据的场景下，确定图像数据对应的目标用户以及目标用户的抗原试剂采样结果，保证抗原试剂采样结果与目标用户相对应，提高数据的真实性。

一种车厢遗留对象检测方法、装置、电子设备及存储介质-202210128002.3
发明人：许军立;周丽华;胡小波;冯洪亮 -专利权人：深圳市镭神智能系统有限公司
申请日： 2022-02-10 - 公布日： 2022-10-18 - 主分类号： G06V20/30
摘要：本发明提供了一种车厢遗留对象检测方法、装置、电子设备及存储介质，其方法包括：获取车厢内部当前图像数据；判断当前图像数据与初始图像数据是否一致，若存在不一致区域时，从当前图像数据中提取出包括有不一致区域的目标区域图像数据；初始图像数据为标准状态下车厢内部图像数据；判断包括有不一致区域的目标区域图像数据是否包括有遗留对象，若是，则获取目标区域对应的点云数据；根据目标区域图像数据和目标区域对应的点云数据，对车厢内部的遗留对象进行检测。本发明通过利用激光雷达精确扫描和高清图像扫描技术相融合，采用智能化技术手段处理，实现对遗留对象的智能检测，进而能够及时清理遗漏物，加快列车的检查工作。

用于面部识别和视频分析以识别上下文视频流中的个人的装置和方法-201680053468.4
发明人： B·T·乔施普;E·M·休斯提斯;R·萨比拖夫;A·贝瑟;A·瑞思尼克 -专利权人： 15秒誉股份有限公司
申请日： 2016-07-15 - 公布日： 2022-10-04 - 主分类号： G06V20/30
摘要：一种装置包括存储器、与存储器通信并被配置为经由网络进行通信的通信接口以及与存储器和通信接口进行通信的处理器。处理器接收与客户端设备的用户相关联的面部图像数据、注册面部图像数据，并将与用户相关联的面部图像数据和上下文数据存储在数据库中。处理器还从与网络通信的至少一个图像捕获设备接收视频流数据、分析视频流数据和与视频流数据相关联的上下文数据以分别定义分析后的视频数据和分析后的上下文数据，并且基于将与视频流数据相关联的数据与存储在数据库中的数据进行比较来定义置信度。在置信度满足标准时，处理器定义特定于用户的上下文视频流。

多任务模型的训练及预测方法、装置、设备和介质-202210637107.1
发明人：李泽政 -专利权人：北京百度网讯科技有限公司
申请日： 2022-06-07 - 公布日： 2022-08-09 - 主分类号： G06V20/30
摘要：本公开提供了一种多任务模型的训练及预测方法、装置、设备和介质，涉及深度学习和自然语言处理等领域。具体实现方案为：获取多个任务对应的样本文本集，其中，每个样本文本集用于对多任务模型进行对应任务的适配训练；获取各样本文本集对应的参考量化范围；根据各样本文本集对应的参考量化范围，确定目标量化范围；根据目标量化范围对多任务模型进行训练。由此，综合多个任务对应的样本文本集的参考量化范围，来确定多任务模型所采用的目标量化范围，从而多任务模型根据该目标量化范围对文本进行量化，可避免多任务模型采用单一样本文本集对应的量化范围对不同任务对应的文本进行量化，而导致量化效果不佳的问题，从而提升多任务模型的量化效果。

基于基尼不纯度的OCR版面分析方法-202110479171.7
发明人：刘星辰;何盼;陈晓峰;麻沁甜 -专利权人：上海勃池信息技术有限公司
申请日： 2021-04-29 - 公布日： 2022-08-05 - 主分类号： G06V20/30
摘要：本发明基于基尼不纯度的OCR版面分析方法，包括：获取图像OCR初始的含位置信息和置信分的识别结果；根据置信分将所有的识别结果分为高置信度和低置信度两类；从图像的左侧开始，按照一定的间隔设置多条竖直分隔线，同样地，从图像上侧开始，按照一定的间隔设置多条水平分隔线；利用竖直分隔线将识别结果分成左右两部分，水平分隔线将识别结果分成上下两部分；对于每一条分隔线，分别计算左右或者上下两个部分的基尼不纯度，然后根据上下/左右的基尼不纯度计算总的基尼不纯度；取所有分隔线中基尼不纯度最小的线作为最终的分隔线；通过最终分隔线的位置和方向判断图像的版面，同时过滤掉高置信度文本较少一侧的文本识别结果；根据过滤后的识别结果进行字段匹配，得到最终的识别结果。

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]标题生成方法、装置、电子设备和存储介质有效

专利文献下载