专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果867184个,建议您升级VIP下载更多相关专利
  • [发明专利]文本识别方法、装置、电子设备及可读存储介质-CN202210906561.2在审
  • 邹朋朋;印晶晶;卢恒 - 上海喜马拉雅科技有限公司
  • 2022-07-29 - 2022-11-01 - G06F16/33
  • 本发明提供的文本识别方法、装置、电子设备及可读存储介质,获得语音识别出来的原始文本和用户提供的反馈文本后,判断反馈文本是否满足文本,若不满足则直接确定反馈文本无效,若满足文本则可以判断反馈文本和原始文本是否满足得分条件,即先确定反馈文本与原始文本各自对应的得分,然后若反馈文本与原始文本各自对应的得分满足预设的文本得分条件,则确定反馈文本为有效反馈文本,若反馈文本与原始文本各自对应的得分满足预设的文本得分条件,则确定反馈文本为有效反馈文本本发明通过文本对反馈文本进行初次判断,再对反馈文本进行二次判断,通过文本和得分条件,从而准确得到反馈文本的有效性。
  • 文本识别方法装置电子设备可读存储介质
  • [发明专利]一种语义驱动武术动作合成方法-CN202310297072.6在审
  • 耿卫东;卢腾;彭昊;厉向东;梁秀波 - 浙江大学
  • 2023-03-24 - 2023-06-23 - G06T13/40
  • 本发明公开了一种语义驱动武术动作合成方法,包括:获取武术提示文本;利用可变时长动作合成扩散模型基于武术提示文本进行武术动作片段合成,包括:利用文本语义预处理网络依据武术提示文本预测文本特征和动作时长,依据文本特征、动作时长经过逆扩散迭代生成最后噪声尺度对应的噪声动作片段作为合成的武术动作片段;其中,在每个单步逆扩散中,以文本特征、动作时长、当前噪声尺度以及上一噪声尺度得到的噪声动作片段作为输入数据
  • 一种语义驱动武术动作合成方法
  • [发明专利]一种基于因素分解的从文本到图像的跨模态生成方法-CN202310415768.4在审
  • 黎吉国;邹卓;郑立荣 - 复旦大学
  • 2023-04-18 - 2023-07-21 - G06V10/30
  • 本发明属于基于AI的生成内容技术领域,具体为基于因素分解的从文本到图像的跨模态生成方法。本发明使用基于因素分解的生成对抗网络;将文本控制和随机噪声解耦分开处理,即将两者以不同方式输入到基于因素分解的生成对抗网络中:将随机噪声直接输入到生成对抗网络中,将文本控制通过基于加法的实例正则化层嵌入到生成网络中,实现文本控制和随机噪声相解耦;生成对抗网络包含基于因素分解的基础生成器和基于注意力增强的超分模块,以及基于因素分解的联合判别器,联合判别器用于对生成模型的输出进行判别,从而优化生成模型。本发明在现有技术基础上可实现更好的条件控制生成和合成性能。
  • 一种基于因素分解文本图像跨模态生成方法
  • [发明专利]处理文档图片的方法、计算设备和计算机可读存储介质-CN202210682118.1在审
  • 王磊 - 北京欧应信息技术有限公司
  • 2022-06-15 - 2022-08-19 - G06V30/41
  • 该方法包括:对所述文档图片进行光学字符识别以检测所述文档图片中的多个文本,其中每个文本包含一个或多个文本字符;基于所述多个文本的位置坐标将所述多个文本划分为多个文本行,其中每个文本行包括至少一个文本;利用命名实体识别模型对每个文本进行实体识别,以检测其中的关键点位;响应于在一个文本中检测到至少两个关键点位,基于每个关键点位的位置信息将所述文本截断为至少两个文本块;以及对于每个关键点位所位于的文本块所位于的文本行,确定所述文本行的下一文本行中与所述文本块相关联的关联文本以将所确定的关联文本与所述文本块进行合并。
  • 处理文档图片方法计算设备计算机可读存储介质
  • [发明专利]一种非平行文本下的语音转换方法-CN201010520107.0有效
  • 李燕萍;张玲华 - 南京邮电大学
  • 2010-10-27 - 2011-05-18 - G10L13/08
  • 本发明提供一种非平行文本下的语音转换方法,属于语音信号处理技术领域。该方法首先对语音音素分类,其次对分类后的语音帧基于谐波加噪声模型进行分解,提取特征矢量;接着在每类音素集合中建立特征参数的转换函数,通过对每一类音素的频谱特征矢量,基于主成分语音分析建立非平行文本下的频谱转换模型本发明不仅能够有效分离语音信号中的语义信息和话者身份信息,增强转换语音中的话者信息,而且克服了训练阶段要求平行语料的限制,实现了非平行文本下的语音转换,同时降低了对语料数据量的依赖。
  • 一种平行文本条件下语音转换方法
  • [发明专利]文本质量评估模型的训练方法和确定文本质量的方法-CN202110787492.3在审
  • 王恒;田振雷;于天宝 - 北京百度网讯科技有限公司
  • 2021-07-12 - 2021-09-14 - G06F16/35
  • 本公开提供了一种文本质量评估模型的训练方法和确定文本质量的方法、装置、设备和存储介质。涉及人工智能领域,更具体地涉及自然语言处理领域、深度学习领域和智能推荐领域。该文本质量评估模型的训练方法包括:基于针对文本的指标数据,确定多个文本中满足负样本条的第一文本和满足正样本条的第二文本;针对第一文本和第二文本中的任一文本,基于任一文本满足的条件向任一文本添加标签,该标签指示了任一文本的类别,该类别包括针对负样本的低质量类别和针对正样本的非低质量类别;以及将添加了所述标签的第一文本和添加了所述标签的第二文本构成训练集,对所述文本质量评估模型进行训练。
  • 文本质量评估模型训练方法确定
  • [发明专利]文本信息处理方法、装置、电子设备及可读存储介质-CN201910804709.X有效
  • 王雷;张睿;宋祺;周锴 - 北京三快在线科技有限公司
  • 2019-08-28 - 2021-04-27 - G06F16/9535
  • 本申请实施例提供了一种文本信息处理方法、装置、存储介质和电子设备,所述方法包括:对待修正的文本识别结果进行分词处理,得到多个文本目;将所述待修正的文本识别结果输入搜索引擎,得到至少一条搜索结果;将所述多个文本目中的每个文本目与该条搜索结果分别进行匹配,以得到该文本目在所述该条搜索结果中的匹配结果;将所述多个文本目中的每个文本目对应的匹配结果进行拼接,以得到所述至少一条搜索结果中每条搜索结果的拼接结果,各条所述拼接结果的集合形成候选结果集;将所述待修正的文本识别结果与所述候选结果集中的各条拼接结果分别进行匹配,确定修正后的文本识别结果。以提高文本识别结果纠错的准确率。
  • 文本信息处理方法装置电子设备可读存储介质
  • [发明专利]文本检测方法、文本识别方法及装置-CN202210028960.3有效
  • 章成全;吕鹏原;范森;姚锟;韩钧宇;刘经拓 - 北京百度网讯科技有限公司
  • 2022-01-11 - 2023-05-23 - G06V30/41
  • 本公开提供了一种文本检测方法、文本识别方法及装置,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于光学字符识别等场景,文本检测方法为:获取待识别图像中文本的图像特征,对待识别图像进行视觉增强处理,得到待识别图像的增强特征图,对文本的图像特征与增强特征图进行相似性比对,得到在增强特征图上的文本的目标包围盒。增强特征图从更多的维度对待识别图像的特征进行表征,使得确定出的包围盒具有较高的准确性和可靠性,且通过从文本的包围盒和增强特征图的相似性比对确定文本的包围盒,可以避免包围盒与文本之间不匹配,使得包围盒具有较强的可靠性
  • 文本检测方法识别装置
  • [发明专利]一种基于全卷积网络的多方向文本检测方法-CN201510989079.X有效
  • 白翔;章成全;张拯;姚聪 - 华中科技大学
  • 2015-12-22 - 2017-07-18 - G06K9/32
  • 本发明公开了一种基于全卷积网络的多方向文本检测方法,首先获取训练数据集中的文本块,并训练全卷积网络模型;然后利用训练好的全卷积网络模型对测试数据集中的图片进行检测,获取文本块;然后提取文本块的字符成分,并根据字符成分的位置信息估算图像中的候选文本位置;最后训练针对文本中字符成分的全卷积网络模型,利用训练好的模型对候选文本进行检测,获取其中的字符成分,根据字符成分过滤掉不需要的文本,得到图像中文本的位置本发明方法文本检测方法检测率高,且能够克服光照、遮挡、模糊等不利因素的影响。
  • 一种基于卷积网络多方文本检测方法
  • [发明专利]一种文本识别方法、字符识别方法及装置-CN201911214064.0在审
  • 何梦超 - 阿里巴巴集团控股有限公司
  • 2019-12-02 - 2021-06-18 - G06K9/20
  • 本公开涉及一种文本识别方法、字符识别方法及装置,包括:采集待识别图片;将待识别图片分割成至少一个文本图片;针对任意一个文本图片,提取该文本图片的特征序列;针对特征序列中的每个第一特征向量,获取该第一特征向量的上下文信息,并将该第一特征向量的上下文信息与该第一特征向量进行融合,得到该第一特征向量对应的第二特征向量;根据各第一特征向量对应的第二特征向量,获取该文本图片包括的字符;根据各文本图片在待识别图片中的位置信息,将各文本图片包括的字符进行拼接,得到待识别图片的文字内容。根据本公开实施例的文本识别方法、字符识别方法及装置能够提升识别速度并减少参数数量。
  • 一种文本识别方法字符装置
  • [发明专利]一种多路并行的文本到图像生成方法和系统-CN202211664553.8在审
  • 彭宇新;叶钊达;何相腾 - 北京大学
  • 2022-12-23 - 2023-05-16 - G06T11/60
  • 本发明涉及一种多路并行的文本到图像生成方法和系统。该方法包括以下步骤:1.利用预训练模型提取文本跨模态语义表征,并输入到循环神经网络,根据图像生成模型中分支的数量输出相同长度的文本向量序列。2.将不同的文本向量输入不同分支的生成网络模块中,根据不同生成策略生成相应的图像。3.根据图像空间深度预测模型输出的深度信息,赋予不同分支的生成图像不同权重,融合不同分支的生成结果。本发明针对不同图像内容特点学习不同的生成参数与策略,能够有效降低文本到图像生成方法的图像结果中的局部失真与形变。
  • 一种并行文本图像生成方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top