专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果17个,建议您升级VIP下载更多相关专利
  • [发明专利]语音转写方法、装置、设备及可读存储介质-CN202310613125.0在审
  • 王玮;曹军;徐俊;王兆育;国丽 - 安徽听见科技有限公司
  • 2023-05-24 - 2023-08-25 - G06F40/232
  • 本申请公开了一种语音转写方法、装置、设备及可读存储介质,在语音转写过程中,对于音频数据对应的转写文本,先将转写文本进行拼音化处理,得到转写文本对应的拼音,再基于转写文本对应的拼音,确定出待校正词条,以及,与待校正词条对应的目标样本词条,最后,基于目标样本词条与待校正词条的前缀词的匹配关系,以及,目标样本词条与待校正词条的后缀词的匹配关系,确定是否将待校正词条替换为目标样本词条。基于该方案在语音转写过程中能够实现自动文本校正,因此能够降低语音转写过程中,对转写结果中的偏差进行校正的人工成本,提升了语音转写的效率。
  • 语音转写方法装置设备可读存储介质
  • [发明专利]字幕合成方法及相关装置、电子设备、存储介质-CN202110915609.1有效
  • 徐俊;王玮;丁艳燕;国丽;王兆育 - 安徽听见科技有限公司
  • 2021-08-10 - 2023-07-18 - H04N21/488
  • 本申请公开了一种字幕合成方法及相关装置、电子设备、存储介质,其中,字幕合成方法包括:缓存第一多媒体数据;其中,第一多媒体数据包括第一图像和第一音频,第一图像中合成有第一字幕,第一字幕是由第一音频识别得到的;获取第二多媒体数据的参考时长;其中,第二多媒体数据为已缓存的多媒体数据,第二多媒体数据包括第二图像和第二音频,第二图像中合成有第二字幕,第二字幕是由第二音频识别得到的,且参考时长是基于第二字幕的识别时长得到的;基于参考时长,确定第一多媒体数据的延迟时长;响应于到达延迟时长,推送第一多媒体数据。上述方案,能够尽可能地确保字幕与音频同步并降低传输延迟。
  • 字幕合成方法相关装置电子设备存储介质
  • [发明专利]一种语音数据处理方法和相关装置-CN201910959501.5有效
  • 苏文畅;王兆育;张鹏;蒋运霞 - 安徽听见科技有限公司
  • 2019-10-10 - 2023-06-09 - G06F16/33
  • 本申请实施例公开了一种语音数据处理方法和相关装置,包括:在界面上显示第一文本,所述第一文本是根据第一语音数据生成的文本;在检测到针对所述界面上的第一位置的播放选择操作时,根据所述第一位置对应的文本内容确定目标文本,其中,所述文本内容至少包括以下一种:至少一个词和标点符号;根据所述目标文本和预设的映射关系执行语音播放操作,其中,所述映射关系包括所述目标文本与所述语音数据之间的对应关系。实施本申请实施例,有利于深度挖掘语音与文本之间的关联关系,丰富语音转换文本的转换过程。
  • 一种语音数据处理方法相关装置
  • [发明专利]字幕颜色调整方法、装置、电子设备和存储介质-CN202211644210.5在审
  • 王玮;徐俊;曹军;丁艳燕;国丽;王兆育 - 安徽听见科技有限公司
  • 2022-12-20 - 2023-03-21 - H04N21/488
  • 本发明提供一种字幕颜色调整方法、装置、电子设备和存储介质,涉及视频处理技术领域,其中字幕颜色调整方法包括:将第一视频图像的第一视频背景颜色和对应的第一字幕颜色进行纯色处理,得到第二视频图像;确定第二视频图像中颜色与第二字幕颜色匹配的所有第一像素点的第一集合;在第二视频图像中确定距离第一像素点预设距离内的所有像素点的第二集合;基于每个第二集合的并集和第一集合确定第一视频图像的字幕背景区域;基于字幕背景区域的颜色调整第一字幕颜色。本发明中确定的字幕背景区域是从字幕区域向外扩展预设距离的区域,将字幕区域附近画面的颜色一并作为第一视频图像中第一字幕颜色的调整依据,从而提高了字幕的辨识度。
  • 字幕颜色调整方法装置电子设备存储介质
  • [发明专利]文本时间轴信息生成方法、装置、存储介质及计算机设备-CN202211369827.0在审
  • 丁艳燕;袁华东;王玮;王兆育;国丽 - 安徽听见科技有限公司
  • 2022-11-03 - 2023-02-03 - G06F40/166
  • 本申请公开了一种文本时间轴信息生成方法、装置、存储介质及计算机设备。该方法包括:将语音转文本处理的识别文本和待生成时间轴的原始文本进行文本对齐处理,以得到识别对齐文本和原始对齐文本,该识别对齐文本和原始对齐文本中的文本内容的长度一致,且每个字一一对应,根据语音转文本处理的字词时间边界数据,确定识别对齐文本中的每个字的起始时间和终止时间之后,根据每个字的起始时间和终止时间、以及原始对齐文本,确定原始文本中目标文本单位所对应的第一文本内容的起始时间和终止时间,以得到原始文本所对应的时间轴信息,本申请提高了文本时间轴信息生成效率,即使原始文本和音视频文件的识别文本相差较大,也能附加时间轴信息。
  • 文本时间信息生成方法装置存储介质计算机设备
  • [实用新型]一种音频发送设备及音频传输系统-CN202221705898.9有效
  • 王玮;李明;杨杰;杨基民;国丽;王兆育;杨玲 - 安徽听见科技有限公司
  • 2022-07-01 - 2023-01-17 - H04R3/00
  • 本实用新型提供了一种音频发送设备及音频传输系统,音频发送设备包括:采集模拟音频信号的音频采集单元;将模拟音频信号转换为数字音频信号的信号转换芯片;与第一音频接收设备通信的第一通信单元;与第二音频接收设备通信的第二通信单元;触发工作模式切换的模式切换触发单元;分别与模式切换触发单元、信号转换芯片、第一通信单元和第二通信单元连接,检测用户对模式切换触发单元的操作,响应模式切换触发操作,按目标模式下的编码方式对数字音频信号进行编码,将编码结果通过目标模式下的通信单元发送至对应接收设备的处理单元。本实用新型提供的音频发送设备及音频传输系统适用于多种场景,用户体验较好。
  • 一种音频发送设备传输系统
  • [发明专利]场景展示方法、装置、屏显设备、电子设备和存储介质-CN202210682504.0在审
  • 王玮;徐俊;苏文畅;国丽;王兆育 - 科大讯飞股份有限公司
  • 2022-06-16 - 2022-10-25 - H04N21/2187
  • 本申请提出一种场景展示方法、装置、屏显设备、电子设备和存储介质,方法包括从目标语音中检测图像展示指令;其中,图像展示指令用于触发展示与特定展示对象相匹配的图像;若从目标语音中检测到图像展示指令,则根据检测到的图像展示指令以及预先设置的特征映射库,从特征映射库中确定出与图像展示指令相对应的目标图像;其中,特征映射库中存储图像,以及图像与展示对象的匹配关系;展示目标图像。上述方案实现了基于语音进行展示图像的自动切换,提高图像切换的便捷性。将上述方案应用于基于视频直播进行的产品销售中,能够实现自动切换产品海报,不需要工作人员进行人工切换,提高了海报切换的便捷性。
  • 场景展示方法装置设备电子设备存储介质
  • [实用新型]一种音频收发系统-CN202220606763.0有效
  • 杨基民;方世煌;李明;王兆育;国丽 - 安徽听见科技有限公司
  • 2022-03-17 - 2022-09-23 - H04B1/04
  • 本申请公开了一种音频收发系统,包括通信连接的音频发射装置和音频接收装置。其中,音频发射装置包括相互耦接的第一开关电路和信号发射电路,第一开关电路用于在用户触发下生成第一控制信号,信号发射电路用于发送第一控制信号和采集到的音频信号;音频接收装置包括信号接收电路、第一选择电路、音频处理电路和音频输出电路,信号接收电路用于将接收到的第一控制信号传输至第一选择电路;第一选择电路在第一控制信号触发下选择与音频输出电路导通,以直接通过音频输出电路输出音频信号,或选择切换与音频处理电路导通,以先通过音频处理电路处理音频信号,再通过音频输出电路输出处理后的音频信号。上述方案,能够实现对音频处理功能的灵活配置。
  • 一种音频收发系统
  • [发明专利]翻译文本字幕流式展示方法、装置以及设备-CN202010246958.4有效
  • 刘晨辉;王兆育;苏文畅 - 安徽听见科技有限公司
  • 2020-03-31 - 2022-04-29 - H04N21/488
  • 本发明公开了一种翻译文本字幕流式展示方法、装置以及设备,主要构思立足于从字幕端入手,将翻译引擎给出的翻译文本做流式展示设计。具体是将翻译引擎发送的已翻译的目标文本存入预设的字幕缓冲区,再检测当前缓冲区内的总字词数,由此数据自适应配置相应的出字速度策略,所谓出字速度策略,即是可以按此策略持续地从字幕缓冲区中按序抽取并展示目标文本的逐个字词,从而达到流式字幕输出效果。本发明规避了翻译引擎的影响,可适应各语种翻译场景,并且基于缓冲字数进行自动调整,并以字词为单位逐个展示,因而可以避免在字幕实时输出时,短时展示较大量文本的情况,进而有效改善了字幕展示效果、改善了用户的阅读体验。
  • 翻译文本字幕展示方法装置以及设备
  • [发明专利]一种直播流的审查干预方法、装置、存储介质及设备-CN202111679112.0在审
  • 王玮;杨灿;王兆育;丁艳燕;国丽 - 安徽听见科技有限公司
  • 2021-12-31 - 2022-04-12 - H04N21/2187
  • 本申请公开了一种直播流的审查干预方法、装置、存储介质及设备,该方法包括:首先对获取到目标直播数据流进行预处理,分离出其中的音频流和视频流并进行缓存,然后对音频流进行语音识别,得到敏感词及其对应的标记信息,接着根据敏感词的标记信息,确定敏感词在音频流中出现的目标位置,并利用预设消音方式对目标位置上的音频流进行干预,得到审查干预后的音频流,进而根据音频流中音频帧的时间戳信息,从缓存的视频流中检索对应的视频帧与音频帧进行同步和播放。本申请是先基于语音识别技术,实时识别目标直播数据流中的敏感词,再利用预设消音方式,实时检测和干预敏感词及音视频的同步和播放,从而能够实现适时的延时播放,保障直播安全性。
  • 一种直播审查干预方法装置存储介质设备
  • [发明专利]翻译字幕制作方法、装置、电子设备与存储介质-CN202110945068.7在审
  • 丁艳燕;袁华东;国丽;王兆育 - 安徽听见科技有限公司
  • 2021-08-17 - 2021-11-16 - H04N5/278
  • 本发明提供一种翻译字幕制作方法、装置、电子设备与存储介质,所述方法包括:基于源语言字幕中各字幕帧的尾部标点,和/或各字幕帧之间的间隔时长,对所述源语言字幕进行译群分割,得到若干个译群文本;分别对各译群文本进行翻译,得到各译群文本的翻译文本;基于各译群文本的翻译文本,确定目标语言字幕。本发明提供的方法与装置,通过在翻译前对多个字幕帧进行基于语义的合并,得到若干个能够独立表达完整语义的译群文本,再在此基础上进行机器翻译,使得翻译时可以综合字幕帧的上下文语境,从而提升字幕场景下机器翻译的效果,保证翻译结果整体的语言连贯性,进而减少用户后续修整次数,提高用户满意程度。
  • 翻译字幕制作方法装置电子设备存储介质
  • [发明专利]文本显示方法、终端及服务器-CN201710947134.8有效
  • 王玮;苏文畅;王兆育;张静茵 - 安徽听见科技有限公司
  • 2017-10-12 - 2021-02-02 - G10L15/26
  • 本发明实施例提供一种文本显示方法、终端及服务器,属于语音识别领域。该方法包括:获取用于获取资源文件的资源文件地址,并将资源文件地址提交至服务器,以使得服务器根据资源文件地址,返回文本显示对象以及用于获取语音数据的音频文件地址;基于音频文件地址下载并播放语音数据,并基于文本显示对象,按照每条字幕对应的播放时间段显示每条字幕;其中,所有字幕对应的显示进度与语音数据的播放进度同步。由于在显示语音数据转化后的文本时,是通过字幕的形式进行显示,且字幕的显示进度与语音数据的播放进度同步,从而不需要用户手动浏览文本以实现音字同步。因此,文本显示过程比较方便,提升了用户阅读体验。
  • 文本显示方法终端服务器
  • [发明专利]机器同声传译输出音频动态合成方法、装置以及设备-CN202011105784.6在审
  • 王兆育;苏文畅;国丽 - 安徽听见科技有限公司
  • 2020-10-15 - 2021-01-15 - G10L13/08
  • 本发明公开了一种机器同声传译输出音频动态合成方法、装置以及设备。具体是从当前同声传译场景出发,基于既定规则先明确是否要调节合成音频语速,在有必要进行语速干预时,实时获取当前原声语句的时长及相应译文文本可能的时长,并求取二者之差以及同传至现阶段的累积时差,接着考察当前时差和/或累积时差与各自对应的预设容忍度的关系,由此动态地调整翻译策略和/或确定出语速调节增益参数,这里即包含直接干预译文文本,或不干预译文文本而为译文文本附带语速变化系数此两种调节因子,最后利用此不同的调节因子完成同传音频的语音合成。本发明实现了对当前输出音频进行动态语速调节,解决了机器同传延时问题,有效提升机器同传的输出效果。
  • 机器同声传译输出音频动态合成方法装置以及设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top