专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果32个,建议您升级VIP下载更多相关专利
  • [发明专利]一种增强噪声鲁棒性的语音识别方法和系统-CN202311075628.3有效
  • 柯登峰;王运峰;陈立德;徐艳艳 - 澳克多普有限公司;北京林业大学
  • 2023-08-25 - 2023-10-20 - G10L15/02
  • 本发明涉及语音信号处理技术领域,具体公开了一种增强噪声鲁棒性的语音识别方法和系统,包括获取噪声数据和具有文本标注的干净语音数据,基于干净语音数据和噪声数据生成加噪语音数据;对干净语音数据和加噪语音数据进行预处理提取干净语音数据和加噪语音数据的梅尔频谱;构建自动语音识别模型,将干净语音数据和加噪语音数据的梅尔频谱输入自动语音识别模型中,获得干净语音数据的识别结果和加噪语音数据的识别结果;基于文本、干净语音数据和加噪语音数据的识别结果训练自动语音识别模型,以获得训练好的自动语音识别模型;基于训练好的自动语音识别模型对含噪语音数据进行识别;该方法提升了自动语音识别模型的噪声鲁棒性。
  • 一种增强噪声鲁棒性语音识别方法系统
  • [发明专利]基于少量样本的说话人适应方法、语音翻译方法和系统-CN202310580319.5有效
  • 柯登峰;佟运佳;徐艳艳;王运峰 - 澳克多普有限公司
  • 2023-05-23 - 2023-08-15 - G10L13/02
  • 本发明涉及语音合成技术领域,具体公开了一种基于少量样本的说话人适应方法、语音翻译方法和系统,包括获取具有文本标注的语音数据,对语音数据进行预处理生成梅尔频谱;构建个性化语音合成模型,将梅尔频谱和文本输入个性化语音合成模型中获得预测梅尔频谱;基于梅尔频谱和预测梅尔频谱预训练个性化语音合成模型,并进行微调;获取目标说话人的语音和任意文本信息,对目标说话人的语音进行预处理以获得梅尔频谱;将梅尔频谱和任意文本信息输入训练好的个性化语音合成模型中,以获得预测梅尔频谱;基于预测梅尔频谱生成任意文本信息所对应的目标语音;该方法将语音中的内容特征和话人特征分离开,解决少量样本语音合成的说话人相似度低的问题。
  • 基于少量样本说话适应方法语音翻译系统
  • [发明专利]一种基于双通道加载机制的视频检测方法及系统-CN202310580231.3有效
  • 柯登峰;程鹏;徐艳艳;王运峰 - 澳克多普有限公司
  • 2023-05-23 - 2023-08-01 - G06V20/40
  • 本发明涉及视频检测技术领域,具体公开了一种基于双通道加载机制的视频检测方法及系统,包括获取具有标注信息的视频数据并进行预处理,以获得具有标注信息的第一数据集和第二数据集;将第一数据集和第二数据集中的数据输入双通道加载机制中,从而获得第一增强数据和第二增强数据;构建目标检测模型,将第一增强数据和第二增强数据分别输入到模型中,以获得物体的预测位置和预测类别;基于标注信息训练目标检测模型;基于训练好的目标检测模型对待检测的视频数据进行检测;该方法通过双通道加载机制同时加载二份数据并且使用不同的数据增强策略进行最大化扩充数据的多样性,增强模型的检测能力。
  • 一种基于双通道加载机制视频检测方法系统
  • [发明专利]一种转换未知说话人语音的方法和系统-CN202310051579.3在审
  • 柯登峰;胡睿欣;姚文翰;罗琪;舒文涛;王运峰 - 澳克多普有限公司
  • 2023-02-02 - 2023-07-28 - G10L13/047
  • 本发明涉及语音合成技术领域,具体公开了一种转换未知说话人语音的方法和系统,包括获取语音数据,语音数据标注有说话人标签;对语音数据进行预处理,以获得文本特征、线性频谱和语音波形;构建语音合成模型,基于说话人标签、文本特征、线性频谱和语音波形对所述语音合成模型进行对抗式预训练,以形成预训练好的语音合成模型;对预训练好的语音合成模型进行微调训练,以生成定制化语音合成模型;基于定制化语音合成模型获得未知说话人的语音;该方法采用少量未知说话人语音数据,通过微小变化语音合成模型参数转换出未知说话人声音,从而更快、更好的适应说话人音色。
  • 一种转换未知说话人语方法系统
  • [发明专利]一种智能语音客服问答方法及系统-CN202310385652.0在审
  • 柯登峰;杜宝乐;王运峰;徐艳艳 - 澳克多普有限公司
  • 2023-04-03 - 2023-07-04 - G10L15/02
  • 本发明涉及语音客服服务技术领域,具体公开了一种智能语音客服问答方法及系统,包括获取用户语音信号;对用户语音信号进行预处理以获得低维音频特征;以及将低维音频特征输入原始特征提取器,从而获得高维音频特征;将高维音频特征输入隐藏特征处理器,从而获得第二隐藏特征;将第二隐藏特征输入分类特征判别器中,以获得用户语音信号中待处理问题的关键字;基于待处理问题的关键字生成用户语音问题指令序列;基于用户语音问题指令序列在数据库中检索,以获得对应回答;并将对应回答反馈给用户;该方法以较低的资源消耗,实现了准确、高效的智能客服问答功能。
  • 一种智能语音客服问答方法系统
  • [发明专利]一种基于自适应注意力机制的语音合成方法和系统-CN202310051580.6在审
  • 柯登峰;胡睿欣;姚文翰;罗琪;舒文涛;王运峰 - 澳克多普有限公司
  • 2023-02-02 - 2023-04-28 - G10L13/02
  • 本发明涉及语音合成技术领域,具体公开了一种基于自适应注意力机制的语音合成方法和系统,包括获取具有文本标注及说话人标签的中文语音数据;对中文语音数据及其对应的文本数据进行预处理,以获得音素序列、帧级别梅尔频谱、音素级别时长、帧级别音高、帧级别能量以及音节边界;构建语音合成模型,将音节边界、音素序列、帧级别音高、帧级别能量和说话人标签输入语音合成模型,从而获得预测值;基于帧级别梅尔频谱、音素级别时长、帧级别音高和帧级别能量,以及所述预测值训练语音合成模型,以获得定制化语音合成模型;基于定制化语音合成模型合成未知说话人语音;该方法能更加快速的适应说话人音色,达到显著提高生成的说话人语音的效果。
  • 一种基于自适应注意力机制语音合成方法系统
  • [发明专利]一种韵律迁移语音合成方法和系统-CN202310051573.6在审
  • 柯登峰;胡睿欣;姚文翰;罗琪;舒文涛;王运峰 - 澳克多普有限公司
  • 2023-02-02 - 2023-04-04 - G10L13/02
  • 本发明涉及语音合成技术领域,具体公开了一种韵律迁移语音合成方法和系统,包括获取具有文本标注及说话人标签的中文语音数据;对中文语音数据及其对应的文本数据进行预处理,以获得音素序列、帧级别梅尔频谱、音素级别时长、音素级别音高、音素级别能量;构建基于韵律迁移的语音合成模型,将说话人标签、音素序列、帧级别梅尔频谱、音素级别时长、音素级别音高、音素级别能量输入语音合成模型,从而获得说话人分类结果和预测值;基于所述帧级别梅尔频谱、音素级别时长、音素级别音高和音素级别能量,以及所述说话人分类结果和预测值训练语音合成模型,以获得定制化语音合成模型;基于定制化语音合成模型合成未知说话人语音。
  • 一种韵律迁移语音合成方法系统
  • [发明专利]一种虚拟摄像头在直播间的应用方法及系统-CN202210525474.2在审
  • 李锋;刘阔飞;潘键;焦润;陆家富 - 澳克多普有限公司
  • 2022-05-16 - 2022-09-27 - H04N21/2187
  • 本发明涉及一种虚拟摄像头在直播间的应用方法及系统,虛拟摄像头获取预览接口调用请求后,与摄像头管理模块建立通讯连接,并初始化可跨进程传输数据的缓存队列,服务端检测其是否连接有USB摄像头设备,当检查到连接有USB摄像头设备时,向客户端发送摄像头设备的插入信息以及摄像头设备的属性信息。有益效果:对直播间的信息进行实时采集和综合分析获取舆情监测结果,根据该结果进行决策和行为干预,改善了用户体验,从摄像头驱动层构建出虚拟的摄像头,扩展性很强,即虚拟摄像头可以有很多个,可以满足多个应用或平台同时预览摄像头数据的需求,摄像头管理模块是一个上层应用,对图像的处理有很大的扩展性和空间,设计合理。
  • 一种虚拟摄像头直播应用方法系统
  • [发明专利]一种直播销售用的智能主播互动方法及系统-CN202210314851.8在审
  • 李锋;刘阔飞;潘键;焦润;陆家富 - 澳克多普有限公司
  • 2022-03-29 - 2022-09-16 - H04N21/478
  • 本发明公开了一种直播销售用的智能主播互动系统,包括上传备份模块、服务器终端、智能直播终端、网络单元接口和网络终端;所述上传备份模块与所述服务器终端相连接,所述服务器终端与所述智能直播终端相连接,所述智能直播终端与所述网络单元接口相连接,所述网络单元接口与所述网络终端相连接,本发明通过服务器终端进行控制,直播的内容和信息实时进行上传和备份,提高了终端的智能化水平,并且带来了便利,主播智能终端设有的产品类别管理单元便于对产品的品牌、销售价位、功能、产地和材质进行分析,便于观众快速了解该产品,观众可通过产品订单推荐单元进行产品的购买。
  • 一种直播销售智能互动方法系统
  • [发明专利]一种移动终端驻网方法、装置、服务器及存储介质-CN201910656306.5有效
  • 王运峰 - 澳克多普有限公司
  • 2019-07-19 - 2022-09-13 - H04W8/20
  • 本发明公开了一种移动终端驻网方法,包括:服务器获取移动终端发起的驻网请求,所述驻网请求中包括移动终端的位置信息和位置信息对应的所有可用运营商提供的可选网络服务;根据所述驻网请求,按照预定规则对所述可选网络服务的网络信号强度进行排序,生成网络信号强度顺序表;从云端SIM卡池中获取虚拟SIM卡,将所述网络信号强度顺序表写入所述虚拟SIM卡中;将所述虚拟SIM卡发送至移动终端。本发明能够使移动终端、车载WIFI等设备在驻网时有更多的运营商选择空间,同时提高设备驻网的速度和成功率。
  • 一种移动终端方法装置服务器存储介质
  • [发明专利]基于虚拟手机网络切换方法及系统-CN202210490074.2在审
  • 李锋;刘阔飞;潘键;焦润;陆家富 - 澳克多普有限公司
  • 2022-05-07 - 2022-09-02 - H04W4/02
  • 本发明涉及基于虚拟手机网络切换方法及系统,检测手机当前的网络连接类型,若手机当前的网络连接类型为WiFi网络,则自动将手机的网络连接类型切换为数据网络,若手机当前的网络连接类型为数据网络,则不作处理,基于虚拟手机网络切换系统包括有网络检测判断、网络建立接收、网络判断模块、网络选择模块和网络切换模块,网络检测判断,提供操作检测模块。有益效果:通过对手机定位信息准确的得到网络信号,通过网络检测判断、网络建立接收、网络判断模块、网络选择模块和网络切换模块实现对虚拟手机网络的多种切换方式,使得在手机网络切换过程中更加稳定方便,提高安全性能,对手机网络和WIFI网络进行准确、有效的切换模式,设计合理巧妙。
  • 基于虚拟手机网络切换方法系统
  • [发明专利]多平台智能主播的应用方法及系统-CN202210418227.2在审
  • 李锋;刘阔飞;潘键;焦润;陆家富 - 澳克多普有限公司
  • 2022-04-21 - 2022-08-30 - H04N21/2187
  • 本发明公开了多平台智能主播的应用方法及系统,其方法包括:步骤、通过建模系统进行虚拟主播建模、设置形象;步骤、通过动作捕捉系统对动作人员所进行的动作进行捕捉;同时录制直播画面;步骤、将动作捕捉系统捕捉到的动作与虚拟主播进行匹配;步骤、将虚拟主播和直播画面进行匹配、存储,并通过直播软件进行直播;其系统包括模型构建模块、数据植入模块、直播画面录制模块、数据匹配连接模块、动作捕捉模块、直播模块、AI模块和存储模块。本发明支持所有直播平台直播,能够提升直播工作效率,且减低成本,上线快;且自主学习能力强,智能化程度高。
  • 平台智能应用方法系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top