[发明专利]一种游戏的语音数据处理方法和装置在审

专利信息
申请号: 201811308506.3 申请日: 2018-11-05
公开(公告)号: CN109378008A 公开(公告)日: 2019-02-22
发明(设计)人: 冯艺 申请(专利权)人: 网易(杭州)网络有限公司
主分类号: G10L19/00 分类号: G10L19/00;G10L19/008
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 310052 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例提供了一种游戏的语音数据处理方法和装置,所述方法包括:确定游戏当前的语音应用场景,并确定与所述语音应用场景适配的语音压缩参数;录制原始语音数据;调用预置的游戏引擎按照所述语音压缩参数对所述原始语音数据进行压缩,并获取所述游戏引擎输出的目标语音数据。本发明实施例可以根据不同的语音应用场景,生成不同音质的语音数据,以满足不同的语音应用场景下的需求。在需求高质量的语音数据的场景下,也能支持高质量的语音数据输出。
搜索关键词: 语音应用 场景 语音数据 语音数据处理 原始语音数据 方法和装置 游戏引擎 语音压缩 游戏 目标语音 输出 音质 适配 预置 调用 录制 压缩
【主权项】:
1.一种游戏的语音数据处理方法,其特征在于,包括:确定游戏当前的语音应用场景,并确定与所述语音应用场景适配的语音压缩参数;录制原始语音数据;调用预置的游戏引擎按照所述语音压缩参数对所述原始语音数据进行压缩,并获取所述游戏引擎输出的目标语音数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811308506.3/,转载请声明来源钻瓜专利网。

同类专利
  • 编码装置和方法、解码装置和方法以及记录介质-201480029768.X
  • 畠中光行;知念彻;山本优树;史润宇 - 索尼公司
  • 2014-05-21 - 2019-11-08 - G10L19/00
  • 本技术涉及可以改善音频信号传输效率的编码装置和方法、解码装置和方法以及程序。标识信息生成器基于音频信号确定是否对音频信号进行编码,并且生成用于指示确定结果的标识信息。编码单元仅对为编码指定的音频信号进行编码。打包单元生成包含标识信息和编码的音频信号的比特流。因此仅将已经编码的音频信号存储在比特流中,从而可以通过在比特流中存储指示音频信号是否被编码的标识信息来改善音频信号传输效率。本技术可以应用于编码器和解码器。
  • 信号编码和解码的方法和设备-201610881546.1
  • 刘泽新;苗磊;齐峰岩 - 华为技术有限公司
  • 2012-03-29 - 2019-11-05 - G10L19/00
  • 本发明实施例提供了用于信号编码和解码的方法和设备。所述用于信号编码的方法包括:根据输入信号得到频域信号;按照预定分配规则将预定比特分配给所述频域信号;在有比特分配的频域信号的最高频率大于预定值的情况下,调整频域信号的比特分配;根据频域信号的比特分配对频域信号进行编码。在编码时通过根据有比特分配的频域信号的最高频率来调整频域信号的比特分配,在利用相同数目的比特进行频域编码的情况下达到了更好的编码效果;在解码时以所解码出的频域信号为指导,来设置未解码出的频域信号,使输出信号达到更好的效果。
  • 一种自适应音频压缩电路-201920270494.3
  • 吴丹 - 北京中电汇声科技有限公司
  • 2019-03-04 - 2019-11-01 - G10L19/00
  • 本实用新型公开了一种自适应音频压缩电路,包括MC1595L芯片和与其连接的外围电路,MC1595L芯片的12脚连接电阻R39、R40一端,电阻R39另一端通过电阻R38接地,电阻R40另一端通过电阻R41连接15V电源,电阻R40另一端还连接可调电阻RP4一端,可调电阻RP4另一端通过电阻R38接地;MC1595L芯片的9脚连接运算放大芯片N7A输出端,运算放大芯片N7A同相端通过电容C9连接音频信号输入端,运算放大芯片N7A反相端通过电阻R36连接音频信号输入端。本实用新型使得音频输出幅度变化范围较小,保证得到一个比较稳定的音频输出,实现了自适应音频压缩,不需要控制器,电路成本低,可靠性好。
  • 一种音频编码方法和装置-201610984423.0
  • 刘泽新;王宾;苗磊 - 华为技术有限公司
  • 2014-08-26 - 2019-10-25 - G10L19/00
  • 本发明实施例公开了一种音频编码方法和装置,包括:对于音频中的每一音频帧,确定所述音频帧与所述音频帧的前一音频帧的信号特性满足预设修正条件时,根据所述音频帧的线性谱频率LSF差值和所述前一音频帧的LSF差值确定第一修正权重;确定所述音频帧与所述前一音频帧的信号特性不满足预设修正条件时,确定第二修正权重;所述预设修正条件用于确定所述音频帧与所述音频帧的前一音频帧的信号特性相近;根据确定的所述第一修正权重或者所述第二修正权重对所述音频帧的线性预测参数进行修正;根据所述音频帧修正后的线性预测参数对所述音频帧进行编码。本发明能够在码率不变或者码率变化不大的情况下编码带宽更宽的音频,且音频帧间频谱更为平稳。
  • 一种语音信号的压缩感知重构方法-201610970186.2
  • 孙林慧;赵城;薛海双 - 南京邮电大学
  • 2016-10-28 - 2019-10-15 - G10L19/00
  • 本发明公开了一种语音信号的压缩感知重构方法,该方法克服了现有语音信号压缩重构技术的不足,提出一种基于平滑l0(Smooth L0)范数的语音信号压缩重构方法,该方法与传统的语音信号重构方法比较,SL0算法在重构前不需要知道该语音信号的稀疏度,而且具有计算量小、匹配度高、重构时间少等优点。为了达成上述目的,本发明的解决方案是:使用新的平滑L0范数进行语音信号的重构。本发明相比于传统的语音信号重构方法,提出的改进的平滑L0算法采用了最速下降法和梯度投影算法,因此具有计算量小、匹配度高以及重构时间少等优点。
  • 基于人工智能的合成歌声的方法和装置-201610803453.7
  • 凌光;周超;何欣;袁海光 - 北京百度网讯科技有限公司
  • 2016-09-05 - 2019-10-15 - G10L19/00
  • 本申请公开了一种基于人工智能的合成歌声的方法和装置。所述方法的一具体实施方式包括:获取目标歌曲的歌词信息和乐谱信息;将所述歌词信息导入预设的语音播报模型,得到播报语音;基于所述乐谱信息,确定所述歌词信息中各字符的元音节的目标播放时长及所述目标歌曲中每个音符的基频;对于所述播报语音中的每个字符,调整该字符的元音节的时长至与目标播放时长相等,得到第一调整语音;根据所述目标歌曲中每个音符的基频,调整所述第一调整语音中每个字符的基频,得到合成的歌声。该实施方式降低了机器人唱歌的成本,并且上述合成的歌声的语音特征与机器人的语音特征相符,不存在人唱歌时的节奏、音高、气息不稳定的问题,提升了用户的听觉体验。
  • 谱峰位置的编码与解码-201480057361.8
  • V·格兰查罗夫;S·斯维里斯森 - 瑞典爱立信有限公司
  • 2014-10-10 - 2019-10-15 - G10L19/00
  • 提供一种编码器和解码器及其方法,用于音频编码中谱峰位置的编码和解码。根据第一方面,提供了一种音频信号段编码方法,用于编码谱峰位置。该方法包括确定出自两个无损谱峰位置编码方案中的哪一个要求最少位数量来编码音频信号段的谱峰位置;并且选择要求最少位数量来编码音频信号段的谱峰位置的谱峰位置编码方案。两个无损谱峰位置编码方案中的第一个适合于周期性的或半周期性的谱峰位置分布;以及两个无损谱峰位置编码方案中的第二个适合于稀疏谱峰位置分布。
  • 一种音频通信解码方法-201610744193.0
  • 蒋声障;吴卫东;柯婷 - 福建联迪商用设备有限公司
  • 2016-08-29 - 2019-10-11 - G10L19/00
  • 本发明涉及一种音频通信解码方法,首先音频通信设备的接收端接收信号采样数据,并将所述信号采样数据存储在信号数据存储器中;接着采用动态阈值、质心法求边界,并根据计算出来的边界,计算高低电平宽度;接收端对信号存储器中的采样数据进行bit流解码;最后根据解码的bit流,进行解码为应用数据,并进行相关的应用操作,完成通讯应用。本发明通过动态阈值、质心法求解边界,使信号宽度或频率的计算更为准确,提高了解码成功率,提高适应性,使音频通信设备的应用范围更加广泛。
  • 一种基于ARM+FPGA架构的列车语音放大单元-201710105745.8
  • 张俊涛;王伟;刘全利 - 大连理工大学
  • 2017-02-28 - 2019-10-11 - G10L19/00
  • 本发明公开了一种基于ARM+FPGA架构的列车语音放大单元,属于嵌入式系统领域。该列车语音放大单元包括主控制模块、编解码放大模块和通信模块三部分。主控制模块包括主控芯片及外围器件,负责系统的初始化、音频存储与处理,以及运行应用程序和AGC、限幅限频算法。编解码放大模块包括编解码子模块、功放子模块和检测子模块,负责对各种格式的音频信号进行处理与放大,同时实现电流检测以及音频降级功能。通信模块包括两路千兆以太网和RS485及RS232总线,负责音频与噪检信号传输。各功能模块协调工作,构成了完整的语音放大单元。本发明可在动车、城市地铁、轻轨等交通领域中应用。
  • 一种智能手机原生DSD音频解码方法、系统及智能手机-201610292439.5
  • 郑宏志;周奕;王锋 - 西安睿芯微电子有限公司
  • 2016-05-05 - 2019-10-08 - G10L19/00
  • 本发明涉及一种智能手机原生DSD音频解码方法、系统及智能手机,在应用处理器芯片上将DSD音频流重新组包成为PCM音频流,再由DSD音频解码芯片通过PCM音频流还原出原生DSD音频流,最后由音频解码芯片将原生DSD音频流还原成为模拟音乐信号进行播放,这一过程中并不做DSD编码向PCM编码的转换,只是将DSD音频流重新组包成PCM音频流,不损失和改变任何数据信息,音乐文件的品质不会变差,极大的保证了听感,使得智能手机可以播放原生DSD高品质音频流,为智能手机在HIFI音乐播放功能上做出实质性推动,也为大众能够通过智能手机享受极致的音乐体验做出贡献。
  • 一种网络广播拓展器-201920132529.7
  • 高一星;文强;周建军 - 上海仙汇实业有限公司
  • 2019-01-25 - 2019-10-08 - G10L19/00
  • 本实用新型公开了一种网络广播拓展器,包括设备主体,设备主体正面设有联接端口,联接端口底部设有备用电源接口,备用电源接口右侧设有工作信号灯,工作信号灯右侧设有双声道输出口,双声道输出口底部设有混合音平衡输出端;后机控制板,包括滤波器组件,滤波器组件右侧设有信号收发器,信号收发器右侧设有电源接口;显示主屏,包括防水隔离条,防水隔离条右侧设有承载面板,承载面板底部设有显示区,显示区底部设有散热式模组底板;音量控制器,音频线接口右侧设有功放检测端,网络接口右侧设有输入线路,输入线路右侧设有网络参数调节端。该种网络广播拓展器具双声道采集功能,且可将数字音频信号转换为模拟音频信号。
  • 具有索引编码和位安排的量化器-201780066469.7
  • G·塞鲁西;A·马丁 - DTS公司
  • 2017-08-29 - 2019-09-17 - G10L19/00
  • 某些实施例通过将有符号金字塔的矢量元素与包括第一部分和第二部分的编码值相关联使得能够实现系数的矢量的改进的编码和解码,其中第一部分标识无符号金字塔的对应矢量元素,并且第二部分表征有符号金字塔的矢量元素的非零分量的符号值。作为结果,诸如字大小的计算约束应用于无符号金字塔而不是有符号金字塔。无符号金字塔的较小的大小使得能够扩展在计算约束内可操作的有符号金字塔参数的范围。
  • 一种DSP音频解码器-201822203831.5
  • 张义胜 - 南京永钰信息技术有限公司
  • 2018-12-26 - 2019-09-13 - G10L19/00
  • 本实用新型公开了一种DSP音频解码器,包括壳体,所述壳体内底壁固定连接有四个对称设置的固定柱,四个所述固定柱上侧共同放置有电路板,所述电路板与四个固定柱之间通过四个锁紧螺栓螺纹连接,所述壳体上侧壁开设有开口,所述开口处设有盖板,所述盖板两侧侧壁均开设有安装槽。本实用新型通过设置移动杆、挡块、移动板、固定杆、伸缩杆、弹簧、卡块、连接板和拉环,当需要将盖板拆卸对壳体内部进行检修的时候,拉动两边的拉环,拉环带动连接板移动,连接板带动卡块移动,卡块从卡槽内部移出,此时可以将盖板取下,快捷方便的实现拆卸工作,便于对壳体内部进行检修。
  • 信息隐藏方法及系统-201410585856.X
  • 吴俊德 - 南宁富桂精密工业有限公司
  • 2014-10-28 - 2019-09-03 - G10L19/00
  • 一种信息隐藏方法,该方法包括步骤:依设定的区间宽度从预处理的音频数据中选取一个音频区间,该音频区间包括多个取样点;依据每个取样点可以隐藏的信息的最大位数N,将欲隐藏的信息切割成若干份;将切割后的若干份信息转换为若干窗口长度;根据转换得到的窗口长度对音频区间加窗;计算每个窗口中的取样点的平均值,以所述平均值替换对应窗口中第一个取样点的值。本发明还提供一种信息隐藏系统。本发明可以有效抵抗噪音干扰或位置换攻击。
  • VoLTE的抖动隐藏方法和装置-201410837951.4
  • 许云峰 - 联芯科技有限公司
  • 2014-12-25 - 2019-08-30 - G10L19/00
  • 本发明涉及一种VoLTE的抖动隐藏方法和装置。该方法包括冗余帧填充操作,该冗余帧填充操包括以下步骤:输入缓存的语音帧,确定该语音帧中的信号为元音态还是非元音态;生成并输出该语音帧的线性预测系数;对该语音帧的信号的基音周期进行估计,输出估计的基音周期;根据该线性预测系数对该语音帧进行线性分析计算出残差信号;根据语音态对该残差信号进行修改和基音周期重复,并生成修改后残差信号;通过对修改后残差信号进行综合滤波,生成冗余插入信号;以及根据该信号类型对该基音周期进行分析生成同步语音数据,对缓存的语音帧进行填充,以补偿由于语速失调引起的语音数据不足。
  • 基于分层聚类的声码器线谱频率参数量化方法-201811524849.3
  • 李晔;张鹏;张杰;宫晓飞 - 山东省计算中心(国家超级计算济南中心)
  • 2018-12-13 - 2019-08-23 - G10L19/00
  • 本发明公开了一种基于分层聚类的声码器线谱频率参数量化方法,包括:接收语音信号并按帧提取线谱频率参数和清浊音参数;将连续若干帧的线谱频率参数和清浊音参数分别联合,组成超帧线谱频率矢量和超帧清浊音矢量;对当前超帧清浊音矢量进行矢量量化,得到量化索引,其中,当前超帧和上一超帧对应的量化索引联合组成当前转移模式;分别计算该转移模式下的线谱频率参数的直流分量,并训练预测系数,得到该转移模式下当前超帧余量线谱频率参数;根据当前转移模式选择对应量化码本,对余量线谱频率参数进行多级矢量量化,得到量化后的余量线谱频率参数。该方法考虑了线谱频率参数在不同状态下的统计特性差异,能够提高线谱频率参数的量化质量。
  • 音频数据处理方法及装置-201710516075.9
  • 谢灿豪 - 北京塞宾科技有限公司
  • 2017-06-29 - 2019-08-13 - G10L19/00
  • 本发明实施例提供一种音频数据处理方法及装置。该方法包括:根据至少两个不同的采样参数,采集被拍摄者的语音,至少获得第一音频数据和第二音频数据;将按照最小的采样参数采集获得的音频数据发送给终端设备。本发明实施例通过至少两个不同的采样参数,采集被拍摄者的语音,至少获得第一音频数据和第二音频数据,将按照最小的采样参数采集获得的被拍摄者的音频数据发送给终端设备,由于采样参数小,保证了按照最小的采样参数采集获得的被拍摄者的音频数据较少,发送该音频数据时,该音频数据占用的传输带宽较小,从而保证了语音录制设备可以将采集到的音频数据实时的传输给终端设备。
  • 用于棱椎矢量量化编索引和解索引的方法和装置-201910206563.9
  • 乔纳斯·斯韦德贝里 - 瑞典爱立信有限公司
  • 2015-02-26 - 2019-07-19 - G10L19/00
  • 用于音频/视频信号的棱椎矢量量化索引编制的方法包括:获得(402)对音频/视频信号采样进行表示的整数型输入矢量。从整数型输入矢量提取(404)前导符号。前导符号是整数型输入矢量中的端非零系数的符号。端非零系数是整数型输入矢量中的第一个非零系数和最后一个非零系数之一。使用棱椎矢量量化枚举方案将整数型输入矢量编索引(406)为表示音频/视频信号采样的输出索引。将棱椎矢量量化枚举方案设计为忽略端非零系数的符号。输出(408)输出索引和前导符号。因此,还公开了对应的解索引方法、编码器、解码器和计算机程序。
  • 一种自适应音频空域隐写方法-201610651588.6
  • 张悦;骆伟祺 - 中山大学
  • 2016-08-10 - 2019-07-19 - G10L19/00
  • 本发明涉及多媒体信息安全领域,具体涉及一种自适应音频空域隐写方法,包括秘密信息的嵌入和秘密信息的提取两个步骤。本发明方法以WAV音频信号的单个样本作为一个嵌入单元,根据原始WAV音频和经过一次Advanced Audio Coding(AAC)高比特率压缩解压后的WAV音频的信号差值设计每个嵌入单元修改的代价,并利用信息编码工具Syndrome Trellis Codes(STC)自适应嵌入信息并实现正确提取。经大量实验证明,本隐写方法与现有的基于LSB匹配的空域隐写方法相比,可使隐写后的音频具有更高的音频质量及安全性。因此,本发明方法对隐秘通信等应用领域具有重要意义。
  • 信息处理装置、信息处理方法以及程序-201780073952.8
  • 荻田猛史;中川亚由美;山野郁男;中川佑辅 - 索尼公司
  • 2017-10-23 - 2019-07-16 - G10L19/00
  • 在使通信的数据量最小化的同时,建立振动信息的标准化通信。[解决方案]本发明提供一种包括文件生成单元的信息处理装置,该文件生成单元生成包括语音波形数据和振动波形数据的文件。文件生成单元从第一语音数据去除待合成频带中的波形数据,将从振动数据的合成频带中提取的波形数据合成至待合成频带来生成第二语音数据,并且通过对第二语音数据进行编码来生成文件。
  • 一种无人机空管语音通信系统、语音发送方法及接收方法-201910066054.0
  • 钟智;唐苗苗;陈兴 - 朗星无人机系统有限公司
  • 2019-01-24 - 2019-06-07 - G10L19/00
  • 本发明涉及无人机技术领域,尤其是一种无人机空管语音通信系统。包括机载通信系统和地面通信系统,所述机载通信系统通过电台与外部空管单位、飞行器进行通信,所述机载通信系统具有编解码器用于通信数据的转换;所述地面通信系统接受无人机操作人员控制,所述地面通信系统具有编解码器用于通信数据的转换;所述机载通信系统和地面通信系统均通过各自的编解码器与无人机指挥与控制数据链路进行双向通信。本发明在不改变现有空管单位设备和工作方式的前提下,通过现有的数据链路实现了无人机操作人员与空管单位之间的语音通信,简化了无人机机组和空管单位人员和设备投入。不仅减少加装设备节约了成本,而且使无人机融入了现有空管语音通信体系。
  • 一种变速率语音编码的传输方法、公网对讲设备及介质-201910172497.8
  • 程履帮;何海波;高占东 - 南京文卓星辉科技有限公司
  • 2019-03-07 - 2019-05-28 - G10L19/00
  • 本发明公开的一种变速率语音编码的传输方法,包括:预设RSSI的阈值Δ1,Δ2;获取语音传输的RSSI数据,对当前帧的RSSI(n)和前一次的进行平滑处理,得到处理后的在对讲设备发起语音呼叫时,实时获取将实时获取的数据与预设的RSSI的阈值进行比较,得到比较结果,根据比较结果对语音采用不同的编码速率进行编码和传输。本发明的一种采用变速率语音编码的传输方法,通过RSSI调整语音数字的编码速率,以保证在IP传输中,语音可以保持连续和较好的业务体验。
  • 一种多通道音频硬件解码装置-201821313944.4
  • 张常华 - 广州市保伦电子有限公司
  • 2018-08-15 - 2019-05-21 - G10L19/00
  • 本实用新型公开了一种多通道音频硬件解码装置,包括存储单元、高速处理单元、若干个音频硬件解码模块及音频矩阵模块,高速处理单元与存储单元信号连接,高速处理单元的输出端连接音频硬件解码模块的输入端,音频硬件解码模块的输出端连接音频矩阵模块的输入端;高速处理单元用于读取存储于存储单元的音频数据,将音频数据分别输出至音频硬件解码模块,音频硬件解码模块完成音频数据解码后将音频数据输送至音频矩阵模块。本实用新型的一种多通道音频硬件解码装置,通过设置若干个音频硬件解码模块,通过硬件解码模块进行数字音频解码,有效降低处理器资源占用,以留下更多资源处理其它事务,其解码效率高,功耗相对较低。
  • 一种用于监所探访的全包裹隐藏式监听器-201821358616.6
  • 张世勇;翁应卫;郭伟鑫 - 广州方驰信息科技有限公司
  • 2018-08-22 - 2019-05-21 - G10L19/00
  • 本实用新型公开的一种用于监所探访的全包裹隐藏式监听器,包括机壳,所述机壳的一侧设置有指示灯、开关机键和充电孔,所述充电孔的内部安装有部分的橡皮塞,所述机壳的另一侧设置有内置麦克风、加音键和减音键,所述机壳的下面设置有吊环,所述机壳的上面设置有背包扣和子母合页。本实用新型所述的一种用于监所探访的全包裹隐藏式监听器,设有滑动板、橡皮塞和压片,能够方便的将窃听器取出,能够阻止灰尘通过充电孔进入用于监所探访的全包裹隐藏式监听器的内部,能够省力的将背包扣打开,为用于监所探访的全包裹隐藏式监听器的使用带来了便利,具有一定的实用性,带来更好的使用前景。
  • 一种直播软件的混音方法-201910098731.7
  • 李尔卫 - 迅雷计算机(深圳)有限公司
  • 2019-01-31 - 2019-05-17 - G10L19/00
  • 本发明公开了一种直播软件的混音方法,在混音时能够获取播放的伴奏音频的音频数据源,并对音频数据源和利用麦克风采集到的用户音频进行混音处理。本发明还提供了一种直播软件的混音设备、系统及计算机可读存储介质。可见,本发明在进行混音时,并非像传统混音方法一样采集扬声器输出的音频并对其进行回声消除等处理,而是直接获取播放的伴奏音频的音频数据源,因此,一方面避免了采集扬声器输出音频时噪声较大的问题,另一方面还避免了采集过程中一并采集到连麦用户音频的问题,所以混音过程中无需对伴奏音频进行回声消除、背景噪声抑制等处理,提升了混音音频的品质。
  • 语音数据的编码方法和系统-201410436861.4
  • 屈振华;曹磊;龙显军;李慧云;杨新章;郭英;尹梅;马涛;陈珣 - 中国电信股份有限公司
  • 2014-08-29 - 2019-05-17 - G10L19/00
  • 本发明实施例公开了一种语音数据的编码方法和系统,其中,方法包括:通信终端提取语音特征矢量并发送给分析服务器;分析服务器采用基于距离的聚类算法对该N个语音特征矢量进行计算,获得新的编解码参数并作为编码参数发送给通信终端,作为解码参数发送给对端通信终端;通信终端将该通信终端中编码器的编码参数更新为新的编解码参数,对端通信终端将该对端通信终端中解码器的解码参数更新为新的编解码参数;通信终端中编码器利用更新后的编码参数对通信终端采集的语音数据进行编码,并向对端通信终端传输编码得到的语音码流数据,对端通信终端中解码器利用更新后的解码参数对其进行解码。本发明实施例可以提高语音编码的编码效率和语音质量。
  • 关键词辨认系统以及方法-201510537465.5
  • 陈致生;孙良哲 - 联发科技股份有限公司
  • 2015-08-28 - 2019-05-10 - G10L19/00
  • 本发明揭示一种关键词辨认方法和系统。系统包含具有储存装置以及解码电路的解码器,其中该储存装置系用来储存用以辨识特定关键词的对数概似表以及多个动态编码表,当尚未接受该特定关键词的辨识时,该解码电路用以参考声音输入数据的帧中的特征以计算该对数概似表且参考该对数概似表以调整每一动态编码表,其中在该声音输入数据的不同帧中藉由该解码电路分别重置该多个动态编码表。
  • 一种智能通信的传输合成装置-201821427156.8
  • 陈鲤文;刘国荣;张文吉;郑日晶;周瑶;欧依文 - 福州驷马威智能科技有限责任公司;福建工程学院
  • 2018-08-31 - 2019-05-10 - G10L19/00
  • 本实用新型提出了一种智能通信的传输合成装置。本实用新型包括:存储模块、微处理器、外部音源模块、音频编解码模块、中文语音合成模块、模拟开关、立体声调频发射模块。所述存储模块将音频数字文件传输至所述微处理器,微处理器对音频数字文件解析分别获得音频数字信号以及音频文字信号,通过控制音频编解码模块将音频数字信号转换为音频模拟信号,通过控制中文语音合成模块将音频文字信号转换为音频语音信号,外部音源模块提供外部音频信号,微处理通过控制模拟开关选择音频模拟信号、音频语音信号以及外部音频信号之一传输至立体声调频发射模块无线传输至终端。本实用新型解决了多种信号源的兼容性问题,并提高了通信的质量与效率。
  • 一种音频数据融合方法-201811356310.1
  • 张敏 - 建湖云飞数据科技有限公司
  • 2018-11-15 - 2019-04-12 - G10L19/00
  • 本发明公开了一种音频数据融合方法,本发明首先获取待处理的音频数据,对音频数据进行编码,便可得到表征发音的第一编码数据。获取用于语音特征转换的嵌入向量,由于嵌入向量是对应相同参考音频数据的参考融合音频数据和参考语音数据之间的残差生成,因而所得到的嵌入向量为不包含语义特征的风格特征向量。根据嵌入向量对第一编码数据进行解码,避免了语义特征对第一编码数据处理的影响,因此所获得的目标融合音频数据的质量高。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top