[发明专利]音频数据处理方法、装置、计算机设备和存储介质在审

申请号：	201910779481.3	申请日：	2019-08-22
公开（公告）号：	CN110797044A	公开（公告）日：	2020-02-14
发明（设计）人：	林炳怀;康跃腾;王丽园	申请（专利权）人：	腾讯科技(深圳)有限公司
主分类号：	G10L25/03	分类号：	G10L25/03;G10L25/51;G10L25/60;G10L25/78
代理公司：	44224 广州华进联合专利商标代理有限公司	代理人：	黄晓庆
地址：	518000 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请涉及音频数据处理方法、装置、计算机设备和存储介质。其中，一种音频数据处理方法，输出目标音频信息；基于输出的目标音频信息，获取待处理音频数据；将目标音频信息与待处理音频数据发送至服务器，通过服务器基于目标音频信息，对待处理音频数据进行音素级别、词语级别以及句子级别的评测；接收服务器发送的评测结果，评测结果包括句子评测结果、词语评测结果及音素评测结果；输出句子评测结果、词语评测结果及音素评测结果。如此，使得用户可以知晓音素级别、词语级别以及句子级别的评测结果，能够应用于更多的场景，从而提高音频数据处理的适用性。
搜索关键词：	评测结果音频数据处理目标音频词语句子级别音频数据音素级别音素句子服务器音频数据发送计算机设备接收服务器存储介质输出目标音频信息评测输出场景发送申请应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种音频数据处理方法，所述方法包括：/n输出目标音频信息；/n基于输出的所述目标音频信息，获取待处理音频数据；/n将所述目标音频信息与所述待处理音频数据发送至服务器，通过所述服务器基于所述目标音频信息，对所述待处理音频数据进行音素级别、词语级别以及句子级别的评测；/n接收所述服务器发送的评测结果，所述评测结果包括句子评测结果、词语评测结果及音素评测结果；/n输出所述句子评测结果、所述词语评测结果及所述音素评测结果。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司，未经腾讯科技(深圳)有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910779481.3/，转载请声明来源钻瓜专利网。

上一篇：会议语音实时转写方法及系统
下一篇：声音处理方法、系统、电子设备和计算机可读介质

同类专利

音频数据处理方法、装置、计算机设备和存储介质-201910779481.3
发明人：林炳怀;康跃腾;王丽园 -专利权人：腾讯科技(深圳)有限公司
申请日： 2019-08-22 - 公布日： 2020-02-14 - 主分类号： G10L25/03
摘要：本申请涉及音频数据处理方法、装置、计算机设备和存储介质。其中，一种音频数据处理方法，输出目标音频信息；基于输出的目标音频信息，获取待处理音频数据；将目标音频信息与待处理音频数据发送至服务器，通过服务器基于目标音频信息，对待处理音频数据进行音素级别、词语级别以及句子级别的评测；接收服务器发送的评测结果，评测结果包括句子评测结果、词语评测结果及音素评测结果；输出句子评测结果、词语评测结果及音素评测结果。如此，使得用户可以知晓音素级别、词语级别以及句子级别的评测结果，能够应用于更多的场景，从而提高音频数据处理的适用性。

鼾声识别的方法及装置、存储介质和处理器-201910103058.1
发明人：聂镭;沙露露;聂颖;郑权;张峰 -专利权人：龙马智芯(珠海横琴)科技有限公司
申请日： 2019-01-31 - 公布日： 2020-02-07 - 主分类号： G10L25/03
摘要：本申请公开了一种鼾声识别的方法及装置、存储介质和处理器。该方法包括：获取目标音频数据的语谱图，其中，目标音频数据为人睡觉过程中采集到的音频数据；确定语谱图中目标能量范围内的第一能量占比；基于第一能量占比，识别目标音频数据中是否存在鼾声。通过本申请，解决了相关技术中在提升识别鼾声的准确率的情况下所需成本较高的技术问题。

音频分析仪器自动化计量检定系统-201920330966.X
发明人：何洁;金晖 -专利权人：浙江大学城市学院
申请日： 2019-03-15 - 公布日： 2019-12-20 - 主分类号： G10L25/03
摘要：本实用新型涉及音频分析仪器自动化计量检定系统，包括标准声源发生系统、测量结果识别系统和计算机程控系统；标准声源发生系统包括ZigBee收发单元、ARM系统、程控信号源、功放电路、发声器件和检测电路；测量结果识别系统包括被测仪器显示屏、摄像头、图像电信号接口单元、ARM系统、检测电路、AC接口、DC接口和ZigBee收发单元；计算机程控系统包括ZigBee收发单元、ARM系统和计算机上位机。本实用新型的有益效果是：结合声校准技术、程控信号源设计以及无线传输技术设计了标准声源发生系统，为音频分析仪器自动化计量检定系统的实现提供了创新的硬件平台。

一种音频播放方法及系统-201910816264.7
发明人：涂斌;蔡剑文;欧阳育军;叶键晖 -专利权人：广州华多网络科技有限公司
申请日： 2019-08-30 - 公布日： 2019-12-03 - 主分类号： G10L25/03
摘要：本发明提供一种音频播放方法及系统，该方法为：获取待播放文本和多个预设语音包；利用预设的特征信息提取模型，提取待播放文本的每个角色对应的角色属性和每个场景对应的场景属性；根据每个预设语音包的语音属性，分别为每个角色属性和场景属性分配对应的角色语音包和场景语音包；利用每个角色语音包播放待播放文本中与其对应的角色对应的内容，以及利用每个场景语音包播放待播放文本中与其对应的场景对应的内容。本方案中，根据每个角色和场景的属性，为不同角色和不同场景分配各自对应的语音包，并分别利用每一角色和场景对应的语音包播放每一角色和场景对应的内容，提高用户的使用体验。

一种基于谱图特征的并行卷积循环神经网络的语音情感识别方法-201910901182.2
发明人：姜芃旭;雷沛之;傅洪亮 -专利权人：河南工业大学
申请日： 2019-09-23 - 公布日： 2019-12-03 - 主分类号： G10L25/03
摘要：本发明公布了一种基于谱图特征的并行卷积循环神经网络的语音情感识别方法。包括以下步骤：首先，从每条语音中提取帧级特征，并利用长短期记忆网络逐帧进行高级特征提取。同时，计算帧级特征的一阶差分以及二阶差分，并将其组合成三维特征，通过卷积神经网络来对这些三维特征进行高级特征提取。然后将两个高级特征融合并进行批归一化处理。最后，使用SoftMax分类器对情感进行分类。本发明的基于谱图特征的并行卷积循环神经网的语音情感识别方法，模块内部采用并行的连接结构来同时处理谱图特征，能够有效的提升语音情感识别的性能。

基于声学信道的个人计算机使用行为监测方法及系统-201810299988.4
发明人：伍楷舜;韩晔彤;刘巍峰;邹永攀 -专利权人：深圳大学
申请日： 2018-04-04 - 公布日： 2019-11-29 - 主分类号： G10L25/03
摘要：本发明提供一种基于声学信道的个人计算机使用行为监测方法及系统，所述个人计算机使用行为监测方法包括以下步骤：步骤S1，采集用户操作键盘和鼠标时产生的音频信号；步骤S2，对采集到的音频信号进行数据预处理，提取出音频信号块；步骤S3，提取音频信号块的特征数据，并对特征数据进行模型训练；步骤S4、对模型训练的训练器进行测试，识别对应的事件；步骤S5、根据识别出的对应事件，分析用户的使用行为。本发明首先通过监督学习训练出的分类器，同时结合模型迁移的方法，实现了对监测事件的识别，进而能够基于事件识别为分析用户使用电脑的活动提供了很好的数据基础，达到监测用户的个人计算机使用行为的目的。

一种变电站设备音频信号采集分析系统-201910631577.5
发明人：石江华;姚明;崔若涵;安帅;陆增洁;陈成;孙雷;郭佳田;胡蕊;王婧 -专利权人：国网上海市电力公司;上海电力实业有限公司
申请日： 2019-07-12 - 公布日： 2019-11-26 - 主分类号： G10L25/03
摘要：一种变电站设备音频信号采集分析系统，属监控领域。包括一个或多个音频采样模块和一个集控中心，音频采样模块和集控中心之间采用有线或无线网络连接；其音频采样模块固定在待监测目标区域内，通过声音传感器获取设备及环境音频，通过高速网络将音频数据传输到集控中心；其集控中心的诊断分析系统利用聚类分析算法对音频样本进行诊断分析，以获取设备及环境实时状态，并对诊断信息进行实时记录和存储，以有效实现设备故障预警和故障定位。该系统能够通过监测、记录和分析设备运行时的声音信号，对设备运行状态进行实时监测的监测系统，有助于掌握设备实际运行情况，提高设备的检修效率。可广泛用于无人值守变电站的运行监控领域。

一种基于长窗比例因子的回放语音攻击检测算法-201610220000.1
发明人：王让定;陈亚楠;严迪群;金超;陶表犁;张立 -专利权人：宁波大学
申请日： 2016-04-11 - 公布日： 2019-11-22 - 主分类号： G10L25/03
摘要：本发明公开了一种基于长窗比例因子的回放语音攻击检测算法，它是针对现有攻击者利用回放语音进入说话人识别系统，造成合法用户的权益受到损害而研发的防回放语音攻击的检测算法，该检测算法能够有效识别不同来源的回放语音，检测准确率高，将该检测算法模块加载到GMM‑UBM系统之后，提高了抵抗回放语音攻击的能力，使识别系统的等错误概率降低了32%，极大改善了识别系统的安全问题。

一种发音检测方法及装置-201410692378.2
发明人：高前勇;魏思;胡国平;胡郁;刘庆峰 -专利权人：科大讯飞股份有限公司
申请日： 2014-11-25 - 公布日： 2019-11-15 - 主分类号： G10L25/03
摘要：本发明公开一种发音检测方法及装置。该方法包括：接收待检测语音信号；确定所述语音信号的各基本语音单元及所述基本语音单元对应的语音帧及帧数；计算将所述基本语音单元规整到预设的固定帧数时所需的可变帧移；根据所述可变帧移及预设的固定帧长，对规整后的基本语音单元进行分帧；提取分帧后的基本语音单元的音段特征；计算所述基本语音单元的音段特征与预设的对应所述基本语音单元的标准发音模型的似然度，所述预设的对应所述基本语音单元的标准发音模型是预先在训练集上提取基本语音单元的声学特征后训练数学统计模型得到的；根据所述似然度确定所述基本语音单元的发音是否正确。利用本发明，可以提高发音检测的准确性。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频数据处理方法、装置、计算机设备和存储介质在审

专利文献下载