[发明专利]一种口语评测方法及装置有效

申请号：	201410007034.3	申请日：	2014-01-07
公开（公告）号：	CN103761975B	公开（公告）日：	2017-05-17
发明（设计）人：	林远东;周伟达;杨晓飞;朱宏杰;杨嵩;梅微星;袁军峰	申请（专利权）人：	苏州驰声信息科技有限公司
主分类号：	G10L25/03	分类号：	G10L25/03;G10L25/51;G10L15/02
代理公司：	北京科亿知识产权代理事务所(普通合伙)11350	代理人：	汤东凤
地址：	215000 江苏省苏州***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种口语评测方法及装置，属于语言识别技术领域。所述方法包括当接收到待评测语言时，对待评测语言进行处理，提取语言特征和语种特征；利用语音分析技术，对语音特征进行声学和语言学分析，得到待评测语言的评分特征，该评分特征包括待评测语言的语音信息数值矢量、语义信息数值矢量及语法信息数值矢量；利用预设语言模型组，对语种特征进行语种分析，得到所述待评测语言的语种，该预设语言模型用于语言识别；将待评测语言的评分特征及待评测语言的语种进行评分，得到对待评测语言的评分。本发明综合分析了待测试语言的语种特征和语言特征，对该测试语言进行了评测，提高了语言评测的公平性与准确性。
搜索关键词：	一种口语评测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种口语评测方法，其特征在于，所述方法包括：当接收到待评测语言时，对所述待评测语言进行处理，提取语言特征和语种特征；利用语音分析技术，对所述语言特征进行声学和语言学分析，得到所述待评测语言的评分特征，所述评分特征包括所述待评测语言的语音信息数值矢量、语义信息数值矢量及语法信息数值矢量；利用预设语言模型组，对所述语种特征进行语种分析，得到所述待评测语言的语种，所述预设语言模型用于语言识别；将所述待评测语言的评分特征及所述待评测语言的语种进行评分，得到对所述待评测语言的评分。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于苏州驰声信息科技有限公司，未经苏州驰声信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410007034.3/，转载请声明来源钻瓜专利网。

上一篇：抛光介质、抛光设备以及去除金属件表面毛刺的方法
下一篇：多段式旋转开关

同类专利

通道间特征提取方法、音频分离方法和装置、计算设备-201910671562.1
发明人：顾容之;张世雄;陈联武;徐勇;于蒙;苏丹;俞栋 -专利权人：腾讯科技（深圳）有限公司
申请日： 2019-07-24 - 公布日： 2019-11-01 - 主分类号： G10L25/03
摘要：本发明涉及一种多通道多声源混合音频信号的通道间特征提取方法、音频分离方法和装置、计算设备、计算机可读存储介质、以及多声源音频分离系统。音频分离方法包括：将多通道多声源混合音频信号的多个通道分量之一变换成一特征空间中的单通道多声源混合音频表征；对多通道多声源混合音频信号执行二维空洞卷积，以提取多个通道间特征；对所述单通道多声源混合音频表征和所述多个通道间特征执行特征融合；基于融合后的多通道多声源混合音频特征，估计多个声源在所述单通道多声源混合音频表征中各自的权重；根据所述单通道多声源混合音频表征和所述各自的权重得到多个声源各自的表征；并且将所述多个声源各自的表征变换成多个声源各自的音频信号。

语音处理方法、移动终端及计算机可读存储介质-201910623577.0
发明人：王冲 -专利权人：努比亚技术有限公司
申请日： 2019-07-11 - 公布日： 2019-10-22 - 主分类号： G10L25/03
摘要：本申请提供了一种语音处理方法，包括：通过麦克风采集主体语音信号或客体语音信号；当移动终端处于第一工作模式时，对主体语音信号的声道模型进行分析，以提取所述主体语音信号的声道模型参数；当移动终端处于第二工作模式时，对客体语音信号的基音进行分析，以提取所述客体语音信号的基音特征；基于所述声道模型参数和所述基音特征对所述客体语音信号进行处理，以得到目标语音信号。本申请还提供了一种移动终端和计算机可读存储介质。此种方式可以基于提取的主体语音信号的声道模型参数和客体语音信号的基音特征对客体语音信号进行处理，从而得到符合主体语音信号的声道模型且客体语音信号的基音特征不变的目标语音信号，提升了用户的体验。

一种发音检错方法及装置-201410609649.3
发明人：赵超;高前勇;魏思;胡国平;胡郁;刘庆峰 -专利权人：科大讯飞股份有限公司
申请日： 2014-10-31 - 公布日： 2019-10-18 - 主分类号： G10L25/03
摘要：本发明公开了一种发音检错方法及装置，该方法包括：获取待检错语音信号；提取所述语音信号的语音特征序列；对所述语音特征序列进行切分，获取基本语音单元片断；对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分；根据所述基本语音单元片断的发音得分进行发音检错。本发明能够减小发音得分出现的偏差，提高发音检错的准确率。

音乐信号处理设备和方法-201410181454.3
发明人：角尾衣未留 -专利权人：索尼公司
申请日： 2014-04-30 - 公布日： 2019-10-11 - 主分类号： G10L25/03
摘要：本发明提供了一种音乐信号处理设备和方法、以及程序，该音乐信号处理设备包括频谱变换单元、滤波器、频率特征量生成单元以及旋律特征量序列获取单元。频谱变换单元被配置为将音乐信号变换成频谱，该音乐信号是包含具有旋律的部分的音乐作品的信号。滤波器被配置为去除频谱的陡峭峰。频率特征量生成单元被配置为根据从滤波器输出的信号生成所述部分的基频分量得到强调的频率特征量。旋律特征量序列获取单元被配置为基于频率特征量来获取旋律特征量序列，该旋律特征量序列指定所述部分在每个时间处的基频。

一种音频指纹提取系统-201910558046.8
发明人：任云;蔡荣华 -专利权人：南京信安融慧网络技术有限公司
申请日： 2019-06-26 - 公布日： 2019-09-27 - 主分类号： G10L25/03
摘要：本发明公开一种音频指纹提取系统，属于信息提取的技术领域。包括：数据处理模块、特征点选取模块和指纹生成模块；所述数据处理模块用于对音频PCM数据的预处理，所述特征点选取模块的输入段与所述数据处理模块的输出端相连接，所述指纹生成模块的输入端与所述特征点选取模块的输出端相连接，所述指纹输出模块用于输出音频指纹信息。本发明提供的音频指纹提取算法，丰富了音频指纹的信息量，减少了指纹的碰撞率，提高了音频指纹的准确率，加快了检索效率。

多重联合认证方法、装置、计算机装置及存储介质-201910315170.1
发明人：齐燕 -专利权人：深圳壹账通智能科技有限公司
申请日： 2019-04-18 - 公布日： 2019-09-10 - 主分类号： G10L25/03
摘要：本发明提供一种多重联合认证方法，包括从视频资料获取N帧图像；计算所述N帧图像中的每帧图像的清晰度，根据每帧图像的清晰度从所述N帧图像中确定一张目标图像；当所述目标图像的清晰度小于预设值时，增强所述目标图像的清晰度；从所述目标图像中提取出用户的生物特征；及根据所提取的生物特征确定用户是否通过所述第一次身份验证；以及当用户通过所述第一次身份验证时，将所述视频资料转化为音频资料，并基于所述音频资料进行第二次身份验证。本发明还提供实现所述多重联合认证方法的装置、计算机装置及存储介质。本发明可解决视频认证效率低下的技术问题。

基于声谱图及深度残差网络的音频通用隐写分析方法及系统-201910347996.6
发明人：任延珍;柳登凯;熊翘楚;傅建明;王丽娜 -专利权人：武汉大学
申请日： 2019-04-28 - 公布日： 2019-08-13 - 主分类号： G10L25/03
摘要：本发明公开了一种基于声谱图及深度残差网络的音频通用隐写分析方法及系统，本方法针对现有基于不同音频压缩标准的隐写算法通过修改不同音频压缩参数来进行隐写却没有一个通用的隐写分析算法的现状，综合考虑AAC等压缩编码标准中共有的MDCT变换特性，对重压缩后的音频原始信号域信号提取声谱图特征，利用深度残差网络S‑ResNet去挖掘音频信号的固有分布特性，提取分类特征以构建通用的音频隐写分析器。本发明的优势在于不局限于单一编码标准以及参数域，具有较好的通用性以及隐写分析检测性能。

一种基于边信息统计特性的MP3录音文件来源识别方法-201610020274.6
发明人：王让定;金超;严迪群;陶表犁;陈亚楠;张立 -专利权人：宁波大学
申请日： 2016-01-13 - 公布日： 2019-07-30 - 主分类号： G10L25/03
摘要：本发明公开了一种基于边信息统计特性的MP3录音文件来源识别方法，其设计思路是通过分析MP3录音文件码流、也即帧中边信息中各参数的使用特点及统计特性，从中找出不同系列型号手机在生成MP3录音文件时使用这些参数的倾向或特点，从而实现对MP3录音文件来源的辨识，即辨别给定的MP3文件是哪种系列型号的手机录制的，这种识别方法具有特征集构建过程较为简便快速、算法复杂度低、识别准确度高、实时性好、便于操作等优点。

针对多设备系统中的改进的自动语音识别的可靠混响估计-201811339302.6
发明人：普泽斯拉·马泽斯基;亚当·库普瑞贾恩 -专利权人：英特尔公司
申请日： 2018-11-12 - 公布日： 2019-07-12 - 主分类号： G10L25/03
摘要：本申请涉及针对多设备系统中的改进的自动语音识别的可靠混响估计。描述了根据一个实施例的用于辅助多设备混响估计的机构。如本文所述的，实施例的装置包括检测及捕获逻辑，用于辅助多个支持语音的设备中的第一支持语音的设备的麦克风来检测来自用户的命令。该装置还包括计算逻辑，用于辅助第二支持语音的设备和第三支持语音的设备基于命令来计算语音与混响调制能量比(SRMR)值，其中，计算逻辑还用于基于SRMR值来估计混响时间(RT)。该装置还包括决定及应用逻辑，用于基于对混响的所估计的RT来执行去混响。

一种基于相关系数的动态分割逆离散余弦变换倒谱系数的音声特征提取算法-201910181526.7
发明人：李铁山;贺培超;刘君霞;左毅;陈俊龙;肖杨;马赫;艾佳琪 -专利权人：大连海事大学
申请日： 2019-03-11 - 公布日： 2019-07-05 - 主分类号： G10L25/03
摘要：本发明公开了一种基于相关系数的动态分割逆离散余弦变换倒谱系数的音声特征提取算法，具有如下步骤：S1、对音声信号进行预处理；S2、对预处理后的音声信号进行从时域到频域的变换形式处理；S3、利用聚类分析算法，计算步骤S2得到的逆离散余弦变换倒谱系数矩阵相邻列之间的相似度，并把相关系数向量求和最大的相邻列合并；迭代以上过程，直至合并至14列即得到14类，得到的基于相关系数的动态分割逆离散余弦变换倒谱系数即为音声特征。本发明完善了现有技术没有充分利用S2步骤处理后信号本身所具有的类间相似性特征，使本发明具有更广泛的适应性，且在说话人识别上可以获得更高的识别精度。

信号处理方法和电子设备-201910254414.X
发明人：王力军 -专利权人：联想（北京）有限公司
申请日： 2019-03-31 - 公布日： 2019-06-28 - 主分类号： G10L25/03
摘要：本申请公开了一种信号处理方法和电子设备，该方法包括：通过与目标振动体接触的第一传感器获得第一声音信号，该第一声音信号为源振动体产生的声音经该目标振动体传导至该第一传感器的信号，该目标振动体与该源振动体属于使用者的不同部位；通过与空气接触的第二传感器获得第二声音信号，该第二声音信号能包括该源振动体产生的声音经空气传导至该第二传感器的信号；至少处理该第一声音信号和该第二声音信号，得到处理结果；如果该处理结果满足条件，执行触发指令。本申请的方案可以实现语音识别的多样性。

音频分析仪器自动化计量检定系统及识别算法-201910198525.3
发明人：金晖;何洁 -专利权人：浙江大学城市学院
申请日： 2019-03-15 - 公布日： 2019-06-25 - 主分类号： G10L25/03
摘要：本发明涉及音频分析仪器自动化计量检定系统，包括标准声源发生系统、测量结果识别系统、计算机程控系统；标准声源发生系统包括ZigBee收发单元、ARM系统、程控信号源、功放电路、发声器件和检测电路；测量结果识别系统包括被测仪器显示屏、摄像头、图像电信号接口单元、ARM系统、检测电路、AC接口、DC接口和ZigBee收发单元；计算机程控系统包括ZigBee收发单元、ARM系统和计算机上位机。本发明的有益效果是：结合标准声源发生系统、测量结果识别系统、计算机程控系统形成的音频分析仪器自动化计量检定系统，实现了音频分析仪器检定的自动化，大大节省了检定过程的人力输出和时间成本。

一种基于动态时间规整的新生儿哭声识别方法-201910134910.1
发明人：余锡林;陈炜 -专利权人：复旦大学
申请日： 2019-02-24 - 公布日： 2019-06-04 - 主分类号： G10L25/03
摘要：本发明属于生物特征识别技术领域，具体为一种基于动态时间规整的新生儿哭声识别方法。本发明方法包括：采集三种情况下的新生儿啼哭声，并标记为饥饿、疼痛和不明原因哭声；将哭声进行降采样、预加重、分帧加窗、端点检测等预处理，对预处理完的哭声信号进行特征提取，提取短时能量、基音频率和0到12阶的美尔频率倒谱系数；对特征参数进行单因素方差分析，筛选出在三类哭声中具有显著性差异的特征；利用动态时间规整算法分别选出三个类别的参考模板；执行三个两分类任务，利用DTW算法进行匹配识别，计算识别率。本发明计算复杂度较低，加快了运算速度，并且动态时间规整算法不要求两个样本长度相等，省去了前期处理的步骤。

一种多通道远近场语料采集方法及装置-201910156716.3
发明人：高亚龙;丁伟 -专利权人：深圳市伟文无线通讯技术有限公司
申请日： 2019-03-01 - 公布日： 2019-05-21 - 主分类号： G10L25/03
摘要：本发明涉及语音识别技术领域，公开了一种多通道远近场语料采集方法及装置，该方法包括：获取外接采集设备的名称和编号，所述外接采集设备包括近场采集设备和远场采集设备；根据所述外接采集设备的数量设置录音线程参数；通过所有线程进行多通道采音，每个所述线程共享一个标志位，用于标识采音状态；保存多通道采音数据；能同时采集多通道近场和远场的语音数据，每个通道的数据同时且独立采集互不干扰，实现一次采集多类语料并完成实时自动审核标注，有效降低了人工和时间成本，提高了语料采集的准确性。

一种谱曲作词的方法和装置-201510833802.5
发明人：杨帆;张琦 -专利权人：网易传媒科技（北京）有限公司
申请日： 2015-11-25 - 公布日： 2019-05-17 - 主分类号： G10L25/03
摘要：本发明的实施方式提供了一种谱曲作词的方法。该谱曲作词的方法包括：解析用户提供的曲子，确定所述曲子的旋律；根据所述曲子的旋律，确定为所述曲子填词所需的字数范围；根据预先存储的歌词库和/或用户上传的歌词文本，生成字数数量满足所述字数范围的歌词。通过解析用户上传的曲子，能够自动生成与该曲子匹配的歌词，而无需用户具备较高的音乐素养，从而降低了对普通用户的要求，满足了普通用户进行歌曲创作的需求，为用户带来了更好的体验。此外，本发明的实施方式提供了一种谱曲作词的装置。

信号处理方法及终端设备-201810401796.X
发明人：王宪亮;王立众;尹成万;朱恒;刘长滔;闵超;杨磊 -专利权人：北京三星通信技术研究有限公司;三星电子株式会社
申请日： 2018-04-28 - 公布日： 2019-05-14 - 主分类号： G10L25/03
摘要：本发明涉及语音识别技术领域，提供一种信号处理方法及终端设备，该信号处理方法包括：从输入的信号中提取特征信息；根据提取的特征信息，确定输入的信号是否为非正常语音信号。本发明中，通过根据输入的信号中提取的特征信息来确定该输入的信号是否为非正常语音信号的处理过程，实现了对非正常语音信号的有效识别，提高了识别的精准度，并且为用户的语音交互提供了安全保障，提升了用户的使用感受。

一种基于支持向量机的音频分类和分段的处理方法-201811581774.2
发明人：韦鹏程;赵宇;彭亚飞 -专利权人：重庆第二师范学院
申请日： 2018-12-24 - 公布日： 2019-05-03 - 主分类号： G10L25/03
摘要：本发明属于机器学习技术领域，公开了一种基于支持向量机的音频分类和分段的处理方法；音频自动分类和分割是在音频中提取结构化信息和语义内容的重要手段，是理解、分析和检索音频内容的基础；包括音频分类和音频分割的两个内容，分类方法采用基于支持向量机的分类方法；支持向量机SVM是近年来机器学习的主要成果；SVM可以解决小样本、非线性和高维数等实际问题，成为神经网络研究的一个新的热点。在分割方法中，采用贝叶斯信息准则的音频分割方法进行分割点确认。音频分割是从音频分类的音频流中提取不同音频类别的，也就是说，音频流按时间轴的类别划分。实验证明，基于SVM的音频分类算法具有良好的分类效果，平滑的音频分割结果更加准确。

一种婴儿哭声识别方法、装置及设备-201910029052.4
发明人：乔宇;王群 -专利权人：深圳先进技术研究院
申请日： 2019-01-12 - 公布日： 2019-04-19 - 主分类号： G10L25/03
摘要：一种婴儿哭声识别方法包括：采集语音数据，截取预定时长的语音数据段；计算所述语音数据段中包括的两个或者两个以上的音频特征向量；根据预先设定的识别模型识别所述音频特征向量，将所述识别结果发送至监护终端。由于识别结果是根据两个或两个以上的音频特征向量所识别，因而识别结果更加准确可靠，有利于提高婴儿哭声识别的精度。

一种口语评测方法及系统-201410139305.0
发明人：陈进;刘丹;魏思;胡国平;胡郁;刘庆峰 -专利权人：科大讯飞股份有限公司
申请日： 2014-04-08 - 公布日： 2019-04-05 - 主分类号： G10L25/03
摘要：本发明涉及语音信号处理领域，公开了一种口语评测方法及系统。该方法包括：接收待评测的语音数据；利用第一系统对所述语音数据进行评分，得到第一评分结果；如果所述第一评分结果满足第一条件，则输出所述第一评分结果；否则，利用第二系统对所述语音数据进行评分，得到第二评分结果；如果所述第二评分结果满足第二条件，则对所述第一评分结果和所述第二评分结果进行融合，得到第一融合评分结果，然后输出所述第一融合评分结果；否则，利用第三系统对所述语音数据进行评分，得到第三评分结果；对所述第一评分结果、第二评分结果和第三评分结果进行融合，得到第二融合评分结果，然后输出所述第二融合评分结果。利用本发明，在保证评测精度的基础上，极大地提高了系统的运算效率。

一种针对睡眠障碍人群的闹钟智能控制装置-201820610720.3
发明人：李阳 -专利权人：福建师范大学协和学院
申请日： 2018-04-26 - 公布日： 2019-01-29 - 主分类号： G10L25/03
摘要：本实用新型涉及一种针对睡眠障碍人群的闹钟智能控制装置及控制方法。所述装置由单片机控制系统、触摸感应系统，语音感应系统和通讯采集系统构成，单片机控制系统分别与触摸感应系统、语音感应系统和通讯采集系统相连。单片机控制系统接收触屏模块输入信号，发送信息给语音控制单元；触屏模块接收设置唤醒时间，传输给单片机控制系统；单片机控制系统获取当前时间t，进行所在阈值判断并通过采集输入信号的频率进行分析计算调节。本实用新型具有自我判断和警功能，当用户发出特定报警语音或按压触摸片达到一定压力时，语音控制单元或触摸检测单元发送信息给单片机控制系统，单片机控制系统驱动声音提示模块发出高音鸣叫，起到报警作用。

基于用户情绪的对话方法和装置-201810887638.X
发明人：徐力;李颖超;马晓昕 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2018-08-06 - 公布日： 2019-01-15 - 主分类号： G10L25/03
摘要：本发明提供一种基于用户情绪的对话方法和装置，其中方法包括，采集来自用户的第一音频数据，并根据第一音频数据的特征确定用户的情绪，以使用与用户的情绪对应的第二音频数据与用户进行对话。本发明提供的基于用户情绪的对话方法和装置，能够在与用户对话时能够根据用户的情绪做出不同的回应。进而丰富了电子设备根据用户的音频数据能够做出的回应，并进一步地提高了电子设备在对话时的用户体验。

一种基于聚类的使用语音判断帕金森严重程度检测方法-201811032625.0
发明人：宝颜鹏;金博;魏小鹏 -专利权人：大连理工大学
申请日： 2018-09-05 - 公布日： 2019-01-11 - 主分类号： G10L25/03
摘要：本发明公开了一种基于聚类的使用语音判断帕金森严重程度检测方法，包括如下步骤：1、语音信号的采集；2、语音信号的预处理；3、提取所有的语音特征，包括基频特征Pitch、基频扰动Jitter、振幅扰动Shimmer、信噪比特征、非线性特征；4、模型及计算；5、进行预测：对于聚类的每个分类，载入分类及回归模型；得到分类结果；通过标记值进行患病者的严重程度推测。最后，将预测的结果通过接口，反馈回前端，展示给用户。本发明是使用计算机软件分析完成的，解决了临床中没有固定指标确定是否患有帕金森的难题，同时也解决了临床观察帕金森周期长，费用高等问题，具有实时，高效又低成本的特点。

铃声处理方法及装置-201510438814.8
发明人：李棽;孙大禹;陈超 -专利权人：小米科技有限责任公司
申请日： 2015-07-23 - 公布日： 2018-12-28 - 主分类号： G10L25/03
摘要：本公开是关于铃声处理方法及装置。该方法包括：提取音频的特征信息；根据所述特征信息识别所述音频的主旋律；根据所述主旋律设置终端铃声。该技术方案可快速从音频中筛选出适合作为铃声的部分，避免用户手动裁剪，使得铃声编辑更加简单快捷，有效地提高铃声制作的效率，用户体验度更好。

监狱打架的识别装置及方法-201810858358.6
发明人：叶志坚;李稀敏;肖龙源;蔡振华;刘晓葳;谭玉坤 -专利权人：厦门快商通信息技术有限公司
申请日： 2018-07-31 - 公布日： 2018-12-25 - 主分类号： G10L25/03
摘要：本发明涉及一种监狱打架的识别装置及方法，监狱打架的识别装置包括存储模块、音频采集模块和算法检测模块，方法如下：在存储模块内建立打架音频数据库，所述打架音频数据库包含监狱打架的特征音频；由音频采集模块采集监狱场景下的音频，并将监狱音频进行特征提取，将提取的监狱音频特征与打架音频数据库的特征音频进行相似度对比；在算法检测模块内设定相似度阈值，并将监狱场景下的音频进行特征提取并与打架音频数据库中的监狱打架特征音频进行相似度对比，并判定相似度是否达到阈值，若是判定为打架音频则进行报警。本发明通过对监狱场景下的音频进行分析、识别和定位，可以准确的诊断出监狱中存在打架行为并进行报警。

特征提取方法、装置及重音检测的方法、装置-201310488434.6
发明人：刘加;赵军红;袁桦;张卫强;何亮;赵峰;邵颖 -专利权人：清华大学;深圳市车音网科技有限公司
申请日： 2013-10-17 - 公布日： 2018-12-25 - 主分类号： G10L25/03
摘要：本发明公开了一种特征提取方法、装置及重音检测的方法、装置，涉及语音检测技术。为解决现有技术在重音检测上准确率低的问题。技术方案包括：依据预设的音素与声学特征发音属性的对应关系，通过第一分类器进行输出所述声学特征发音属性的第一帧级特征向量；依据预设的音素与元辅音发音属性的对应关系，通过第二分类器将所述声学特征发音属性的第一帧级特征向量进行输出所述元辅音发音属性的第二帧级特征向量；将所述声学特征发音属性的第一帧级特征向量或所述元辅音发音属性的第二帧级特征向量进行映射所述帧级对应的音节级发音特征向量。该方案可以应用语音检测过程中。

一种基于多级支持向量机分类的语音情感识别方法及系统-201810760350.6
发明人：尹伟杰;刘树安;宫俊 -专利权人：东北大学
申请日： 2018-07-12 - 公布日： 2018-11-27 - 主分类号： G10L25/03
摘要：本发明公开了一种基于多级支持向量机分类的语音情感识别方法及系统。本发明方法，包括：提取所述语音情感在语音训练样本的情感特征；根据多级分类策略构建出语音情感识别模型；根据语音情感识别模型对所输入语音情感的类型进行判断；对语音情感进行了细致分类的方法，可以有效地将存在相似的特性某些情感也区分出来进行识别。进而本发明的技术方案解决了现有技术中的语音情感识别效果不理想，识别率低的问题。

韵律事件检测方法和装置-201310487945.6
发明人：刘加;赵军红;袁桦;张卫强;何亮;赵峰;邵颖 -专利权人：清华大学;深圳市车音网科技有限公司
申请日： 2013-10-17 - 公布日： 2018-10-02 - 主分类号： G10L25/03
摘要：本发明公开一种韵律事件检测方法和装置，涉及语音技术。为解决现有技术韵律事件检测的准确率较低的问题而发明。包括：接收到待检测语音时，获取预先训练一组受训语音得到的判别式模型M1、M2…Mn；以音节为单位划分待检测语音，得到至少一个待检测样本；提取每个待检测样本对应的待检测声学特征；使用判别式模型M1根据对应的待检测声学特征对每个待检测样本进行初步分类，得到每个待检测样本属于各个类别的第一概率；根据对应的联合检测特征，依次使用判别式模型M2…Mn分别对每个待检测样本进行分类，得到每个待检测样本属于各个类别的第二概率…第N概率；根据第N概率确定韵律检测结果。可以应用在自然语音的检测中。

一种语言音频的检测系统及方法-201510091609.9
发明人：王欢良;杨嵩;代大明;袁军峰;惠寅华;林远东 -专利权人：苏州驰声信息科技有限公司
申请日： 2015-02-28 - 公布日： 2018-09-25 - 主分类号： G10L25/03
摘要：本发明公开了一种语言音频的检测系统及方法，属于语言信号处理技术领域。所述系统包括：声学特征提取模块、音素识别模块、声学置信度计算模块、语言置信度计算模块、韵律特征提取模块和分类判别模块。本发明通过综合利用声学置信度、语言置信度和韵律特征信息，系统的检测性能获得显著提高，适用于不同长度的音频检测，具有很好的检测稳定性，可以处理多种非目标语言音频和噪声音频，具有很好的实用性，可以根据非目标语言的类型进行快速扩展，只需要提供新语种的声学模型和语言模型，然后重新训练分类器模型就可以，具有较好的系统结构的灵活性和可扩展性。

一种针对睡眠障碍人群的闹钟智能控制装置及控制方法-201810387271.5
发明人：李阳 -专利权人：福建师范大学协和学院
申请日： 2018-04-26 - 公布日： 2018-08-10 - 主分类号： G10L25/03
摘要：本发明涉及一种针对睡眠障碍人群的闹钟智能控制装置及控制方法。所述装置由单片机控制系统、触摸感应系统，语音感应系统和通讯采集系统构成，单片机控制系统分别与触摸感应系统、语音感应系统和通讯采集系统相连。单片机控制系统接收触屏模块输入信号，发送信息给语音控制单元；触屏模块接收设置唤醒时间，传输给单片机控制系统；单片机控制系统获取当前时间t，进行所在阈值判断并通过采集输入信号的频率进行分析计算调节。本发明具有自我判断的功能，同时还具有报警功能，当用户发出特定报警语音或按压触摸片达到一定压力时，语音控制单元或触摸检测单元发送信息给单片机控制系统，单片机控制系统驱动声音提示模块发出高音鸣叫，起到报警作用。

语音分析方法和装置、语音合成方法和装置、以及存储语音分析程序的介质-201410392430.2
发明人：橘诚 -专利权人：雅马哈株式会社
申请日： 2014-08-11 - 公布日： 2018-08-10 - 主分类号： G10L25/03
摘要：本发明公开了语音分析装置和语音分析方法，该语音分析方法包括产生相对音高的时间序列的变量提取步骤。所述相对音高是从乐曲数据产生的在时间轴上连续波动的音高和参考语音的音高之差。所述乐曲数据按时间序列指定乐曲的各个音符。所述参考语音是通过歌唱所述乐曲而得到的语音。通过对其中未检测到音高的无语音区间进行插值处理来处理所述参考语音的音高。所述语音分析方法还包括特性分析步骤，其产生定义了用于表示在所述变量提取步骤中产生的相对音高的时间序列的模型的歌唱特性数据。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种口语评测方法及装置有效

专利文献下载