[发明专利]基于语音记录的质检方法、装置、设备及存储介质在审

专利信息
申请号: 202111157641.4 申请日: 2021-09-30
公开(公告)号: CN113921043A 公开(公告)日: 2022-01-11
发明(设计)人: 刘朝选 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G10L25/60 分类号: G10L25/60;G10L25/63;G10L15/26;H04M3/22
代理公司: 深圳市沃德知识产权代理事务所(普通合伙) 44347 代理人: 高杰;于志光
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及人工智能技术,揭露了一种基于语音记录的质检方法,包括:获取待检测语音,并从待检测语音中提取语音情感特征;将待检测语音转换为待检测文本,并提取待检测文本的文本情感特征;将所述语音情感特征和所述文本情感特征执行向量转换及连接,得到原始特征矩阵;对所述原始特征矩阵降维,得到降维特征矩阵;利用激活函数对所述降维特征矩阵执行分析,得到所述待检测语音对应的语音情感分数;利用所述语音情感分数查询预设的等级划分标准表,得到质检结果。此外,本发明还涉及区块链技术,所述待检测语音可存储于区块链的节点。本发明还提出一种基于语音记录的质检装置、电子设备以及存储介质。本发明可以提高语音记录质检时的准确度。
搜索关键词: 基于 语音 记录 质检 方法 装置 设备 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202111157641.4/,转载请声明来源钻瓜专利网。

同类专利
  • 一种语音信号信噪比估计方法、系统-202311087526.3
  • 王欢良;唐浩元;李志;王佳珺;王飞;张李 - 苏州奇梦者科技有限公司
  • 2023-08-28 - 2023-10-27 - G10L25/60
  • 本发明提供了一种语音信号信噪比估计方法、系统,只需要带噪语音信号,并且可以估计瞬时信噪比,所估计的信噪比可以更好地反映应用在目标信号上的关注焦点,包括以下步骤:从输入的带噪语音信号中检测出包含语音信号的片段;对于包含语音信号的片段,估计每一帧信号中每个时频点上语音成分和噪声成分所占的比重,得到每一帧每个时频点的掩蔽值;通过累积每帧信号中所有时频点上语音成分和噪声成分的比重,基于每一帧每个时频点的掩蔽值计算每一帧信号上的瞬时信噪比;通过累积所有包含语音信号的片段上所有帧的语音成分和噪声成分的比重,计算整个语音片段上的长时信噪比。
  • 由计算机实施的用于评估语音评测质量的方法及相关产品-202310913249.0
  • 周寒聿西;张明阳 - 网易有道信息技术(北京)有限公司
  • 2023-07-24 - 2023-10-27 - G10L25/60
  • 本发明的实施方式提供了一种由计算机实施的用于评估语音评测质量的方法及相关产品。其中,所述方法包括:获取针对语音评测所得的标准打分和服务打分,其中服务打分是基于目标评测算法服务对语音进行评测所得;将连续数值的标准打分和/或服务打分转化为对应的离散等级分类;基于转化后的离散等级分类计算质量评测指标;以及基于质量评测指标评估目标评测算法服务与标准打分的匹配度。通过本发明的技术方案,可以创造性地将连续的数值任务转化成离散分类任务,以借助离散分类任务领域的质量评测指标来实现对目标评测算法服务的评测结果的质量测试,不仅确保了测试结果的直观性,而且提供了一种全新的且普适性更高的测试方式。
  • 一种数据处理方法、装置及设备-202210349994.2
  • 刘思佳;李光宇;陈扬铭;梁燕萍;余立;冯俊兰 - 中国移动通信有限公司研究院;中国移动通信集团有限公司
  • 2022-04-02 - 2023-10-24 - G10L25/60
  • 本发明提供一种数据处理方法、装置及设备,其中,数据处理方法包括:获取第一音频数据及第一网络业务数据,所述第一网络业务数据包括采集所述第一音频数据时对应的网络侧产生的网络参数;对所述第一网络业务数据进行可用性分析处理,得到第一处理结果;对所述第一音频数据进行异常检测分析处理,得到第二处理结果;根据所述第一处理结果和所述第二处理结果,得到目标特征规则;利用所述目标特征规则对业务样本数据进行筛选,得到有效样本数据,所述有效样本数据用于训练音频质量评估预测模型。本发明的方案能够实现音频质量评估预测模型的训练数据的修正和清洗,使得音频质量评估预测模型的预测结果更加准确,从而保证对语音质量的精准评估。
  • 客服语音质检方法、装置、服务器及介质-202311014124.0
  • 黄杰;李卡;李金晶;董福豪;何谦谦;王晓雪 - 中国银行股份有限公司
  • 2023-08-11 - 2023-10-20 - G10L25/60
  • 本申请公开了客服语音质检方法、装置、服务器及介质,可应用于金融领域或其他领域。在客户与客服的语音通话中,获取客户发出的第一语音;将第一语音转换成第一文本;若第一文本包括不文明用语的数目高于或等于第一阈值,确定质检人员接入语音通话;在质检人员接入语音通话后,获取客户发出的第二语音;将第二语音转换成第二文本;若第二文本包括不文明用语的数目高于或等于第二阈值,确定客户为不文明客户;记录语音通话编号对应的客户为不文明客户。在客户说出不文明用语的次数高于或等于第一阈值的情况下,质检人员自动接入语音通话,无需等待语音通话结束且被投诉后质检人员再介入,提高了质检的速度。
  • 语音处理系统、方法和设备-201711499286.2
  • 余涛;曹晶皓;薛彬 - 阿里巴巴集团控股有限公司
  • 2017-12-29 - 2023-10-20 - G10L25/60
  • 一种语音处理系统、方法和设备,包括:所述语音处理系统包括:声学传感器和语音处理设备,所述声学传感器与所述语音处理设备耦合;所述声学传感器,用于采集语音信号;所述语音处理设备,用于接收所述语音信号;将所述语音信号分为多个语音帧;检测所述语音帧得到所述语音帧的质量参数;依据时间周期内所述语音帧的质量参数,确定所述时间周期的语音质量;输出基于所述时间周期的语音质量的提示信息。采用本发明实施例后,由于能够实时接收语音信号,从而可以输出基于时间周期的语音质量的提示信息。
  • 基于重音突现度的英语发音质量评价方法-202011213272.1
  • 艾群 - 吉林体育学院
  • 2020-11-04 - 2023-09-29 - G10L25/60
  • 本发明提出基于重音突现度的英语发音质量评价方法,所述方法包括如下步骤:S1:通过第一拾音阵列接收第一语音输入,所述第一语音输入包含至少一个英文序列;S2:通过第二预处理模块对所述第一语音输入进行预处理,得到预处理语音序列,所述预处理语音序列包括多个存在重叠区间的子序列;S3:基于所述多个子序列的分布特征,对所述第一语音输入序列进行发音质量评价。所述预处理包括预加重、分帧以及端点检测等步骤。本发明还公开了执行所述方法的计算机可读存储介质。本发明的技术方案能够在发音质量评价中避免人为主观因素的影响,从语音输入本身的重音韵律的音频特征进行质量评价,并且还能自适应的调节预处理参数。
  • 一种连读的检测方法、装置、设备及存储介质-202110312558.3
  • 曾慧 - 北京如布科技有限公司
  • 2021-03-24 - 2023-09-29 - G10L25/60
  • 本申请提供一种连读的检测方法、装置、设备及存储介质,该方法,包括:获取待评测的英语语音;将所述英语语音输入逻辑扩展图进行识别,所述逻辑扩展图包括插入静音模型的第一发音路径和未插入静音模型的第二发音路径;如果识别结果中没有停顿表征,则检测所述英语语音的发音为连读。采用本申请实施例的检测方法,通过是否有停顿表征,准确识别英语发音是否进行了连读,准确度高。
  • 语音测评方法和装置、存储介质及电子装置-201910887946.7
  • 林炳怀;康跃腾;王丽园 - 腾讯科技(深圳)有限公司
  • 2019-09-19 - 2023-09-22 - G10L25/60
  • 本发明公开了一种语音测评方法和装置、存储介质及电子装置。其中,该方法包括:获取与预设参考文本对应的待测评语音,确定该待测评语音中音素的目标发音特征;根据该目标发音特征确定该待测评语音中音素的目标音素准确度以及该待测评语音的目标句子测评分值;根据该目标音素准确度确定待纠错音素,并确定该待纠错音素对应的目标字母;输出该目标字母以及该目标句子测评分值,解决了现有技术中对于整体发音评分和局部音素判错是分开进行评估的,容易产生整体评分与局部细节判错的不一致性的技术问题。
  • 一种语音质检的装置及系统-202310598066.4
  • 朱益平 - 苏州中录企业管理服务有限公司
  • 2023-05-25 - 2023-09-19 - G10L25/60
  • 本发明公开了一种语音质检的装置及系统,包括:应用层,用于对客服的录音进行多个方向的实际应用;数据处理层,用于对客服的录音进行自动识别处理;存储层,用于对客服的录音进行存储;基础设备层,通过各种仪器的使用配合。本发明利用应用层和数据处理层相配合的设置方式,通过音频处理模块对录音文件进行初步处理,如去噪、降音、信号增强等处理;通过识别和分类模块:利用声学和语言模型对语音信号进行分类和识别,如语音识别、语音情感分类、语音性别分类、语音领域分类等;通过评估和反馈模块:对语音识别结果进行评估,并将评估结果反馈给应用领域,以便优化应用的准确性和效率。
  • 一种强噪声环境下的语音检测方法和系统-202310854842.2
  • 郭茜 - 合肥星本本网络科技有限公司
  • 2023-07-13 - 2023-09-08 - G10L25/60
  • 本申请涉及一种强噪声环境下的语音检测方法和系统,该方法包括:采集预设环境下在预设时间的声音信号;检测声音信号的幅值和频率,计算声音信号的功率谱密度;计算噪声的功率谱密度;将声音信号的功率谱密度和噪声的功率谱密度置入预设的语音检测模型,输出语音的功率谱密度;计算语音的信噪比;调整语音检测模型的系数,重新使用语音检测模型计算语音的功率谱密度以及重新计算语音的信噪比;根据信噪比达到最大值时语音的功率谱密度输出语音。本发明基于高斯白噪声机制估算强噪声环境下噪声的功率谱密度,基于玻恩—奥本海默近似理论构建语音检测模型,自动根据分析结果的信噪比对模型系数进行自动调节,从而确保最终输出准确的语音。
  • 一种基于数据增强和预训练模型特征提取的回放语音检测方法-202310696468.8
  • 郭武;吴皓晨 - 中国科学技术大学
  • 2023-06-12 - 2023-09-05 - G10L25/60
  • 本发明公开了一种基于数据增强和预训练模型特征提取的回放语音检测方法,首先基于镜像源ISM的方法生成合成的房间声学冲激响应RIR;在得到房间声学冲激响应RIR后,通过将真实语音与房间声学冲激响应RIR进行卷积,并添加混响和背景噪声来模拟生成回放语音训练集;采用预训练模型wav2vec2.0作为前端特征提取器来提取所述回放语音训练集的声学特征,将提取的声学特征输入到后端的回放语音识别模型RawNet2中,实现回放语音检测。上述方法适合于训练数据缺乏下的模型训练,以及完成鲁棒性的回放语音检测中的识别特征提取,从而达到提高回放语音检测准确率的目的。
  • 音频信号选取方法、装置、相关设备及信号接收系统-202310822386.3
  • 方磊;丁奇;姚国志;宣璇;方四安;柳林 - 合肥讯飞数码科技有限公司
  • 2023-07-05 - 2023-09-01 - G10L25/60
  • 本申请公开了一种音频信号选取方法、装置、相关设备及信号接收系统,本申请获取各个候选音频信号并提取每一候选音频信号的声学特征,该声学特征为,能够以其为依据解码得到目标音频信号的声学特征,其中,目标音频信号趋近于或等同于候选音频信号。鉴于声学特征的上述特性可知,声学特征包含了候选音频信号的各个维度的本征信息,如此才能够基于各维度丰富的本征信息解码还原出原始的候选音频信号。显然,声学特征所包含的各维度的本征信息必然包含了影响音频信号质量的各维度的影响因素,在此基础上,可以基于该声学特征准确的评估候选音频信号的质量,并参考各候选音频信号的质量,选取满足设定质量条件的候选音频信号,作为最终选取结果。
  • 音频质量识别模型的训练、音频质量识别方法及存储介质-202310499219.X
  • 陈联武;郑羲光;张晨 - 北京达佳互联信息技术有限公司
  • 2023-05-05 - 2023-09-01 - G10L25/60
  • 本公开关于一种音频质量识别模型的训练、音频质量识别方法及存储介质,所述方法包括:获取样本音频数据;所述样本音频数据包括样本音质类别标签以及样本损伤信息标签;基于预设模型对所述样本音频数据进行识别处理,得到所述样本音频数据的样本音质类别结果和样本损伤信息结果;根据所述样本音质类别结果与所述样本音质类别标签的第一差异,以及所述样本损伤信息结果与所述样本损伤信息标签的第二差异,训练所述预设模型,得到音频质量识别模型。本公开的音频质量识别模型实现了同步预测音频数据的音质类别以及损伤信息。
  • 语音质量评估方法、装置及存储介质-202310520812.8
  • 蔡金洪;杨漫佳;梁彭韦;冯顺意;李娟;柯江毅;陈楚雄 - 中国联合网络通信集团有限公司
  • 2023-05-09 - 2023-08-29 - G10L25/60
  • 本公开提供一种语音质量评估方法、装置及存储介质,涉及通信技术领域,解决了相关技术中语音质量评估成本较高,无法大规模推广的技术问题。该方法包括:获取多个语音数据;语音数据包括以下至少一项参数:信号强度、信号质量及语音丢包率;对多个语音数据进行聚类分析,确定多个第一聚类簇;确定多个第一聚类簇中每一聚类簇对应的语音质量等级;基于预设模型,每一第一聚类簇中的语音数据,以及每一聚类簇对应的语音质量等级进行模型训练,确定语音质量评估模型;语音质量评估模型用于评估语音数据的语音质量等级。本公开用于语音质量评估的场景中。
  • 一种座舱语音测试系统、方法、电子设备及可读存储介质-202310652322.3
  • 邹汶君;杨怡杉;徐开庭 - 成都赛力斯科技有限公司
  • 2023-05-31 - 2023-08-29 - G10L25/60
  • 本申请涉及汽车测试技术领域,提供了一种座舱语音测试系统、方法、电子设备及可读存储介质。该方法包括:测试电脑,用于下发测试指令;环境模拟装置,用于根据测试指令调整目标车辆的环境参数;语音播放装置,用于根据测试指令在目标车辆中播放语音音频;响应观测装置,用于监测目标车辆对语音音频的响应状态;测试电脑还用于判断响应状态是否符合测试指令的期望响应状态。本申请与现有技术相比存在的有益效果至少包括:本申请系统测试了目标车辆在环境干扰下对语音音频的完整响应过程,测试具有测试参数可控、测试高效、结果接近实际的优点。
  • 语音质检方法、装置、计算机设备和存储介质-202310661537.1
  • 赵燕子;陈永录;王静;吴琳琳 - 中国工商银行股份有限公司
  • 2023-06-06 - 2023-08-29 - G10L25/60
  • 本申请涉及一种语音质检方法、装置、计算机设备和存储介质。所述方法包括:响应于资源交互服务中心对应的资源交互语音质检任务,获取资源交互语音质检任务对应的语音数据文本集合;将各语音数据文本信息输入至关键词提取模型,得到至少一个模型提取关键词;根据资源交互语音质检任务对应的自定义关键词提取条件,对各语音数据文本信息进行自定义关键词提取,得到至少一个自定义提取关键词;将各模型提取关键词以及各自定义提取关键词进行关键词融合,得到资源交互语音质检任务对应的各语音质检关键词。本方法有利于对质检工作出现的变化更好的适应,增加资源交互服务中心的被抽检的客服话务和工单的数量和覆盖面,降低语音质检工作的漏检率。
  • 信号处理器-201810408102.5
  • 奈尔施·马杜;沃特·约斯·蒂瑞 - 恩智浦有限公司
  • 2018-04-28 - 2023-08-29 - G10L25/60
  • 一种信号处理器,包括:模型化块,其被配置成接收频域输入信号,表示所述频域输入信号的基频的基频信号;且被配置成基于周期函数提供音调模型信号,所述音调模型信号跨越多个离散频段,每一离散频段具有相应的离散频段索引,其中在每一离散频段内,所述音调模型信号由以下限定:所述周期函数;所述基频;所述频域输入信号;以及所述相应离散频段索引。所述信号处理器进一步包括运算块,其被配置成基于所述频域输入信号和所述音调模型信号,提供输出信号。
  • 语音片段的检测方法、装置、电子设备及可读存储介质-202310752476.X
  • 倪仲福;程国艮;李欣杰;钱万里 - 中译语通科技股份有限公司
  • 2023-06-25 - 2023-08-22 - G10L25/60
  • 本申请提供了语音片段的检测方法、装置、电子设备及可读存储介质,获取待检测语音片段,并按照预设时间间隔提取待检测语音片段每帧的听觉倒谱系数,确定待检测语音系数序列;将待检测语音系数序列输入至预先训练好的语音识别模型中,通过语音识别模型输出待检测语音片段中每一帧语音对应的语音识别结果。这样,通过训练可以确定待检测语音片段中的语音特征与时间相关性的语音识别模型,对待检测语音片段中的有效语音片段以及噪声片段进行准确地分析和识别,有助于提升对语音片段检测的准确率。
  • 音频系统及其控制方法、装置、电子设备-202210122712.5
  • 司梦轩;薛远华;黎启贤 - 北京小米移动软件有限公司
  • 2022-02-09 - 2023-08-18 - G10L25/60
  • 本公开涉及电子设备技术领域,具体提供了一种音频系统及其控制方法、装置、电子设备。一种音频系统包括扬声器组件、拾音器组件以及侧音管道,扬声器组件包括扬声器和出音管道,拾音器组件包括拾音器和拾音管道,侧音管道一端连通出音管道,另一端连通拾音管道,扬声器发出的语音信号中,通过出音管道的第二端进入拾音管道的第二端的第一语音信号的第一相位,与通过侧音管道进入拾音管道的第二语音信号的第二相位相反从而利用侧音管道的反相语音信号对进入拾音管道的回声信号进行降噪或消除,尤其利于扬声器大音量双讲场景,改善通话质量。
  • 串音数据检测方法、客户端和电子设备-201810763582.7
  • 许云峰;余涛;刘礼 - 阿里巴巴集团控股有限公司
  • 2018-07-12 - 2023-08-18 - G10L25/60
  • 本说明书公开了串音数据检测方法、客户端和电子设备,其中所述方法包括:接收第一音频数据块和第二音频数据块;其中,所述第二音频数据块的获取时间与所述第一音频数据块的获取时间趋于相同;从所述第二音频数据块中去除至少一部分与所述第一音频数据块具有相同声源的音频数据,得到对比第二音频数据块;在所述第二音频数据块与所述对比第二音频数据块的能量或者声压值不相同的情况下,认为所述第二音频数据块中具有串音数据。可以规避由于通道不同的差异造成的影响,提高检测的鲁棒性。
  • 一种嗓音检测方法及装置-202310534832.0
  • 张晓俊;赵登煌;朱欣程;孙晨昕;唐铭城;陶智 - 苏州大学
  • 2023-05-12 - 2023-08-15 - G10L25/60
  • 本发明提供了一种嗓音检测方法及装置,涉及声音检测技术领域。包括:将待检测语音信号输入可解释卷积滤波器组,得到多频带语音信号;利用一维深度可分离卷积神经网络的第一路径和第二路径分别提取多频带语音信号的时间特征和时频特征,并组合得到多频带语音信号特征向量;利用全连接网络对多频带语音信号特征向量进行分类得到分类结果,将分类结果作为待检测语音信号的异常指数。本发明使用可解释卷积滤波器组可以更好的捕捉待检测语音信号的频带信息,而一维深度可分离卷积神经网络可以分别提取多频带语音信号的时间特征和时频特征,增加了特征提取的有效性,使得该方法更具有可解释性,提高了嗓音检测结果的可靠性。
  • 一种语音对话质量评价方法、系统与便携式电子设备-202310345168.5
  • 秦思 - 湖北经济学院
  • 2023-04-03 - 2023-08-08 - G10L25/60
  • 本发明公开了一种语音对话质量评价方法、系统与便携式电子设备,属于语音质量评价技术领域。该方法包括:步骤S100:解析待评价语音对话获得第一交互属性;S200:将待评价语音对话切分为多个语音片段组;S300:获得每个语音片段组中每一个语音子片段的第二时长属性;S400:从每个语音片段组中确定至少一个候选子片段;S500:对已有的至少一种语音质量评价模型进行训练更新,得到更新后的语音质量评价模型;S600:将每个语音片段组中除候选子片段之外的语音子片段输入至更新后的语音质量评价模型中,得出每个语音片段组对应的目标人物的语音质量评价得分。本发明可准确实现多人物语音对话的无参考质量评分输出。
  • 数据处理方法、装置、电子设备以及计算机可读存储介质-202210476041.2
  • 曹磊;王洪斌;李长林 - 马上消费金融股份有限公司
  • 2022-04-29 - 2023-08-08 - G10L25/60
  • 本申请涉及数据处理技术领域,公开了数据处理方法、装置、电子设备以及计算机可读存储介质。该方法包括:获取N个待质检数据,N为正整数且大于或等于二;将N个待质检数据输入至质检模型进行类别预测,得到每个待质检数据对应的预测结果;基于每个待质检数据对应的预测结果确定N个待质检数据对应的预测类别分布;若预测类别分布不满足先验类别分布,则基于每个待质检数据对应的预测结果,从N个待质检数据中确定M个待质检数据,并对M个待质检数据的预测结果进行修正;其中,先验类别分布是基于样本数据集中各个样本数据对应的类别标签统计确定的,M为正整数,M小于或等于N。通过上述方式,能够提高待质检数据预测结果的准确性。
  • 基于质量对比学习的合成音质量评测模型的训练方法-202310623577.7
  • 秦勇;王卉;李起成;周家名;王雪琛;贺佳贝 - 南开大学
  • 2023-05-30 - 2023-08-01 - G10L25/60
  • 本发明属于计算机处理技术领域,更具体地,涉及一种基于质量对比学习的合成音质量评测模型的训练方法。该方法包括以下步骤:步骤S101,引入在大规模数据集上训练的模型作为预训练模型;步骤S102,设置中间任务,并定义正负样本,进行数据集中的正负样本划分;步骤S103,定义带权重的损失函数,控制训练目标,调整正负样本对表征的距离;步骤S104,在预训练模型基础上增加中间任务头,并按照上述规则进行训练;步骤S105,保留步骤S104阶段训练得到的特征提取部分,增加下游任务头,以最小化预测分数和标签分数的均方误差为目标进行训练。
  • 一种利用检索增强的非侵入式语音质量评测方法-202310623582.8
  • 秦勇;王卉;赵石顽;李起成;周家名;王雪琛;贺佳贝 - 南开大学
  • 2023-05-30 - 2023-07-28 - G10L25/60
  • 本发明涉及计算机处理技术领域,更具体地,涉及一种利用检索增强的非侵入式语音质量评测方法。该方法包括以下步骤:步骤S101,引入在大规模数据集上训练的模型作为预训练模型;步骤S102,将预训练模型作为特征提取器提取语音表征,并将多任务头作为分数解码器在MOS数据集上进行微调;步骤S103,收集表征‑分数键值对构建数据存储集;步骤S104,构建近邻学习网络,为每个语音实例动态调整近邻个数,得到检索分数;步骤S105,构建融合网络,为每个语音实例动态调整预测得分和检索得分比例,获得最终得分。
  • 一种语音数据的处理方法、装置、电子设备及存储介质-202310573990.7
  • 付凯奇;田霄海;李伟;马泽君 - 北京有竹居网络技术有限公司;脸萌有限公司
  • 2023-05-19 - 2023-07-28 - G10L25/60
  • 本公开提供了一种语音数据的处理方法、装置、电子设备及存储介质。包括:获取待识别的目标语音数据;检测目标语音数据得到目标特征序列以及目标时间序列,目标特征序列包括目标语音数据中各个音频帧对应音素的音素描述信息,目标时间序列包括目标语音数据中各个音素对应的时间信息;基于目标特征序列中的音素描述信息以及目标时间序列中的时间信息进行线性计算,得到目标语音数据对应的目标流利度。本公开通过提取语音数据的目标特征序列以及目标时间序列,通过目标特征序列中的音素描述信息以及目标时间序列中的时间信息能够准确的表达出细粒度的声学特征,为语音数据的流利度检测提供了可靠的依据,提高了流利度检测结果的可靠性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top