[发明专利]语音处理方法、装置、存储介质及电子设备在审

专利信息
申请号: 202211362477.5 申请日: 2022-11-02
公开(公告)号: CN115841810A 公开(公告)日: 2023-03-24
发明(设计)人: 袁翔;张伟;张飞 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G10L15/01 分类号: G10L15/01;G10L15/08;G10L15/26;G10L15/30;G06F40/117;G06F40/30
代理公司: 北京恒博知识产权代理有限公司 11528 代理人: 范胜祥
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 本说明书公开了一种语音处理方法、装置、存储介质及电子设备,其中,方法包括:通过对目标语音数据进行语义识别处理以确定目标语音数据对应的至少一个目标语义标签,然后可以基于目标语音数据对应的各目标语义标签对参考语音集合进行语音匹配处理,可以得到目标语音数据对应的相似语音数据。
搜索关键词: 语音 处理 方法 装置 存储 介质 电子设备
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202211362477.5/,转载请声明来源钻瓜专利网。

同类专利
  • 语音唤醒的测试方法、存储介质及电子装置-202310973442.3
  • 侯玉坤 - 青岛海尔科技有限公司;海尔优家智能科技(北京)有限公司;海尔智家股份有限公司
  • 2023-08-03 - 2023-10-27 - G10L15/01
  • 本申请公开了一种语音唤醒的测试方法、存储介质及电子装置,涉及智能家居/智慧家庭技术领域,旨在解决语音唤醒测试的过程中,噪声干扰导致被测设备识别不准确的问题。为此目的,本申请的方法包括设置多个噪声设备的位置;基于多个噪声设备的位置控制阵列麦克风获取相应的声源信号,其中,声源信号至少包括被测设备的声源信号和唤醒语音播放设备的声源信号;选择性消除声源信号中的噪声;基于声源信号获取测试结果。通过上述实施方式,阵列麦克风能够定向获取语音唤醒测试过程中的声源信号,并消除噪声信号,确保只录制到唤醒语音播放设备和被测设备的声音,减少多声源复杂场景对被测设备识别过程的干扰,从而提高被测设备识别的准确性。
  • 语音唤醒方法、装置、电子设备及存储介质-202210369743.0
  • 刘梓城;史润宇 - 北京小米移动软件有限公司
  • 2022-04-08 - 2023-10-24 - G10L15/01
  • 本公开提出一种语音唤醒方法、装置、电子设备及存储介质,涉及语音交互技术领域。包括:确定获取的语音信号中每个音频帧属于每个音素的概率;以预设的步长及窗口长度,从语音信号中获取多个音频帧序列;根据每个音频帧序列中每个音频帧属于每个音素的概率及电子设备当前的唤醒词对应的参考音素序列,确定每个音频帧序列为唤醒序列的概率;在任一概率大于阈值的情况下,唤醒电子设备。由此,根据音频帧序列中每个音频帧属于每个音素的概率及参考音素序列,确定音频帧序列对应的概率,从而使得确定的音频帧序列为唤醒序列的概率更加准确,进而提高对电子设备进行语音唤醒的准确率,减少了误唤醒或唤醒失败的情况发生,提升了用户体验。
  • 人机语音交互测试方法、装置、计算机设备和存储介质-202111091294.X
  • 鲁昱;石真 - 深圳追一科技有限公司
  • 2021-09-17 - 2023-10-24 - G10L15/01
  • 本申请提供了一种人机语音交互测试方法、装置、设备和存储介质。该方法包括:基于与机器人的语音通话对机器人进行第一轮语音交互测试;针对第一轮语音交互测试中产生的用户语音数据,添加对用户语音数据识别的、且与应答相关的标签项;响应于纠正指令,将添加的错误的标签项进行纠正;添加了错误的标签项的用户语音数据为错误应答的用户语音数据;基于错误应答的用户语音数据,对机器人进行语音交互优化;在优化后,基于第一轮测试中的用户语音数据,进行第二轮语音交互测试;将第二轮语音交互测试时机器人针对用户语音数据的应答语句与用户语音数据对应的标签项匹配,根据匹配结果输出第二轮测试的测试结果。本申请的方案能够节省成本。
  • 一种语音功能测试系统-202321119197.1
  • 贺晋健;徐理明 - 上海集度汽车有限公司
  • 2023-05-10 - 2023-10-24 - G10L15/01
  • 本申请提供了一种语音功能测试系统,该语音功能测试系统包括:至少一个语音测试模组,每个语音测试模组包括:第一导轨、滑动装配在第一导轨上的第二导轨以及滑动装配在第二导轨的伸缩杆;其中,第二导轨的滑动方向与伸缩杆的滑动方向交叉;伸缩杆的伸缩方向分别与第二导轨的滑动方向以及伸缩杆的滑动方向相交;语音功能测试系统还包括与伸缩杆转动连接的测试模块;测试模块至少包括用于采集音频数据的麦克风,以及用于输出声音的扬声器。在上述技术方案中,通过采用第一导轨、第二导轨、伸缩杆以及测试模块组成一测试系统,从而可进行不同位置、不同的身高的场景测试,适应性比较强。另外,通过设备来代替检测,还可节省人力。
  • 一种基于人工智能的服务测试方法及装置-202010879057.9
  • 张杰;唐文 - 腾讯科技(深圳)有限公司
  • 2020-08-27 - 2023-10-13 - G10L15/01
  • 本申请提供了一种基于人工智能的服务测试方法、装置、电子设备及计算机可读存储介质;方法包括:响应于针对电子设备中服务的测试请求操作,根据语料输出用于测试所述电子设备的语音指令;对所述电子设备针对所述语音指令的响应过程进行图像采集,得到所述电子设备在所述响应过程中输出的图像数据;对所述图像数据进行识别处理,得到所述响应过程中的多个不同阶段的图像;呈现所述响应过程中的多个不同阶段的图像。通过本申请,能够自动化的测试服务从而提升测试效率。
  • 交互信息测试方法、装置、计算机设备及存储介质-201910198332.8
  • 刘丽珍;吕小立;刘芳 - 平安科技(深圳)有限公司
  • 2019-03-15 - 2023-10-13 - G10L15/01
  • 本发明实施例公开了一种交互信息测试方法、装置、计算机设备及存储介质,包括:获取预设的模板文本;根据所述模板文本诵读所述交互信息生成与所述交互信息对应的语音数据;将所述语音数据输入至语音转换模型中,以获取所述语音转换模型转换所述语音数据生成的转换文本;比对所述模板文本与所述转换文本的相似度,以获取所述语音转换模型转换的准确率。将转换文本与模板文本进行相似度比较,就能够获得语音转换模型转换的准确率。通过上传测试方法,能够模拟实际转换场景,得到转换准确率,有利于对语音转换模型进行优化,进一步地提高语音转换模型的转换效率。
  • 一种基于语义空间扰动的语音识别模型安全性测评方法-202311008778.2
  • 巴钟杰;王宇炜;程鹏;黄鹏;林峰;卢立;任奎 - 浙江大学
  • 2023-08-11 - 2023-10-13 - G10L15/01
  • 本发明公开了一种基于语义空间扰动的语音识别模型安全性测评方法,包括(1)选择目标指令,将指令文本输入给预训练语音合成模型获得命令的原始语义特征、原始梅尔频谱和原始对齐信息;(2)初始化特征扰动为0;(3)将特征扰动加到命令的原始语义特征上,将加扰后的语义特征输入给语音合成模型的解码器,获得新的梅尔频谱和新的对齐信息;(4)将获得的梅尔频谱进行模糊化,并输入声码器获得音频;(5)将音频输入给待测目标语音识别模型获得识别结果;(6)如果识别结果和目标命令相同则保留音频;(7)计算损失并更新特征扰动;(8)回到步骤(3)直到扰动超过阈值或到达最大迭代次数;(9)检查最终是否通过步骤(6)保留了音频。
  • 语音识别的评估方法、装置、设备及存储介质-202310806737.1
  • 董良 - 百度在线网络技术(北京)有限公司
  • 2023-07-03 - 2023-10-10 - G10L15/01
  • 本公开提供了语音识别的评估方法、装置、设备及存储介质,本公开涉及数据处理技术领域,尤其涉及人工智能、语音技术、语音识别技术领域。具体实现方案为:确定用户端上传的初始音频的第一识别文本;对用户端上传的第二音频进行语音识别,得到第二识别文本,其中,初始音频与第二音频关联;根据第一识别文本和上传文本,得到留存率参数,其中,上传文本基于第一识别文本得到;根据上传文本和第二识别文本,得到准确率参数;以及根据留存率参数和准确率参数,得到评估结果。本公开可以实时对语音识别结果进行客观评估,无需人工参与和标注。
  • 一种语音识别的测试方法、装置、设备及存储介质-202310968151.5
  • 徐昕;卜辉;张绍极;韦聪锦;刘运 - 北京希尔贝壳科技有限公司
  • 2023-08-02 - 2023-10-10 - G10L15/01
  • 本发明涉及语音识别的测试方法、装置、设备及存储介质,属于语音识别技术领域。本发明包括:获取智能座舱的测试任务,测试任务中包括测试音频参数和测试场景参数;根据测试音频参数,获取对应的原始音频数据,并根据测试场景参数,获取对应的背景音频数据;将原始音频数据和所述背景音频数据进行合成,得到测试音频数据,并向智能座舱播放测试音频数据;获取所述智能座舱对播放的测试音频数据的应答音频数据;根据所述原始音频数据与所述应答音频数据,计算得到所述智能座舱语音识别的测试结果。通过本发明,有助于解决现有技术中对于智能座舱语音识别的效果进行测试时,费时费力,且测试结果准确性较低的问题。
  • 语音产品的测试系统及相关方法、装置、设备和存储介质-202310713528.2
  • 宋若淼;凌然;吴江照;戚华威 - 合肥智能语音创新发展有限公司
  • 2023-06-14 - 2023-10-03 - G10L15/01
  • 本申请公开了一种语音产品的测试系统及相关方法、装置、设备和存储介质,其中,语音产品的测试系统包括:主控设备、声源设备和至少一种感知设备,声源设备与主控设备通信连接,并响应于主控设备发送的播放指令而对语音产品播放测试音频;至少一种感知设备分别与主控设备通信连接,感知设备感知语音产品对测试音频的响应结果,并将响应结果回传至主控设备,主控设备用于分析响应结果,得到表征语音产品交互性能的测试结果。上述方案,能够提升语音产品测试的安全性以及通用性。
  • 一种自动检测语音识别率的方法及系统-202310733303.3
  • 袁龙刚;黄斌 - 四川虹美智能科技有限公司
  • 2023-06-20 - 2023-10-03 - G10L15/01
  • 本发明公开了一种自动检测语音识别率的方法及系统,方法包括:读取本轮测试所设置的参数信息,并根据所读取的参数信息进行配置;所述参数信息包括:测试环境信息、测试距离信息和测试语音信息;根据识别词配置文件逐条获取待播放的识别词,并从语音库中对应命名的识别词文件中随机播放其中一条语料文件,获取相应的播放信息;将所获取的播放信息与所播放的识别词进行一一比对;重复上述步骤,直至所有播放的识别词比对完成,统计测试结果。本发明的方法及系统可以在提前预设好测试流程的情况下自动执行,最终生成被测试语音设备在安静及噪音不同环境下不同测试距离的语音识别结果,从而提高了检测语音识别率的准确性。
  • 基于用户评论中上下文的语音识别测试数据生成方法-202010756024.5
  • 陶传奇;曹冬玉;黄志球 - 南京航空航天大学
  • 2020-07-31 - 2023-10-03 - G10L15/01
  • 本发明公开了一种基于用户评论中上下文的语音识别测试数据生成方法,该方法从多个语音识别APP的用户评论中提取语音识别的上下文因素以及各因素之间的优先级和语义关联关系,并根据所选数据集提取上下文因素的值域,从而构建上下文分类树模型。该模型可根据具体的测试需求来对原始测试数据进行值域内的改动,从而生成更多可用的测试数据。本发明克服了智能系统更新频率快而导致测试数据严重不足的问题,同时利用了真实数据集的各个上下文因素的值域,为测试语音识别系统提供了快速生成真实测试数据的方法,有效提高了语音识别测试的效率,同时,也更有利于开发者对语音识别系统性能的了解,以便对系统更有针对性的升级更新。
  • 一种场景声音还原系统及方法-202310780863.4
  • 赵长彬 - 北京瑞森新谱科技股份有限公司
  • 2023-06-28 - 2023-09-29 - G10L15/01
  • 本说明书公开了一种场景声音还原系统及方法,涉及室内声学实验技术领域。系统包括多个可调吸声模块以及测试设备。可调吸声模块包括外壳、层叠收纳于该外壳中的多个吸声组件、带动多个吸声组件移动的伸缩组件以及用于固定可调吸声模块的固定组件。多个吸声组件可在该伸缩组件的推拉下移动,该多个吸声组件分别移动至各自对应的最远距离时,暴露于外的正面面积大于该外壳的正面面积。可见,该吸声组件的面积与该场景表面积的比例变化范围超过了百分之五十,并且,吸声材料的面积对空间内混响时间的大小存在较大影响。因此,该场景声音还原系统,能够在较大范围内调整该场景下的混响时间。
  • 语音交互满意度的评估方法、装置、设备和存储介质-202011393344.5
  • 李岩岩;窦德景 - 北京百度网讯科技有限公司
  • 2020-12-02 - 2023-09-29 - G10L15/01
  • 本申请公开了一种语音交互满意度的评估方法、装置、设备和存储介质,涉及人工智能技术领域,具体为自然语言处理、知识图谱、深度学习领域,可应用于用户意图理解。具体实现方案包括:获取多轮样本语音交互行为下的样本交互数据;对各样本交互数据进行特征提取,得到样本交互特征序列;获取各样本交互数据对应的满意度标注,得到满意度标注序列;利用多组样本交互特征序列和满意度标注序列,训练初始模型,得到满意度评估模型,满意度评估模型用于根据多轮待评估语音交互行为下的待评估交互数据,评估各轮待评估语音交互行为的满意度。本申请实施例的技术方案可以准确、高效地基于用户的多轮语音操作,进行用户意图理解的满意度评估。
  • 语音交互系统的评测方法、装置、电子设备和存储介质-202310622064.4
  • 李国琛 - 阿波罗智联(北京)科技有限公司
  • 2023-05-29 - 2023-09-22 - G10L15/01
  • 本公开提供了一种语音交互系统的评测方法、装置、电子设备和存储介质,涉及人工智能领域,尤其涉及语音技术、自然语言处理等领域。具体实现方案为:评测装置播放目标语音指令;其中,目标语音指令用于触发语音交互系统播放与目标语音指令对应的响应语音;确定目标语音指令与响应语音之间的匹配程度;根据匹配程度,确定语音交互系统针对目标语音指令的准确度信息;其中,准确度信息用于表征语音交互系统是否准确响应目标语音指令。根据本公开,可以高效且准确的对语音交互系统进行评测。
  • 语音识别纠错方法及装置、计算机设备和记录介质-201810606039.6
  • 李健;葛斯函;尹路通;薛思皓;段全盛 - 蔚来(安徽)控股有限公司
  • 2018-06-13 - 2023-09-19 - G10L15/01
  • 本发明涉及语音识别结果的纠错方法和装置、计算机设备、记录介质。该语音识别结果的纠错方法包括:步骤S1:以词语为单位将作为所述语音识别结果的语句拆分成若干个词语;步骤S2:对拆分得到的每个词语进行扩展,以获得每个词语对应的候选词语集合;步骤S3:利用所述每个词语对应的候选词语集合来构建与所述语句对应的候选语句集合;步骤S4:基于训练好的语言模型和音节相似度模型来对所述候选语句集合中的每一个候选语句进行评估;以及步骤S5:根据步骤S4中的评估结果来从所述候选语句集合中确定最优的候选语句作为纠错后的语音识别结果。
  • 一种离线语音识别产品的测试工具-202321357139.2
  • 建瑞民;蔡俊;胡君锋 - 广州安聚物联网科技有限公司
  • 2023-05-30 - 2023-09-19 - G10L15/01
  • 本申请公开了一种离线语音识别产品的测试工具,其包括电源模块、控制模块和检测模块,所述电源模块分别与所述控制模块和检测模块耦接,所述电源模块用于提供工作电压,所述控制模块包括用于呼叫唤醒词的唤醒子模块,所述检测模块包括主控子模块、用于接入待测产品的接入子模块、用于接收待测产品信号的接收子模块和用于输出反馈信号的指示子模块,所述接入子模块的信号端与所述接收子模块的第一类信号端耦接,所述接收子模块的第二类信号端与所述主控子模块第一类信号端耦接,所述指示子模块与所述主控子模块的第二类信号端耦接。本申请具有提高离线语音识别产品的质检质量的效果。
  • 一种智能燃气灶语音识别率测试方法-202310582014.8
  • 何正罡;孙琳;杨帆;汤恒;丁毅 - 浙江方圆检测集团股份有限公司
  • 2023-05-19 - 2023-09-15 - G10L15/01
  • 一种智能燃气灶语音识别率测试方法,包括以下步骤:步骤1:拾取语音源和噪声源,输出音频电压信号至上位机输入串口;步骤2:对音频电压信号进行滤波处理;步骤3:对去除杂音的音频电压信号进行重新编码;步骤4:收集信号单元,按照信号标签对信号单元分类储存为语音集单元信号和噪声集单元信号;步骤5:输出语音集信号单元至人工嘴BNC接口,人工嘴发声;步骤6:输出噪声集信号单元至扬声器USB接口,音响发声;步骤7:通过被测智能燃气灶反馈的声音或光学信号判断是否正确实现语音识别,如果错误识别,则记录一次;步骤8:播放完一组语音集后,统计智能燃气灶语音识别总体交互情况,计算识别成功率。本发明提高测试效率。
  • 一种语音测试方法、计算机设备及可读存储介质-202010278305.4
  • 孙振芳;黄世富;白俊杰 - 北京东舟技术股份有限公司
  • 2020-04-10 - 2023-09-12 - G10L15/01
  • 本申请提供了一种语音测试方法、计算机设备及可读存储介质,该方法包括接收音频测试文件,音频测试文件包括主叫终端发出的唤醒语音及被叫终端响应唤醒语音发出的回复语音;解析音频测试文件以生成测试音频波形曲线;根据测试音频波形曲线计算唤醒语音的结束时间及回复语音的开始时间的差值,以得到被叫终端的响应时间。通过上述方法,本申请能够减少测试误差,降低人工成本,提高测试结果的一致性及测试效率。
  • 脚本生成方法、装置及脚本生成系统-202310484974.0
  • 朱家婷 - 博泰车联网(南京)有限公司
  • 2023-04-28 - 2023-09-08 - G10L15/01
  • 本申请公开了一种脚本生成方法、装置及脚本生成系统,属于数据处理领域。脚本生成方法包括:响应于脚本录制开启指令,向被测设备发送测试开启指令,以使得被测设备在接收到语音信息的情况下,响应于语音信息,录制并存储语音信息,识别语音信息包括的指令关键字,执行指令关键字对应的处理操作,生成语音日志数据,语音日志数据至少记录有指令关键字以及语音信息的音频标识,音频标识用于指示语音信息的音频存储地址;接收被测设备发送的语音日志数据;基于语音日志数据,生成脚本文件,脚本文件至少包括指令关键字和音频标识。本申请提升了语音测试效率,降低语音测试的人工成本。
  • 基于人工智能的语音工单质检方法、装置、设备及介质-202310653099.4
  • 张博文 - 平安银行股份有限公司
  • 2023-06-02 - 2023-09-05 - G10L15/01
  • 本发明涉及人工智能及金融科技技术领域,公开了一种基于人工智能的语音工单质检方法、装置、设备及介质,包括:获取待质检的语音工单文件;识别出所述语音工单文件对应的目标语种;根据所述目标语种,将所述语音工单文件输入到与所述目标语种对应的语音转换模型中,输出文本文件;根据预设的质检评分维度和预设的评分规则对所述文本文件进行评分,获得每个所述质检评分维度对应的分数;根据各个所述质检评分维度对应的分数获取所述待质检语音工单文件的最终分数。本申请可以更加准确的根据消费者的语音来分析客服人员的服务是否能够满足消费者的诉求,提高对客服人员的服务质量的检测的准确率。
  • 语音芯片的测试方法、模块、装置和储存介质-202310657395.1
  • 许明伟;樊晓兵 - 深圳市汇芯通信技术有限公司
  • 2023-06-05 - 2023-09-01 - G10L15/01
  • 本发明提供一种语音芯片的测试方法、模块、装置和储存介质,其中,语音芯片的测试方法包括以下步骤:采集第一待检测音频数据,并记录第一待检测音频数据的标准文本,其中,第一待检测音频数据包括普通话和多种方言;将第一待检测音频数据输入语音芯片进行测试,获得第一测试结果;采集第二待检测音频数据,其中,第二待检测音频数据包括普通语音和唤醒关键词语音;将第二待检测音频数据输入语音芯片进行测试,获得第二测试结果。本发明通过两次检测,判断语音芯片的基本语言识别功能和唤醒功能,从而在出厂前检测其语音识别准确性,可以对语音芯片进行评级以及对不及格的语音芯片进行改进,防止劣质语音芯片进入市场,提高了用户的体验感。
  • 语音识别测试方法及装置-202210152338.3
  • 周丽君;周迅溢;郝征鹏 - 马上消费金融股份有限公司
  • 2022-02-18 - 2023-08-29 - G10L15/01
  • 本说明书实施例提供了语音识别测试方法及装置,其中,一种语音识别测试方法包括:在服务器的配置文件中设置活动语音检测参数的第一参数值,以用于所述服务器与客户端配合进行语音识别测试;读取测试日志中的语音识别测试结果,并根据所述语音识别测试结果和标注文件计算测试指标,所述测试日志在所述客户端生成;根据所述测试指标,在所述活动语音检测参数的取值域中确定所述活动语音检测参数的第二参数值;根据所述第二参数值更新所述第一参数值。采用本申请实施例可实现服务器与客户端配合进行的语音识别测试过程的自动化,有助于提升语音识别测试的效率。
  • 语音识别测试方法及装置-202210152341.5
  • 周丽君;蒋宁;周迅溢;王洪斌;吴海英;郝征鹏 - 马上消费金融股份有限公司
  • 2022-02-18 - 2023-08-29 - G10L15/01
  • 本说明书实施例提供了语音识别测试方法及装置,其中,一种语音识别测试方法包括:接收客户端按照并发控制参数发送的携带语音流的语音识别请求;响应于所述语音识别请求,基于活动语音检测参数对所述语音流进行活动语音检测,并根据检测结果提取所述语音流中的活动语音片段;将所述活动语音片段分别输入待测试的各语音识别算法进行语音识别测试;向所述客户端发送所述各语音识别算法在所述并发控制参数下的语音识别测试结果。本申请实施例通过活动语音片段来提升作为测试输入的语音质量,从而提升语音识别测试的准确率,同时提升语音识别测试的效率,并借助并发控制参数验证各语音识别算法在不同并发控制参数下的语音识别稳定性。
  • 基于韵律特征的合成语音检测方法-202310670395.5
  • 温正棋;汪涛 - 中科极限元(杭州)智能科技股份有限公司
  • 2023-06-07 - 2023-08-29 - G10L15/01
  • 本发明属于合成语音检测技术领域,特别涉及一种基于韵律特征的合成语音检测方法,其中,合成语音检测方法包括以下步骤:获取待检测语音信号;根据预设的第一方式对待检测语音信号进行处理,得到声学特征;根据预设的第二方式对待检测语音信号进行处理,得到韵律特征;将声学特征与韵律特征拼接,得到特征向量;将特征向量输入预设的神经网络模型进行检测,得到检测结果。本发明提供的合成语音检测方法,通过提取语音中的韵律特征来鉴别深度合成语音和真实语音,提高了语音鉴别的准确性和鲁棒性。
  • 语音识别模型的评估方法及装置、电子设备和存储介质-202310736927.0
  • 王伟戌 - 北京云思智学科技有限公司
  • 2023-06-20 - 2023-08-18 - G10L15/01
  • 本公开提供了一种语音识别模型的评估方法及装置、电子设备和存储介质,将待标注语音数据集划分为预设数量的数据分块;将预设数量的数据分块分别输入对应数量的语音识别模型,分别得到每个语音识别模型对应的识别结果集;从不同识别结果集中分别确定一个识别结果作为参考识别文本;在对参考识别文本进行标注处理后,基于标注后的参考识别文本依次对每个语音识别模型进行评估。与相关技术相比,通过在每个识别结果集中分别确定一个识别结果作为参考识别文本,于标注结果实现对每个语音识别模型的评估。通过交叉生成参考识别文本,能够减少参考识别文本的标注效果对语音识别模型的识别准确率的影响,进而能实现对语音识别模型的客观评估。
  • 一种语音置信度计算方法、系统、电子设备及介质-202210797323.2
  • 杨恒杰 - 北京数美时代科技有限公司;数美天下(北京)科技有限公司
  • 2022-07-06 - 2023-08-18 - G10L15/01
  • 本发明涉及一种语音置信度计算方法、系统、电子设备及介质,包括步骤:获取待处理语音;根据待处理语音,通过编码器,确定输出特征,输出特征表征了编码器提取出的语音的音频特征;根据输出特征,通过声学解码器,确定待处理语音对应的多个目标转译文本,以及每个目标转译文本对应的目标声学得分;根据输出特征和各个目标转译文本,通过语言解码器,确定每个目标转译文本对应的语言得分;根据输出特征、各个目标声学得分和各个语言得分,通过语音置信度模型,确定待处理语音的置信度。现有技术只利用了解码器输出的N个最优得分即判断出语音识别的置信度,缺少了更为丰富的声学编码和语言信息的问题。
  • 设备测试方法、装置、电子设备以及存储介质-202310637177.1
  • 刘真真;荆赫男 - 阿波罗智联(北京)科技有限公司
  • 2023-05-31 - 2023-08-15 - G10L15/01
  • 本公开公开了设备测试方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及语音测试、语音交互技术领域。具体实现方案为:响应于测试请求,基于测试请求携带的语音交互设备的设备类型信息,对语音交互设备进行唤醒测试,得到唤醒测试结果;在唤醒测试结果表示为唤醒成功的情况下,确定目标音频合成参数;以及基于目标音频合成参数,利用测试请求携带的文本样本集对语音交互设备进行测试,得到语音交互设备的测试结果。
  • 一种基于房间脉冲响应的语音后门验证方法和装置-202310533603.7
  • 卢立;陈锰;巴钟杰;林峰;任奎 - 浙江大学;浙江大学杭州国际科创中心
  • 2023-05-12 - 2023-08-15 - G10L15/01
  • 本发明公开了一种基于房间脉冲响应的语音后门验证方法,包括:获取目标语音模型的干净语音样本和其所在物理空间的属性信息;根据属性信息设定声学参数,并根据声学参数构建房间脉冲响应的条件向量;将条件向量与随机采样的隐向量拼接后输入房间脉冲响应生成器,合成房间脉冲响应信号作为动态触发器;使用动态触发器对干净语音样本进行投毒作为毒化语音样本,利用毒化语音样本和干净语音样本对目标语音模型进行训练,使得目标语音模型被受到感染并被注入后门;将受感染的目标语音模型部署后,正常说话发出语音以触发后门,从而验证目标语音模型的后门脆弱性,该方法有效提升语音后门的隐蔽性和鲁棒性,从而提供真实可靠的后门攻击测试。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top