[发明专利]基于超声波唤醒语音助手的方法、装置、计算机设备及存储介质在审

专利信息
申请号: 201910858342.X 申请日: 2019-09-11
公开(公告)号: CN110600058A 公开(公告)日: 2019-12-20
发明(设计)人: 梁秋霞;陈煦文 申请(专利权)人: 深圳市万睿智能科技有限公司
主分类号: G10L25/51 分类号: G10L25/51;G10L25/18;G10L15/22;G10K15/04;G01S3/80
代理公司: 44242 深圳市精英专利事务所 代理人: 巫苑明
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于超声波唤醒语音助手的方法、装置、计算机设备及存储介质,方法包括:接收来自唤醒设备的超声波唤醒指令;分析接收到的超声波唤醒指令,得到频谱分析结果;将该频谱分析结果与预设超声波唤醒指令的频谱进行比对,判断是否相匹配;若匹配,则唤醒激活语音助手,并返回确认激活信息。本方案智能语音设备在待机态采集的是超声波音频,可避免智能语音设备在待机时实时侦听用户对话,保护用户隐私;此外,超声波音频识别技术实现难度可控,相较于现有通过统计模型或深度神经网络模型进行唤醒关键词识别,对CPU性能和内存容量要求大大减少,在保证识别精度和效率的同时减低了了识别装置的设置成本。
搜索关键词: 超声波 唤醒指令 频谱分析结果 智能语音设备 唤醒 匹配 语音 侦听 神经网络模型 音频识别技术 关键词识别 计算机设备 存储介质 唤醒设备 激活信息 内存容量 识别装置 统计模型 用户隐私 待机态 比对 待机 可控 频谱 预设 采集 激活 返回 对话 分析 保证
【主权项】:
1.一种基于超声波唤醒语音助手的方法,其特征在于,包括以下步骤:/n接收来自唤醒设备的超声波唤醒指令;/n分析接收到的超声波唤醒指令,得到频谱分析结果;/n将该频谱分析结果与预设超声波唤醒指令的频谱进行比对,判断是否相匹配;/n若匹配,则唤醒激活语音助手,并返回确认激活信息。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市万睿智能科技有限公司,未经深圳市万睿智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910858342.X/,转载请声明来源钻瓜专利网。

同类专利
  • 异常声音的分类方法和装置-201611262895.1
  • 秦宇;唐少华;李伟红;李正浩 - 杭州华为数字技术有限公司
  • 2016-12-30 - 2020-02-14 - G10L25/51
  • 本申请实施例提供了一种异常声音的分类方法和装置,该方法包括:对异常声音信号进行分帧处理,得到N帧信号,N为大于1的整数;根据滤波器模型对该N帧信号中的每帧信号进行滤波处理,得到该异常声音信号的能量特征信息,该滤波器模型包括M个子滤波器,该M个子滤波器中每个子滤波器的起始频率和截止频率组成的频率区间连续且互不重叠,且多个不同类型的异常声音信号样本的统计梅尔频谱在该M个子滤波器中的每个子滤波器上的输出能量的差值小于能量阈值,M为大于1的整数;根据该异常声音信号的能量特征信息,确定该异常声音信号的分类结果。采用本申请实施例提供的异常声音的分类方法和装置,能够提高异常声音分类的准确度。
  • 基于音频数据获取事件指示的方法和设备-201880039515.9
  • F·阿尔伯格;N·麦提森;P·帕派欧阿努 - 米纳特有限公司
  • 2018-06-13 - 2020-02-14 - G10L25/51
  • 一种由处理节点(10)执行的方法,包括以下步骤:i,从至少一个通信设备(100)获取(11)与声音相关联的音频数据(12),并将音频数据(12)存储(13)在处理节点(10)中;ii,获取(15)与声音相关联的事件指示(16),并将事件指示(16)存储(17)在处理节点(10)中;iii,确定(19)将音频数据(12)与事件指示(16)相关联的模型(20),并存储(21)模型;以及iv,向通信设备(100)提供(23)模型(20)。还描述了由通信设备(100)执行的方法以及用于执行这些方法的处理节点(10)、通信设备(100)、系统(1000)和计算机程序。
  • 一种基于人工智能的语音韵律评估方法及装置-201910969890.X
  • 林炳怀;王丽园 - 腾讯科技(深圳)有限公司
  • 2019-10-12 - 2020-02-11 - G10L25/51
  • 本发明提供了一种基于人工智能的语音韵律评估方法、装置、电子设备及存储介质;方法包括:接收待评估语音数据、以及所述待评估语音数据对应的文本数据;确定所述文本数据对应发音的韵律标准;对所述待评估语音数据进行韵律检测处理,得到所述待评估语音数据的发音特征和节奏特征;将所述发音特征与所述韵律标准中对应的标准发音特征进行对比,得到发音特征评估结果,以及将所述节奏特征与所述韵律标准中对应的标准节奏特征进行对比,得到节奏特征评估结果;通过决策树模型进行基于所述发音特征评估结果和所述节奏特征评估结果的评估处理,得到所述待评估语音数据的韵律评分。通过本发明,能够得到语音数据的准确韵律评分。
  • 一种智能匹配音效风格的汽车音响系统及其实现方法-201911062112.9
  • 郭桥生;康良军 - 朝阳聚声泰(信丰)科技有限公司
  • 2019-11-02 - 2020-02-11 - G10L25/51
  • 本发明涉及汽车音响系统领域,尤其涉及一种智能匹配音效风格的汽车音响系统及其实现方法,包括音源,所述音源通过信号线连接有中控主机,所述中控主机通过信号线连接有DSP芯片,所述DSP芯片通过信号线连接有功放IC,所述功放IC通过信号线连接有车内扬声器,所述DSP芯片包含与中控主机连接的音频曲线分析模块,所述音频曲线分析模块通过信号线连接有音效模式曲线对比模块,所述音效模式对比模块通过信号线连接有设定音效模式模块,所述设定音效模式模块连接前述功放IC。本发明可以自动匹配与音乐相适应的音效。
  • 基于响度凸显量的汽车传动系统瞬态冲击噪声评价方法-201911054915.X
  • 昌诗力;夏元烽;杨宪武;苏家杰;庞剑 - 重庆长安汽车股份有限公司
  • 2019-10-31 - 2020-02-07 - G10L25/51
  • 本发明涉及一种基于响度凸显量的汽车传动系统瞬态冲击噪声评价方法,包括以下步骤:步骤一,在试验车内布置传声器,将四个传声器分别布置在驾驶员右耳位置、副驾驶员右耳位置、后排左侧乘客右耳位置和后排右侧乘客右耳位置;步骤二,在不同工况下对试验车进行传动系统瞬态冲击噪声测试,并通过传声器采集测试过程中各工况下的噪声信号;步骤三,利用响度计算方法对采集到的噪声信号进行分析,得到随时间变化的响度曲线;步骤四,根据响度曲线,提取基准响度和冲击时刻的响度峰值,计算响度峰值和基准响度的差值得到响度凸显量,根据响度凸显量来评价汽车传动系统瞬态冲击噪声。上述的评价方法可有效、客观地评价汽车传动系统瞬态冲击噪声大小。
  • 一种汽车噪声不舒适度评价方法-201810817073.8
  • 王海军;常光宝;何嘉洋;顾晓丹;庞崇剑;黄煜;李豆 - 上汽通用五菱汽车股份有限公司
  • 2018-07-24 - 2020-02-04 - G10L25/51
  • 本发明公开一种汽车噪声不舒适度评价方法。所述方法包括:读取待评价汽车的噪声样本信号,计算每个噪声样本的响度、尖锐度、粗糙度和语音清晰度;按照不舒适度‑声品模型计算每个噪声样本的不舒适度,所述模型是一个以响度、尖锐度、粗糙度和语音清晰度为自变量、以不舒适度为因变量的线性函数;对噪声样本的不舒适度进行综合,得到待评价汽车噪声的综合不舒适度。本发明通过根据不舒适度‑声品模型计算噪声样本的不舒适度,能够更加真实地反映车内乘员对噪声的感受,解决了现有技术只根据噪声样本A声级大小对汽车噪声的不舒适度进行评价存在的准确度不高的问题。
  • 使用多个计算设备的对讲式通信-201880038644.6
  • 桑德罗·弗兹;塞巴斯蒂安·米柳斯;扬·奥尔索斯 - 谷歌有限责任公司
  • 2018-09-11 - 2020-01-31 - G10L25/51
  • 描述了与使用关于环境分布的多个计算设备的改进的对讲式通信相关的技术。在各种实施方式中,可以例如在多个计算设备的第一计算设备的麦克风处从第一用户接收语音输入。可以分析语音输入,并且基于该分析,可以确定第一用户旨在将消息传达给第二用户。可以确定第二用户相对于多个计算设备的位置,从而基于第二用户的位置,可以从多个计算设备中选择能够提供第二用户可感知的音频或视觉输出的第二计算设备。然后,第二计算设备可以被操作以提供将消息传达给第二用户的音频或视觉输出。
  • 一种变声识别方法及电子设备-201911040454.0
  • 盛玉娇;程慧莲 - 维沃移动通信有限公司
  • 2019-10-29 - 2020-01-24 - G10L25/51
  • 本发明实施例提供了一种变声识别方法及电子设备。所述方法包括:获取目标声音数据;对所述目标声音数据进行预处理,得到声音信号序列,所述声音信号序列包括至少两个声音信号以及每个所述声音信号的特征值,所述特征值至少包括基音以及共振峰;将所述声音信号序列输入至预设的变声识别模型,输出识别结果,所述识别结果用于指示所述目标声音数据是否经过变声处理。本发明实施例实现了对目标声音数据进行变声识别,避免变声功能被应用于非正常场景中导致不良后果。
  • 车辆警示音的判别装置-201920258556.9
  • 李丽;沈秋萍;翟天尔 - 上汽通用汽车有限公司;泛亚汽车技术中心有限公司
  • 2019-02-28 - 2020-01-24 - G10L25/51
  • 本实用新型提供一种车辆警示音的判别装置,包括:麦克风,设置于车辆的驾驶位上,用于接收所述车辆发出的车辆警示音,并将所述车辆警示音转换成电信号输出;转换组件,其输入端与所述麦克风的输出端连接,所述转换组件接收所述麦克风输出的所述电信号,并将所述电信号转换为数字信号输出;计算机,配置有通讯端口,所述通讯端口与所述转换组件的输出端连接;所述计算机接收所述数字信号,若所述数字信号的特征与存储的标准警示音信号的特征相同,则提示所述车辆警示音正确。上述方案能够对车辆警示音进行量化,便于车辆警示音的判别。
  • 基于BP神经网络的电除尘火花放电识别方法-201910990085.5
  • 江莺;谢加武;段峥;张梦琦;宋任刚;仇杨华;戚明阳;杨灿云;陈心愉;俞铭津;殷红莲;倪晓宇 - 南京林业大学
  • 2019-10-17 - 2020-01-17 - G10L25/51
  • 本发明公开了基于BP神经网络的电除尘火花放电识别方法,包括:采集声音信号,得到PCM音频数据;对音频数据预处理;提取音频数据的MFCC、短时能量和短时过零率三种特征参数;建立BP神经网络火花放电音频识别模型;将采集多组的声音信号的三种特征参数作为声音样本;对BP神经网络火花放电音频识别模型进行训练和测试;将采集的待识别声音信号进行三种特征参数的提取,将三种特征参数输入到已达到要求的BP神经网络火花放电音频识别模型中,完成电除尘火花放电声音的识别。本发明采用声音识别的方法,采集火花放电的声音信号,提取其时域特征和频域特征,并利用BP神经网络建立二分类模型来识别火花放电信号。
  • 一种异常声音信号的检测方法及装置-201611219466.6
  • 秦宇;唐少华;杨利平;龚卫国 - 华为技术有限公司
  • 2016-12-26 - 2020-01-17 - G10L25/51
  • 本发明公开了一种异常声音信号的检测方法及装置。本发明方法包括:检测装置获取待检测声音信号;根据预设的时间划分规则,将该声音信号从时域上划分为N个相邻的声音片段;计算N个声音片段中每个声音片段的信号能量,按照预设的能量等级划分规则,确定N个声音片段分别对应的能量等级;检测装置根据第i个声音片段到第i+1个声音片段对应的能量等级的变化,确定用于表示该声音信号能量等级的变化特征的第一特征向量;检测装置计算第一特征向量与已知的用于表示异常声音信号能量等级的变化特征的特征向量的契合度,在契合度达到预设标准时,判断该声音信号为异常声音信号。本发明能够实现异常声音信号的有效检测。
  • 语音处理装置和语音处理方法-201510920109.1
  • 外川太郎;盐田千里;香村纱友梨;大谷猛 - 富士通株式会社
  • 2015-12-11 - 2020-01-17 - G10L25/51
  • 本公开涉及语音处理装置和语音处理方法。该语音处理装置包括:检测单元,其被配置成检测第一语音中包括的第一发声部分和第二语音中包括的第二发声部分;指定单元,其被配置成指定重叠部分,在该重叠部分之内,第一发声部分和第二发声部分彼此重叠;计算单元,其被配置成计算从重叠部分的起点至第一发声部分的终点的第一发声持续部分;以及评价单元,其被配置成至少基于与第一发声持续部分的长度有关的信息来评价关于第一语音的印象。
  • 一种智能人因风险监测系统-201822274042.0
  • 汤凯;汤适尘;罗小华;蒋重文;曾一鑫 - 宁波欧依安盾安全科技有限公司
  • 2018-12-31 - 2020-01-10 - G10L25/51
  • 本实用新型涉及一种智能人因风险监测系统,包括声音采集器、身份识别器、声音识别器、处理器、会议记录器,声音识别器与声音采集器通信连接,处理器分别与身份识别器、声音识别器通信连接,会议记录器分别与身份识别器、处理器通信连接。本实用新型中的智能人因风险监测系统可以监控各参会人员对会议的贡献度和参与度,进而根据会议上的讨论情况提前预警因人因风险而可能会在作业中带来的风险问题。决策者可以根据该风险预警信息来调整作业人员,或者采取能够补救风险问题出现的办法,进而保证作业安全,有效的实现作业情况的提前预警,大大降低了“人因风险”对作业安全性的影响。
  • 一种控制声波的检波识别方法-201910879594.0
  • 朱建国;何瑞昱 - 深圳市欧润特科技有限公司
  • 2019-09-18 - 2020-01-03 - G10L25/51
  • 本发明涉及声波识别技术领域,具体地说,涉及一种控制声波的检波识别方法,其包括以下步骤:打开软件,启动声波识别模块;读取声波信号;对声波信号进行加窗变换,将时域信号转换为频域信号;判断是否出现特征信号;若是,执行相应功能模块,然后进行下一步;若否,直接进行下一步;判断是否为连续检测工作,若是,返回步骤二,重复步骤;若否,则退出结束。本发明成本低,容量大,控制灵敏度和识别率较高。
  • 一种语音信号清晰度的确定方法及装置-201610387091.8
  • 陈霏 - 南方科技大学
  • 2016-06-01 - 2019-12-31 - G10L25/51
  • 本发明实施例公开了一种语音信号清晰度的确定方法及装置。该方法包括:获取带噪声语音信号的语音信号动态范围;基于带噪声语音信号的语音信号动态范围与语言清晰度之间的数学模型确定所述带噪声语音信号的语言清晰度。本发明实施例通过采用上述技术方案,采用语音信号的动态范围作为特征计算噪声环境下的语音信号清晰度,计算过程不需要使用干净的无噪声语音信号,能够有效地减少计算噪声环境下语音信号清晰度时所需的操作步骤,提高语音信号清晰度的获取速度,减小噪声环境下语音信号清晰度的计算难度,增大语音信号清晰度确定方法的适用范围。
  • 一种佩戴耳机状态下识别外界声音的方法和系统-201910785371.8
  • 张燕;姚康;李保民;范文伟;华中南 - 苏宁智能终端有限公司
  • 2019-08-23 - 2019-12-27 - G10L25/51
  • 本发明公开了一种佩戴耳机状态下识别外界声音的方法和系统,所述方法包括:传声器在耳机佩戴后自动采集耳机外界音源信息,将所述外界音源信息转换为数字信息后传递至智能终端;利用所述智能终端对所述数字信息进行识别和分析,并通过所述智能终端的语音识别系统判断,再根据所述外界音源信息内容,对所述外界音源信息进行音源紧急度划分;所述智能终端根据所述音源紧急度设置提醒等级,对连接于所述智能终端的提醒设备发出智能提醒,通过智能终端对所述外界音源信息进行识别和分析,识别出各种声音的距离、方向和紧急度等,将可能产生的危险程度及时、准确的传递到耳机佩戴者的脑中,便于耳机佩戴者及时作出相应的反应,提高耳机佩戴者的安全性。
  • 语音质检方法及装置-201910735890.3
  • 张子奇 - 深圳市云之音科技有限公司
  • 2019-08-09 - 2019-12-20 - G10L25/51
  • 本申请适用于语音技术领域,提供了语音质检方法,包括:获取客服人员和客户的通话语音;获取所述通话语音对应的文本数据;根据所述文本数据确定所述客服人员的话语表述准确度。通过上述方法,能够提高评价客服人员的工作质量的客观性,从而提高评价结果的准确性。
  • 基于超声波唤醒语音助手的方法、装置、计算机设备及存储介质-201910858342.X
  • 梁秋霞;陈煦文 - 深圳市万睿智能科技有限公司
  • 2019-09-11 - 2019-12-20 - G10L25/51
  • 本发明涉及一种基于超声波唤醒语音助手的方法、装置、计算机设备及存储介质,方法包括:接收来自唤醒设备的超声波唤醒指令;分析接收到的超声波唤醒指令,得到频谱分析结果;将该频谱分析结果与预设超声波唤醒指令的频谱进行比对,判断是否相匹配;若匹配,则唤醒激活语音助手,并返回确认激活信息。本方案智能语音设备在待机态采集的是超声波音频,可避免智能语音设备在待机时实时侦听用户对话,保护用户隐私;此外,超声波音频识别技术实现难度可控,相较于现有通过统计模型或深度神经网络模型进行唤醒关键词识别,对CPU性能和内存容量要求大大减少,在保证识别精度和效率的同时减低了了识别装置的设置成本。
  • 信息处理设备-201880029172.8
  • 泽田充奖;小山裕一郎 - 索尼公司
  • 2018-03-13 - 2019-12-20 - G10L25/51
  • 本发明使得可以用很少的计算量检测来自特定位置的音频。该信息处理设备包括音频获取单元、可靠性生成单元和处理执行单元。音频获取单元获取环境音频。可靠性生成单元基于预定传播属性生成可靠性,该可靠性指示所获取的音频来自特定位置的程度。音频相位差或声学特性可以被设想为预定的传播特性。处理执行单元执行根据生成的可靠性的处理。根据可靠性的通知或预定命令的执行可以被设想为根据可靠性的处理。
  • 基于语音相似度的语音评测方法及系统-201610934106.8
  • 戴晓澄;曹昊;黄盼 - 云知声(上海)智能科技有限公司
  • 2016-11-01 - 2019-12-13 - G10L25/51
  • 本发明涉及一种基于语音相似度的语音评测方法,包括如下步骤:提供训练数据集;利用所述训练数据集对动态时间规整算法和支持向量顺序回归算法进行算法训练,以获得相似度评分模型;提供参照语音信息;录制模仿朗读所述参照语音信息的模仿语音信息;提取所述参照语音信息中的参照语音特征序列集和所述模仿语音信息中的模仿语音特征序列集;以及向所述相似度评分模型输入所述参照语音特征序列集和所述模仿语音特征序列集,获得所述模仿语音信息和所述参照语音信息的相似度评分值并输出。本发明的语音相似度的评测方法在对发音正确性进行考核的基础上,增加了对发音模仿程度的评估,可帮助用户有针对性的进行模仿练习,提高发音水平。
  • 语音检测方法、系统、计算机设备及计算机存储介质-201910837393.4
  • 卢显锋 - 平安科技(深圳)有限公司
  • 2019-09-05 - 2019-12-03 - G10L25/51
  • 本发明实施例提供了一种语音检测方法,方法包括:获取目标用户的待评估发音数据;将待评估发音数据进行向量化处理得到待评估发音数据矩阵;根据动态时间规整算法计算待评估发音数据矩阵与多个预设音频数据矩阵的匹配值,每个预设音频数据矩阵对应一个词汇的发音数据,该发音数据为标准发音数据或错误发音数据;将匹配值最高的预设音频数据矩阵确定为目标发音数据矩阵;将目标发音数据矩阵对应的发音数据确定为目标音频数据;及根据目标音频数据生成待评估发音数据的发音检测数据,并将发音检测数据推送至目标用户的终端。通过使用动态规整算法进行矩阵的计算,对待评估发音数据的进行最优匹配,使得到的发音检测数据更为准确。
  • 音频编码方法和装置-201580013802.9
  • 艾力克·诺维尔;沃洛佳·格兰恰诺夫 - 瑞典爱立信有限公司
  • 2015-03-13 - 2019-12-03 - G10L25/51
  • 用于对音频信号进行编码的编码器和其中的方法,其中音频信号的频谱被分成第一区域和第二区域,其中至少第二区域包括多个频带。此外,通过第一编码方法对第一区域中的谱峰进行编码。本文提供的方法包括:针对音频信号的片段,确定第二区域中的频带的能量和第一区域的能量估计之间的关系;确定第二区域的中的频带的能量和第二区域中的相邻频带的能量之间的关系;确定可用的比特数量是否足以用于对第一区域的至少一个非峰值片段和第二区域中的频带进行编码。此外,当上述关系满足各自的预定准则且比特数量足够时,使用第二编码方法对第二区域中的频带和第一区域的至少一个片段进行编码。否则,代之为对第二区域中的频带进行BWE或噪声填充。
  • 机场周围飞机噪声环境标准评价方法-201910680087.4
  • 王柯;陶善高;于巧银;张刚;张杰 - 安徽工和环境监测有限责任公司
  • 2019-07-26 - 2019-11-29 - G10L25/51
  • 机场周围飞机噪声环境标准评价方法。读取有效感觉噪声级、A声级最大值、实际持续时间等参数,并记录飞行时间、状态、机型等测量条件;一次飞行事件的有效感觉噪声级可以从仪器中直接读取;一个测点的N次事件的噪声级是N个有效感觉噪声级的能量平均值LEPN,用在单个飞行事件的基础上,计算相继N次事件所引起的噪声级;对一段监测时间内的连续噪声级评价量一昼夜的计权有效连续感觉噪声级LWECPN;采用一昼夜计权等效连续感觉噪声级LWECPN作为评价量。本发明监测不同点位的飞机起飞、降落时间微小的差异,针对白天、傍晚、夜间的环境背景噪声级差异,作出不同环境背景噪声下的测量结果和标准,完善机场周围飞机噪声的测量方法。
  • 一种智能化变电站室内音频监测模块-201910631573.7
  • 韩浩江;吴昊;周鸣;沈贤杰;柴俊;董培萌;孙雷;郭佳田;胡蕊;王婧 - 国网上海市电力公司;上海电力实业有限公司
  • 2019-07-12 - 2019-11-26 - G10L25/51
  • 一种智能化变电站室内音频监测模块,属监测领。包括外壳,在外壳内集成由主控单元、电源管理单元、串口通信单元、远程通信单元和音频采样单元;在外壳上安装显示单元和拾音器;具备音频采样、音频数据分析处理、人机交互、故障识别、故障报警和远程通信功能,实现对变电站室内目标区域24h实时监测;将采样数据以及分析结果实时传送到远程监控终端用于信息汇总和二次分析。其采集收集变电站室内关键运行设备的音频,通过音频文件提取有用的数据和信息,识别电力设备和系统的正常/异常状态,能够实现故障预警和故障精确定位的作用,替代人完成定期巡检和数据记录等工作。可广泛用于无人值守变电站的运行监控和管理领域。
  • 音频输出效果的监测方法、装置、介质及电子设备-201910708616.7
  • 张磊;于波;李北南 - 腾讯科技(深圳)有限公司
  • 2019-08-01 - 2019-11-26 - G10L25/51
  • 本申请的实施例提供了一种音频输出效果的监测方法、装置、介质及电子设备。该音频输出效果的监测方法包括:与音频效果测试终端建立连接;播放指定音频源;获取所述指定音频源在播放时产生的音频数据;将所述音频数据传输至所述音频效果测试终端,以使所述音频效果测试终端输出所述音频数据,并提取所述音频数据的声学信息进行展示。本申请实施例的技术方案可以提高音频输出效果的测试效率,并且能够实现音频输出效果的可视化,进而便于对终端的音频输出效果进行测试。
  • 一种基于机器学习对于振铃进行分类的方法-201910782784.0
  • 周继敏 - 百可录(北京)科技有限公司
  • 2019-08-23 - 2019-11-26 - G10L25/51
  • 本发明涉及一种基于机器学习对于振铃进行分类的方法。该方法包括:基于电话没有接通的原因,使用标签来对不同的振铃样本加上标记,并且将所述振铃样本切割成片段;其中,所使用的标签包括以下中的一个:号码为空号、线路正忙、无人接听、电话被挂断、号码已停用、来电被屏蔽、不知原因无法接通;其中,所使用的标签使用Session Initiation Protocol(SIP)响应码来进行验证;所标记的片段用于训练机器学习模型,所述机器学习模型可用于对未接通的电话进行自动分类。本发明解决了如何利用机器学习技术为企业自动分类未接通电话的问题,使得用户可以使用本发明的机器学习分类模型的结果数据来了解未接通调用的性质。
  • 无参考音频客观质量评价方法、装置及存储介质-201910788711.2
  • 王展;胡小鹏;顾振华 - 苏州科达科技股份有限公司
  • 2019-08-26 - 2019-11-26 - G10L25/51
  • 本申请涉及一种无参考音频客观质量评价方法、装置及存储介质,属于音频质量评价技术领域,该方法包括:获取待评价音频数据的评价参考信息;对评价参考信息进行预处理,得到预处理后的评价参考信息;将预处理后的评价参考信息输入预先训练的客观质量评价模型,得到待评价音频数据的客观质量评价结果;客观质量评价模型是使用多组训练数据进行训练得到的,每组训练数据包括样本评价参考信息和样本质量评价结果,样本质量评价结果是对在样本评价参考信息下的样本音频数据进行主观打分得到的;使得终端无需消耗计算资源来计算训练数据中的样本质量评价结果,可以节省终端的计算资源。
  • 检测说话人欺骗攻击的优化方法及系统-201910858649.X
  • 俞凯;王鸿基;丁翰林 - 苏州思必驰信息科技有限公司;上海交通大学
  • 2019-09-11 - 2019-11-19 - G10L25/51
  • 本发明实施例提供一种检测说话人欺骗攻击的优化方法。该方法包括:接收带有真实标签或欺骗标签的训练数据集,对训练数据集内的各音频进行前端特征提取,获得各音频的频谱特征,对频谱特征进行随机遮掩;将随机遮掩后的各频谱特征输入至神经网络模型,通过神经网络模型确定出随机遮掩后各音频的后验概率,根据真实标签或欺骗标签以及随机遮掩后各音频的后验概率对神经网络模型进行训练,确定说话人欺骗攻击检测模型;将待测音频输入,确定欺骗攻击检测结果。本发明实施例还提供一种检测说话人欺骗攻击的优化系统。本发明实施例通过改进的频谱特征的数据增强,可以在数据量受限的训练数据集上训练,得到泛化性能较高的模型,提高系统的整体性能。
  • 变声检测方法、终端及计算机可读存储介质-201910777108.4
  • 陈昊亮;罗伟航;张国梁 - 广州国音智能科技有限公司
  • 2019-08-21 - 2019-11-15 - G10L25/51
  • 本发明公开了一种变声检测方法、终端及计算机可读存储介质,该方法包括:通过在接收到检测请求时,获取待检测对象信息,并检测待检测对象是否符合对应的预设条件,若符合,则获取对应的待测语音数据,检测该待测语音数据是否符合预设变声检测语音条件,若符合,则通过预设变声检测模型,获取对应的待测声纹特征信息及语音伪造判决结果,并检测该预设声纹特征数据库是否为最新已更新状态,若是,则获取该待测声纹特征信息对应的预设声纹特征信息,并计算该待测声纹特征信息与该预设声纹特征信息之间的匹配度,确定该待测语音数据是否为人工伪造语音数据。从而解决了人工伪造语音检测准确度不高的技术问题,提高了待测语音数据检测准确度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top