首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]语音交互设备的性能测试方法、装置、设备及可读介质在审

申请号：	202110232023.5	申请日：	2021-03-02
公开（公告）号：	CN114999454A	公开（公告）日：	2022-09-02
发明（设计）人：	陈世强	申请（专利权）人：	北京字节跳动网络技术有限公司
主分类号：	G10L15/01	分类号：	G10L15/01
代理公司：	北京市立方律师事务所 11330	代理人：	张筱宁
地址：	100041 北京市石景山区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音交互设备性能测试方法装置可读介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音交互设备的性能测试方法，其特征在于，包括：

向待测的语音交互设备发送测试音频信号，并记录所述测试音频信号的发送时间戳作为第一时间戳；

接收所述语音交互设备响应于所述测试音频信号而返回的测试过程数据，所述测试过程数据包括：针对所述测试音频信号经自动语音识别处理所得的第一文本、以及针对所述第一文本经自然语言处理所得的回复文本、以及所述回复文本经过语音合成所得的回复音频的播放时间戳；

根据所述第一文本和所述回复文本以及与所述测试音频信号对应的测试标注文本和回复标注文本，确定所述语音交互设备的语音识别准确率；

根据所述发送时间戳和所述播放时间戳，确定所述语音交互设备的性能耗时指标。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收所述语音交互设备响应于所述测试音频信号而返回的系统状态信息；

根据所述系统状态信息，确定所述语音交互设备的资源占用指标，所述资源占用指标包括工作进程的处理器占用信息、工作线程的处理器占用信息、工作进程的内存占用信息、工作线程的内存占用信息中的至少一项。

3.根据权利要求1所述的方法，其特征在于，在所述向待测的语音交互设备发送测试音频信号之前，所述方法还包括：

基于预设的语音指令集，从预设发音人的性别、所述预设发音人的年龄、所述预设发音人的地域、所述预设发音人的语速中的至少一项，从预设的语音指令集中选择匹配的语音指令作为所述测试音频信号。

4.根据权利要求1所述的方法，其特征在于，在所述向待测的语音交互设备发送测试音频信号之前，所述方法还包括：

根据选定的目标噪声场景类型，所述目标噪声场景类型包括安静场景或噪声场景；

调用与所述目标噪声场景类型对应的加噪处理方法，对所述语音指令集中被选定的语音指令进行加噪处理得到携带噪声的测试音频信号。

5.根据权利要求1所述的方法，其特征在于，所述根据所述发送时间戳和所述播放时间戳，确定所述语音交互设备的性能耗时指标，包括：

根据所述发送时间戳和针对所述测试音频信号的自动语音识别的结果时间戳，确定所述性能耗时指标包括的自动语音识别尾点耗时指标；其中，所述发送时间戳为语音活动检测判停时间戳；

根据所述发送时间戳和针对所述第一文本的自然语言处理的结果时间戳，确定所述性能耗时指标包括的针对所述第一文本的自然语言处理耗时指标；

根据所述发送时间戳和所述播放时间戳，确定所述性能耗时指标包括的交互耗时指标；其中，所述播放时间戳为针对所述回复文本的文本转语音处理的首包时间戳。

6.根据权利要求1-5所述的方法，其特征在于，在所述根据所述发送时间戳和所述播放时间戳，确定所述语音交互设备的性能耗时指标之后，还包括：

接收展示指令，所述展示指令包括用户选择的展示选项，所述用户选择的展示选项包括所述性能耗时指标包括的自动语音识别尾点耗时指标、所述性能耗时指标包括的自然语言处理耗时指标、所述性能耗时指标包括的交互耗时指标、语音识别准确率、资源占用指标中的至少一项；

以图表形式展示所述用户选择的展示选项对应的性能耗时指标。

7.根据权利要求5所述的方法，其特征在于，所述方法还包括：

当所述自动语音识别尾点耗时指标大于预设第一阈值，则进行报警，以用于表征所述自动语音识别尾点耗时指标不合格；

当所述自然语言处理耗时指标大于预设第二阈值，则进行报警，以用于表征所述自然语言处理耗时指标不合格；

当所述交互耗时指标大于预设第三阈值，则进行报警，以用于表征所述交互耗时指标不合格。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司，未经北京字节跳动网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110232023.5/1.html，转载请声明来源钻瓜专利网。

上一篇：一种铁路货车心盘座及其自动化焊接方法
下一篇：一种文档处理方法、装置、设备和介质

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top