[发明专利]语音房质量评估方法及其装置、设备、介质、产品在审
申请号: | 202210470807.6 | 申请日: | 2022-04-28 |
公开(公告)号: | CN114841143A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 李益永;温偲;陈建强;陈德健;项伟 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/30;G10L15/26;G10L25/51 |
代理公司: | 广州利能知识产权代理事务所(普通合伙) 44673 | 代理人: | 王增鑫 |
地址: | 511451 广东省广州市番*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 质量 评估 方法 及其 装置 设备 介质 产品 | ||
本申请涉及即时通信技术领域中一种语音房质量评估方法及其装置、设备、介质、产品,所述方法包括:获取单位时间段内语音房中的语音流,从所述语音流中识别出说话文本;构造所述说话文本的编码向量,该编码向量包含所述语音流的音源对象数量统计特征、发言总次数统计特征、所述说话文本中有效名词数量的统计特征;根据所述编码向量确定所述语音房的质量类别。本申请能够准确判别语音房所产生的语音流的质量类别,能够提升为平台用户推荐语音房的准确度,有助于活跃平台用户流量,提升平台用户驻存率。
技术领域
本申请涉及即时通信技术领域,尤其涉及一种语音房质量评估方法及其装置、设备、介质、产品。
背景技术
网络交互场景中,直播平台的用户之间能以语音的形式进行即时通信,因此衍生出具有即时通话性质的直播房间,具体可以是专用的语音房,语音房中的用户可以实现话题讨论、才艺展示、信息分享、知识教育等应用目的,能够促进整体社会效益。
直播平台通常并发支持海量的语音房,不同的语音房由于其中的发言用户的发言内容千差万别,表现出的质量也各有不同。平台出于向平台用户推荐语音房的需要,可以借助语音房质量评价技术辅助筛选优质的语音房。
传统的语音房质量评价技术,或采用语音特征输入预设模型进行识别,或采用语音转文字后的信息进行识别,实践中此类技术的评价效果均不佳,主要在于无论是语音特征还是语音文本,其原始信息由于用户发言情况的复杂性而导致内容掺杂而散乱,例如用户发言停顿过多、语气词过多、漫谈内容杂散、噪声过多等等,均会导致影响语音房质量评价效果,导致所确定的优质语音房的准确率不高,进而影响推荐效果。
有鉴于此,语音房质量评价技术仍有提升空间,其对于改进直播平台的服务具有基础性的作用。
发明内容
本申请的目的在于解决上述问题而提供一种语音房质量评估方法及其相应的装置、语音房识别设备、计算机可读存储介质以及计算机程序产品。
根据本申请的一个方面,提供一种语音房质量评估方法,包括如下步骤:
获取单位时间段内语音房中的语音流,从所述语音流中识别出说话文本;
构造所述说话文本的编码向量,该编码向量包含所述语音流的音源对象数量统计特征、发言总次数统计特征、所述说话文本中有效名词数量的统计特征;
根据所述编码向量确定所述语音房的质量类别。
根据本申请的另一方面,提供一种语音房质量评估装置,包括:
语音识别模块,用于获取单位时间段内语音房中的语音流,从所述语音流中识别出说话文本;
文本编码模块,用于构造所述说话文本的编码向量,该编码向量包含所述语音流的音源对象数量统计特征、发言总次数统计特征、所述说话文本中有效名词数量的统计特征;
质量识别模块,用于根据所述编码向量确定所述语音房的质量类别。
根据本申请的另一方面,提供一种语音房识别设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的语音房质量评估方法的步骤。
根据本申请的另一方面,提供一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的语音房质量评估方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
根据本申请的另一方面,提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210470807.6/2.html,转载请声明来源钻瓜专利网。