[发明专利]基于声音数据的角色分析方法、装置和计算机可读存储介质在审
| 申请号: | 201910210501.5 | 申请日: | 2019-03-19 |
| 公开(公告)号: | CN110459239A | 公开(公告)日: | 2019-11-15 |
| 发明(设计)人: | 朱浩华;吕嘉威;曹鹏程 | 申请(专利权)人: | 深圳壹秘科技有限公司 |
| 主分类号: | G10L21/028 | 分类号: | G10L21/028;G10L15/26 |
| 代理公司: | 44542 深圳市恒程创新知识产权代理有限公司 | 代理人: | 赵爱蓉<国际申请>=<国际公布>=<进入 |
| 地址: | 518000广东省深圳市光明新区凤凰*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音数据 角度数据 角色分析 计算机可读存储介质 麦克风设备 角色解析 角色数据 角色 | ||
本发明公开了一种基于声音数据的角色分析方法。该方法包括:获取所述声音数据和与所述声音数据所对应的角度数据;根据所述角度数据对所述声音数据进行角色解析,获得与所述声音数据对应的角色数据。本发明还公开了一种基于声音数据的角色分析装置及计算机可读存储介质。本发明能够实现提供一种新的音频角色分离方法,无需利用麦克风设备进行角色分离。
技术领域
本发明涉及录音识别领域,尤其涉及一种基于声音数据的角色分析方法、装置和计算机可读存储介质。
背景技术
在现代会诊过程中,经常涉及多人发言的情况,因此,在会议过程中使用的录音设备如果能够识别不同的人物角色即相应的说话内容显得格外重要,能大大提高会议的效率,简化会议记录的效果。
但是目前,在相关技术中,会议过程采用的会议录音系统中的角色分离大都通过连接多个麦克风设备,每个麦克风设备收集一名角色人员的音频信息来实现,而每个麦克风设备与主设备之间用连接线连接,连接距离有限且不易携带,因此给用户造成了极大的不便。
发明内容
本发明的主要目的在于提供一种基于声音数据的角色分析方法、装置和计算机可读存储介质,旨在实现提供一种新的音频角色分离方法,无需利用麦克风设备进行角色分离。
为实现上述目的,本发明提供一种基于声音数据的角色分析方法,所述基于声音数据的角色分析方法包括以下步骤:
获取所述声音数据和与所述声音数据所对应的角度数据;
根据所述角度数据对所述声音数据进行角色解析,获得与所述声音数据对应的角色数据。
可选地,所述根据所述角度数据对所述声音数据进行角色解析,获得与所述声音数据对应的角色数据的步骤之前包括:
将所述声音数据进行转换,得到文字数据;
所述根据所述角度数据对所述声音数据进行角色解析,获得与所述声音数据对应的角色数据的步骤替换为:
根据所述角度数据对所述文字数据进行角色解析,获得与所述文字数据对应的角色数据。
可选地,所述根据所述角度数据对所述文字数据进行角色解析,获得与所述文字数据对应的角色数据的步骤包括:
对所述文字数据根据所述角度数据进行划分,获得子文字数据和与所述子文字数据分别对应的子角度数据;
对所述子角度数据进行角色解析,获得与所述子文字数据所对应的多个角色数据。
可选地,所述对所述文字数据根据所述角度数据进行划分,获得子文字数据和与所述子文字数据分别对应的子角度数据的步骤包括:
对所述角度数据进行遍历,获得所述角度数据的变化节点;
根据所述变化节点对与所述角度数据对应的文字数据进行划分,得到子文字数据。
可选地,所述对所述子角度数据进行角色解析,获得与所述子文字数据所对应的多个角色数据的步骤包括:
对所述子角度数据利用预设公式进行计算,获得与所述子角度数据所对应的子文字数据的角色数据。
可选地,所述公式为:
dp=360/N,
R=(d-d0+dp-1)/dp,
其中,dp表示每个人占有角度的数值;R表示角色数据;d表示从合并文件中读到的角度值,取值范围为[0,360];d0是初始化的偏移角度值,取值范围为[0,30];N是参会人个数值。
可选地,所述基于声音数据的角色分析方法还包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹秘科技有限公司,未经深圳壹秘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910210501.5/2.html,转载请声明来源钻瓜专利网。





