[实用新型]一种语音采集设备有效
申请号: | 202023183752.6 | 申请日: | 2020-12-25 |
公开(公告)号: | CN213694055U | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 邹凯文 | 申请(专利权)人: | 上海深聪半导体有限责任公司 |
主分类号: | H04R1/08 | 分类号: | H04R1/08;G10L15/26 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200232 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 采集 设备 | ||
本实用新型公开了一种语音采集设备,针对现有的需要人工采集及标注音频而导致的工作量大及效率低的问题,通过录入器预先记录录音者的个人信息;显示器显示需要录制的词条及词条的显示方式;音频采集器根据设置的采样频率、采样位数及声道数,采集录音者根据显示器中的词条发出的语音;音频处理器识别音频采集器采集的语音,并将识别后的语音显示器显示的词条进行对比;以及存储器自动存储所述音频处理器传送的音频文件,并以词条‑个人信息的方式进行命名。提升语音采集和标注的效率,减少人工,节约时间和成本。
技术领域
本实用新型属于语音采集的技术领域,尤其涉及一种语音采集设备。
背景技术
声音是一种由物体振动而产生的波,当物体振动时,使周围的窄气不断地压缩和放松,并向周围扩散,这就是声波,人可以听到的的声音频率范围是20Hz~20kHz。人可以听到声音的三个要素是音强、音调和音色,其中音强是声音的强度,取决于声间的振幅;音调与声音的频率有关,频率高则声音高,频率低则声音低;音色是由混入基音的泛音决定的。每个基音又都有固有的频率和不同音强的泛音,从而使得每个声音都具有特殊的音色效果。
音频技术包括音频采集(模拟音转换为计算机识别的数字信号)、语音解码/编码、文字-声音的转换、音乐合成、语音识别与理解、音频数据传输、音频视频同步、音频效果与编辑等。通常实现计算机语音输出有两种方法,分别是录音/重放和文字-声音转换。
其中,音频数据的采集,常见方法有3种:直接获取已有音频、利用音频处理软件捕获截取声音、用麦克风录制声音。
对于用麦克风录制声音,目前常用的方式是人工对着一张纸去一个一个念,然后念一个词条保存并命名一个音频,效率极低。也有通过全部念完词条,然后人工一个一个切割并标注音频。以上两种方式都需要大量的人工和时间,工作效率低,不能满足人们的需求。
实用新型内容
本实用新型的目的是提供一种语音采集设备,解决人工采集及标注音频工作量大及效率低的问题。
为解决上述问题,本实用新型的技术方案为:
一种语音采集设备,包括:
录入器,用于预先记录录音者的个人信息;所述个人信息包括性别、年龄、地区;
显示器,用于显示需要录制的词条及词条的显示方式;
音频采集器,用于根据设置的采样频率、采样位数及声道数,采集录音者根据所述显示器中的词条发出的语音;
音频处理器,用于识别所述音频采集器采集的语音,并将识别后的语音与所述显示器显示的词条进行对比;
存储器,用于自动存储所述音频处理器传送的音频文件,并以词条-个人信息的方式进行命名。
根据本实用新型一实施例,所述录入器为带输入法或个人信息选择项的触摸屏。
根据本实用新型一实施例,所述录入器为键盘。
根据本实用新型一实施例,所述显示器上设有数据输入接口,所述数据输入接口用于导入需要录制的词条。
根据本实用新型一实施例,所述显示器上设有词条列表选择键及显示方式选择键。
根据本实用新型一实施例,所述音频处理器包括停顿检测件及词条对比件;
所述停顿检测件用于检测所述音频采集器采集的语音是否存在达到预设时长的停顿,若存在,则停止采集语音,进行语音识别;
所述词条对比件用于将所述停顿检测件识别的语音与所述显示器显示的词条进行对比,判断是否一致,若一致,则进行音频标注后传送给所述存储器;若不一致,则丢弃语音。
本实用新型由于采用以上技术方案,使其与现有技术相比具有以下的优点和积极效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海深聪半导体有限责任公司,未经上海深聪半导体有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202023183752.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锤击辅助装置
- 下一篇:一种法学专业用案例教学展示装置