[发明专利]一种基于wav2vec的语气词插入的语音交互方法及系统有效
申请号: | 202210161459.4 | 申请日: | 2022-02-22 |
公开(公告)号: | CN114218424B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 李立峰;姜兴华;虞赵阳 | 申请(专利权)人: | 杭州一知智能科技有限公司 |
主分类号: | G06F16/632 | 分类号: | G06F16/632;G06F16/65;G06N3/08;G06Q30/02 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 311200 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于wav2vec的语气词插入的语音交互方法及系统,属于人工智能、语音识别技术领域。该方法中,训练中文语音环境下的wav2vec预训练模型;获取用户通话音频并标注语气词插入位置,作为音频语料;将音频语料进行切割,对每一个切割后的语音块设置插入标签或者不插入标签,将每一个带有标签的语音块作为一个样本,构成训练样本集;构建由wav2vec预训练模型和分类器组成的音频分类模型并进行训练,利用训练好的音频分类模型判断在人机语音交互过程中是否需要插入语气词,稳定性高,避免了随机插入的突兀性,无需依赖专业人员设计复杂的规则,准确性高。 | ||
搜索关键词: | 一种 基于 wav2vec 语气词 插入 语音 交互 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州一知智能科技有限公司,未经杭州一知智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210161459.4/,转载请声明来源钻瓜专利网。