[发明专利]处理方法和装置、用于处理的装置有效
申请号: | 201711208117.9 | 申请日: | 2017-11-27 |
公开(公告)号: | CN108231059B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 王佳;黄志鹏;林楷;王永鑫;李嘉锋;李俊晨 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 方法 装置 用于 | ||
本发明实施例提供了一种处理方法和装置、一种用于处理的装置,其中的方法具体包括:接收文本;确定所述文本对应的内容要素信息;所述内容要素信息包括:角色信息和/或情绪信息;依据所述内容要素信息对所述文本进行语音合成,以得到与所述内容要素信息相匹配的语音。本发明实施例可以将已有文本加工成为更生动、富有情感的语音表现形式,提高文本所对应语音的丰富度和表现力。
技术领域
本发明涉及处理技术领域,特别是涉及一种处理方法和装置、一种用于处理的装置。
背景技术
讲故事是一种传统的教育方式,用于帮助儿童了解世界、传递价值观、知识和信仰;同时,讲故事是儿童社会和认知能力开发的重要环节,在儿童的成长中扮演着重要的角色。
目前的讲故事技术可以包括:专人录制技术和语音合成技术。其中,专人录制技术可以通过专人讲述整篇故事,语音合成技术又称文语转换(TTS,Text-to-Speech)技术,其将故事文本转换为故事语音。
然而,在实际应用中,专人录制技术的制作成本较高,并且,专人录制的故事语音通常由一个人来讲述,导致故事语音较为单一。而语音合成技术得到的故事语音往往缺乏情感表达,导致故事语音的表现力不够丰富。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的处理方法、处理装置及用于处理的装置,本发明实施例可以将已有文本加工成为更生动、富有情感的语音表现形式,提高文本所对应语音的丰富度和表现力。
为了解决上述问题,本发明实施例公开了一种处理方法,包括:
接收文本;
确定所述文本对应的内容要素信息;所述内容要素信息包括:角色信息和/或情绪信息;
依据所述内容要素信息对所述文本进行语音合成,以得到与所述内容要素信息相匹配的语音。
可选地,所述角色信息包括:角色实体,所述确定所述文本对应的内容要素信息,包括:
对所述文本进行命名实体识别,并从得到的识别结果中获取所述文本对应的角色实体。
可选地,所述角色信息还包括:角色标签,所述角色标签用于表征所述角色实体对应的特征。
可选地,所述角色标签包括:性别标签、年龄标签和性格标签中的至少一种。
可选地,所述确定所述文本对应的内容要素信息,包括:
将所述文本中的词汇与情绪词典进行匹配,并依据匹配结果确定所述文本对应的情绪信息;和/或
采用情绪分类模型,确定所述文本对应的情绪信息;和/或
对所述文本进行句法分析,并依据句法分析结果确定所述文本对应的情绪信息。
可选地,所述依据所述内容要素信息对所述文本进行语音合成,包括:
依据所述内容要素信息、以及内容要素信息与语音参数之间的映射关系,确定所述内容要素信息对应的目标语音参数;
依据所述目标语音参数对所述文本进行语音合成,以得到与所述内容要素信息相匹配的语音。
可选地,所述方法还包括:
确定与所述内容要素信息相匹配的背景音频;
为与所述内容要素信息相匹配的语音添加对应的背景音频。
可选地,所述内容要素信息还包括:场景信息。
可选地,所述方法还包括:
接收用户的问题信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711208117.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音辅助测试系统及语音辅助测试方法
- 下一篇:一种文本转化成语音的方法及装置