[发明专利]一种识别方法、装置、用于识别的装置及语音合成方法在审
申请号: | 202110605363.8 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113409766A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 林国雯;周明;程龙;姜伟;曾可璇;段文君;刘恺;陈伟 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/047 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 方法 装置 用于 语音 合成 | ||
本发明实施例提供了一种识别方法、装置、用于识别的装置以及语音合成方法。其中的识别方法包括:识别目标文本中的对话文本;根据当前对话文本的上下文,确定所述当前对话文本的候选说话人;获取所述候选说话人与所述当前对话文本之间的关系特征;根据所述当前对话文本、所述当前对话文本的上下文、所述当前对话文本的候选说话人、以及所述关系特征,确定所述当前对话文本的至少一个目标说话人。本发明实施例可以自动识别目标文本中各对话文本的目标说话人,可以减少人工成本并且提高识别效率,还可以提高识别目标说话人的准确性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种识别方法、装置、用于识别的装置以及语音合成方法。
背景技术
有声文学作品受到越来越多的关注,对于多角色的文学作品,需要区分文学作品中各个对话所属的角色,使得不同角色的演播人能够快速准确地录制自己的台词部分。
然而,目前通常通过人工通读文学作品的方式识别文本作品中各个对话所属的角色,不仅需要耗费大量的人力成本而且识别效率较低。
发明内容
本发明实施例提供一种识别方法、装置、用于识别的装置以及语音合成方法,可以自动识别目标文本中各对话文本的目标说话人,可以减少人工成本并且提高识别效率。
为了解决上述问题,本发明实施例公开了一种识别方法,所述方法包括:
识别目标文本中的对话文本;
根据当前对话文本的上下文,确定所述当前对话文本的候选说话人;
获取所述候选说话人与所述当前对话文本之间的关系特征;
根据所述当前对话文本、所述当前对话文本的上下文、所述当前对话文本的候选说话人、以及所述关系特征,确定所述当前对话文本的至少一个目标说话人。
可选地,所述根据当前对话文本的上下文,确定所述当前对话文本的候选说话人,包括:
将所述当前对话文本的上下文逐句输入识别模型,识别所述上下文中的指称;
将识别的指称作为所述当前对话文本的候选说话人。
可选地,所述方法还包括:
识别所述目标文本中的各指称是否对应相同实体;
将对应相同实体的指称进行共指消解,得到同一角色的所有对话文本。
可选地,所述方法还包括:
获取所述目标文本中的目标对话文本以及所述目标对话文本的目标说话人;
根据所述目标对话文本的目标说话人的角色特征以及所述目标对话文本的对话场景特征,对所述目标对话文本进行语音合成,得到所述目标对话文本的语音合成数据。
可选地,所述根据所述当前对话文本、所述当前对话文本的上下文、所述当前对话文本的候选说话人、以及所述关系特征,确定所述当前对话文本的至少一个目标说话人,包括:
将所述当前对话文本、所述当前对话文本的上下文、所述当前对话文本的候选说话人、以及所述关系特征输入预测模型,预测每个候选说话人为目标说话人的得分;
根据预测的每个候选说话人的得分,从所述候选说话人中确定所述当前对话文本的至少一个目标说话人。
可选地,所述将所述当前对话文本、所述当前对话文本的上下文、所述当前对话文本的候选说话人、以及所述关系特征输入预测模型,预测每个候选说话人为目标说话人的得分,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110605363.8/2.html,转载请声明来源钻瓜专利网。