[发明专利]一种数据处理方法和装置、一种用于数据处理的装置有效

申请号：	201910295565.X	申请日：	2019-04-12
公开（公告）号：	CN110148406B	公开（公告）日：	2022-03-04
发明（设计）人：	樊博;孟凡博;刘恺;段文君;陈汉英;陈曦;陈伟;王砚峰	申请（专利权）人：	北京搜狗科技发展有限公司;搜狗（杭州）智能科技有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;H04N7/14
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	莎日娜
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种数据处理方法装置用于
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种数据处理方法，其特征在于，用于问答交互的处理，所述方法包括：

确定目标实体图像对应的目标语音序列和目标图像序列；所述目标图像序列对应的模式包括：倾听模式、或者回答模式；在问题的输入过程中，所述目标图像序列对应的模式为倾听模式，所述目标图像序列对应第二实体状态，用于表征输出倾听状态文本情况下的实体状态；或者，在问题的输入完成后，所述目标图像序列对应的模式为回答模式，所述目标图像序列对应第一实体状态，用于表征输出答案文本情况下的实体状态；

对所述目标语音序列和所述目标图像序列进行融合，得到对应的目标视频，以向用户输出所述目标视频；所述目标视频包括：倾听模式对应的第一目标视频和回答模式对应的第二目标视频；

其中，依据衔接图像样本的学习，对所述目标图像序列对应的模式进行切换；所述衔接图像样本包括：依次出现的倾听模式对应的图像样本、以及回答模式对应的图像样本；所述衔接图像样本还包括：依次出现的回答模式对应的图像样本、以及倾听模式对应的图像样本。

2.根据权利要求1所述的方法，其特征在于，所述目标图像序列对应的图像特征包括如下特征中的至少一种：

表情特征；

唇部特征；以及

肢体特征。

3.根据权利要求1所述的方法，其特征在于，所述确定目标实体图像对应的目标语音序列和目标图像序列，包括：

依据问题相关文本，确定目标实体图像对应的目标语音序列和目标图像序列。

4.根据权利要求3所述的方法，其特征在于，所述确定目标实体图像对应的目标语音序列和目标图像序列，包括：

确定所述问题相关文本对应的目标语音序列；

依据语音特征序列与图像特征序列之间的映射关系，确定所述目标语音序列对应的目标图像序列；所述映射关系中所述语音特征序列与所述图像特征序列在时间轴上对齐；所述映射关系为依据时间轴对齐的语音样本和图像样本得到。

5.根据权利要求3所述的方法，其特征在于，所述确定目标实体图像对应的目标语音序列和目标图像序列，包括：