[发明专利]数据处理方法、装置、服务器及存储介质在审

申请号：	201910659254.7	申请日：	2019-07-19
公开（公告）号：	CN110399461A	公开（公告）日：	2019-11-01
发明（设计）人：	陈琦钿	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06K9/00
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	郝传鑫;熊永强
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	字符集合字符数据对话字符串集合存储介质身份标识声音信息特征描述数据处理字符串讲话服务器获取目标连续字符人物特征特征分析结构体自动地文档中文
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种数据处理方法、装置、服务器及存储介质，其中方法包括：获取目标文档包括的字符数据；对字符数据进行结构体识别处理得到对话字符串集合，对话字符串集合包括目标对话字符串，目标对话字符串包括多个连续字符；确定目标对话字符集合对应的目标讲话人的身份标识；根据目标讲话人的身份标识从字符数据中确定出对目标讲话人进行人物特征描述的特征描述字符集合；对所述特征描述字符集合进行特征分析确定所述目标讲话人的声音信息。采用本发明实施例，可以自动地识别中文档中对话部分对应的讲话人的声音信息。

技术领域

本申请涉及互联网技术领域，尤其涉及一种数据处理方法、装置、服务器及存储介质。

背景技术

科技的不断发展给人们的生活带来诸多便利，例如对小说、网页资讯以及其他文档的人声朗读，在保证用户获取到文档中信息的同时可以减少用户盯着终端屏幕的时间，可以保护用户的眼睛。另外，用户可以根据自己的喜好选择不同朗读声类型来朗读文档，增加了阅读文档的趣味性。

在人声朗读过程中，一般是根据用户选择的朗读声类型对整个文档进行朗读，也就是说整个文档都是由一个声音朗读出来的，如此导致人声朗读的功能比较单一。如果文档中包括多个人物，用户通过上述的人声朗读不能获取到多个人物的性别、以及各个人物之间的关系等信息。由此可见，在人声朗读领域中，如果针对不同人物采用与其声音信息相符的朗读声类型进行朗读可增加人声朗读的丰富性。因此，当今如何确定出文档中不同人物的声音信息成为研究热点。

发明内容

本发明实施例提供了一种数据处理方法、装置、服务器及存储介质，可实现自动地识别出文档中各个讲话人的声音信息。

一方面，本发明实施例提供了一种数据处理方法，包括：

获取目标文档包括的字符数据；

对所述字符数据进行结构体识别处理得到对话字符串集合，所述对话字符串集合中包括目标对话字符串，所述目标对话字符串包括多个连续对话字符；

获取所述目标对话字符串对应的目标讲话人的姓名；

从所述字符数据中确定出对所述目标讲话人进行人物特征描述的特征描述字符集合；

对所述特征描述字符集合进行特征分析确定所述目标讲话人的声音信息。

另一方面，本发明实施例提供了一种数据处理装置，包括：

获取单元，用于获取目标文档包括的字符数据；

处理单元，用于对所述字符数据进行结构体识别处理得到对话字符串集合，所述对话字符串集合中包括目标对话字符串，所述目标对话字符串包括多个连续对话字符；

所述获取单元，还用于获取所述目标对话字符串对应的目标讲话人的姓名；