[发明专利]一种语音数据处理方法及装置有效

申请号：	201610513351.1	申请日：	2016-06-30
公开（公告）号：	CN107562760B	公开（公告）日：	2020-11-17
发明（设计）人：	王金钖;潘青华;王智国;胡郁;刘庆峰	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G06F16/30	分类号：	G06F16/30;G06F16/68;G06F40/279;G10L15/26;G10L25/78
代理公司：	北京弘权知识产权代理事务所(普通合伙) 11363	代理人：	逯长明;许伟群
地址：	230088 安徽省合肥市***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音数据处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种语音数据处理方法及装置，其中方法主要包括：将语音数据转换为语音文本；获取所述语音文本的篇章结构信息；对所述语音文本进行段落划分；提取每个段落的结构特征；根据每个段落的结构特征及预设的结构判断模型确定每个段落所属的篇章；标识出各语音数据片段所属的篇章，以实现所述语音数据的结构化。在本发明中，根据获知的篇章结构信息(例如会议的流程安排等)判断出每段内容属于哪个篇章(例如属于会议流程里的哪个环节)，从而梳理出语音数据的结构。这样无需再从头到尾、盲目地聆听整个语音数据，而是可以在结构化的语音数据中直接根据各语音数据片段所属的篇章来缩小查找范围，快速定位到目标内容。

技术领域

本发明涉及语音信息处理领域，尤其涉及一种语音数据处理方法及装置。

背景技术

当前随着智能硬件的快速发展及存储设备容量的不断提高，越来越多的人会将说话内容，例如会议发言、演讲、采访访谈、电话通话等，以语音数据的形式记录并保存起来。以开会为例，参会人员的发言中有诸多内容需要记录，且会议结束后通常还需要撰写会议纪要等内容，因此用户(如会议秘书)往往会录制会议语音数据，以供本人或别人查阅。

不过录制好的语音数据在查阅时却比较麻烦。以用户撰写会议纪要为例，可能有些发言未听清楚或未及时记录，所以需要人工回放并聆听语音数据，以找到目标语音内容。然而语音数据的长度一般较长，回放过程中往往不得不听到很多与目标语音内容不相关的内容，甚至要从头听到尾，导致查找时工作量很大，查找效率很低，用户很难在较短时间内找到所需要的内容。目前现有技术中尚缺少可以有效提高在语音数据中进行查找时的效率的方法，如何帮助用户快速准确地查找语音内容具有重要的意义。

发明内容

本发明提供一种语音数据处理方法及装置，以提高用户在语音数据中查找目标内容的效率。

根据本发明实施例的第一方面，提供一种语音数据处理方法，所述方法包括：

获取待处理的语音数据；

将所述语音数据转换为语音文本，所述语音文本包括文本内容及所述文本内容对应的时间信息；

获取所述语音文本的篇章结构信息，所述篇章结构信息用于指示所述语音文本可被划分成的篇章；

根据所述语音文本及对应语音数据，对所述语音文本进行段落划分，以将所述语音文本划分为一个或多个段落；

根据每个段落的文本内容以及文本内容对应的时间信息，提取每个段落的结构特征；

根据每个段落的结构特征及预设的结构判断模型确定每个段落所属的篇章；

根据每个段落所属的篇章以及段落与语音数据片段的对应关系，标识出各语音数据片段所属的篇章，以实现所述语音数据的结构化。

可选的，对所述语音文本进行段落划分，包括：

根据所述语音数据进行说话人变化点检测，以确定每个所述说话人变化点的位置；