[发明专利]一种调度智能语音辅助系统在审
申请号: | 201910992666.2 | 申请日: | 2019-10-18 |
公开(公告)号: | CN111489748A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 周智成;苗增强;唐健;张元胜;谢代钰;宋吉峰;潘连荣;阳晟;陈新凌;杨有慧;罗翠云 | 申请(专利权)人: | 广西电网有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/18;G10L15/02;G10L15/06;G10L15/14;H02J13/00 |
代理公司: | 南昌新天下专利商标代理有限公司 36115 | 代理人: | 施秀瑾 |
地址: | 530023 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 调度 智能 语音 辅助 系统 | ||
1.一种调度智能语音辅助系统,其特征在于:该系统包括系统管理模块、人机语音交互平台模块、电网接线图导航模块、语音转成模板化的调度日志模块、调度语音文本管理模块;
所述系统管理模块用于对电网组织机构、系统角色、用户操作权限进行管理;系统管理模块还包括用户管理子模块、权限管理子模块、电话簿管理子模块、通道参数管理子模块、系统参数管理子模块、操作日志管理子模块、服务器运行参数管理子模块;
所述人机语音交互平台模块用于实现自动识别语音语义,实现语音控制功能,实现语音导航以及日志语音文本的检索功能;
所述电网接线图导航模块用于操作人员通过语音输入厂站名称或线路名称,系统自动调阅OCS的潮流图,并自动进行缩放和中心显示处理,避免鼠标点击调看图形的繁琐操作;
所述语音转成模板化的调度日志模块利用自然语言识别、语音分析、语义分析技术,结合电力调控业务,将语音识别出来的信息内容结果映射到电网设备及所关联的业务上,经过语义识别,判断出日志的类型,包括事故汇报信息、交接班重要记事、缺陷信息、临时安全措施、创新高、电力电量调整类型,根据不同类型的日志要求,经过自然语言处理中的实体识别技术,把语音中的相关信息记入不同的字段或者不同类型的模板中;可以识别出无需记录的语音片段,对于识别出需要记录的片段,按照日志记录生成规则形成日志内容。
所述调度语音文本管理模块实现调度语音自动转成文本存储在调度语音交互平台中,便于调度员听取语音记录的同时拷贝对应文本资料;该模块将录音信息整理成文本,同时根据发生的时间将相应的文本信息与调度录音相对应,以便调度员查阅。
2.根据权利要求1所述的一种调度智能语音辅助系统,其特征在于:所述人机语音交互平台模块还包括,人机语音交互平台模块通过对调度员与厂站值班员的对话信息进行语音识别判断,形成文本信息,经过筛选过滤处理最终生成规范的调度文本,经调度员确认后,调度文本信息传至OMS系统中调度值班台,生成调度日志;对于需要按OMS系统中调度信息进行分类的语音信息,系统通过判别功能进行分辨,并自动将信息生成至对应的模块中,同时在调度值班平台生成对应调度日志信息,人机语音交互平台模块所生成的文本信息支持人工修改,自动生成对应的时间,并且所生成的时间也支持人工编辑;对录音文本信息的管理包括按时间生成本文的同时关联对应的录音文件,在调度录音时能按时间查找到对应的文本信息和录音信息;
人机语音交互平台模块根据调控运行最新的规范要求和人员配备,提供多种功能,包括电力专业词汇库功能、特定声调库功能、智能联想库功能,新增多种调控录音文件输入输出模式、多种调控录音文件分析模式、多线程调控录音文件处理模式,提高语音识别平台识别率和语音识别平台引擎性能;
所述电力专业词汇库功能是通过语音辨识功能,通过对已获取的上万小时调控录音数据进行分析处理,对TB量级文本数据进行语音标注,再结合日常调控使用下令用户及相关规定、规范形成一个完善的电力专业词汇库,给下一步的语音辨识提供支撑,保证语音辨识的准确性;通过对已经获取的调控录音进行转写与聚类分析,对大量的已有文本数据进行聚类分析,可分析出日常调控的常用语、专业术语,再反向用大量的文本内容去训练语音识别的语言模型,提高了语音识别的准确率;
所述特定声调库功能是通过语音辨识功能,从已有的语音信号中提取声学特征,对环境噪声、通话信道、发音人声调特征、方言声调特征进行归一化和补偿,得到声学建模和匹配的特征,建立完善的特定声调库;对调控人员的录音数据进行标注,提取特定发音人的发音特点,通过训练声学模型,大幅度提升了语音识别的准确率;
所述智能联想库功能包含系统所能处理的词汇集及其音素序列,智能联想库提供了声学模型建模单元与语言模型建模单元间的关联映射,通过关联映射对所有的语言模型进行入库处理,采用高阶N元文法和回归神经网络,对海量文本数据进行统计,建立方便快捷的智能联想库;
人机语音交互平台模块针对大规模连续语音的识别任务,在词汇量达到数十万、语言模型达到数十GB量级的巨大搜索空间,采用解码技术,快速找到对应说话语音的最佳句子匹配,提高了语音辨识的准确性和实时性,具体工作过程包括:
1)语音检测步骤,系统采集的原始语音数据被送入语音检测模块,该模块进行语音信号的预处理和检测, 将原始语音信号数据转换成标准数据格式,并通过快速高质量的语音信号检测算法,检测到语音的起始点和终止点;
2)语音分类步骤,语音分类包含MF-PLP特征提取、分类两个部分;特征提取部分,主要是在对语音进行分帧、加窗预处理步骤之后,提取语音的MF-PLP即美尔频率、感知线性预测系数特征,它反映了发音的最本质的一些特征信息,采用CMN/HLDA技术减少信道影响,并提高特征的区分性;语音分类部分是针对提取的声学特征,基于GMM统计模型,采用语音类型建模分类算法,得到输入发音的准确类型信息;
3)语言模型步骤,采用隐含马尔科夫声学模型,采用业界领先的MPE模型训练算法,提高模型的鉴别能力,在训练数据、特征提取方面都充分考虑了自然环境噪声的干扰,并且采用多条件的训练策略,能够显著提高对于噪声的稳健性;语言模型是在采用三元文法统计语言模型技术的基础上,积累了大量的分类文本语料,使得语言模型能够很好地覆盖各个领域,同时对语言模型存取速度进行了优化;
4)解码步骤,在搜索空间构建方面,系统采用图结构,以隐含马尔科夫模型的状态为图节点,直接构造跨词的搜索空间;在基于音素决策树的上下文相关的声学模型训练框架中,一个三音子HMM由若干HMM状态组成,不同的三音子HMM可共享相同的HMM状态,系统采用前向、后向归并算法,提取并有效表达了这种共享模式,从而构造出可精细描述声学上下文的搜索空间,此外,修正了基于令牌扩展的维特比搜索算法,产生了质量较高的网格,结合基于网格的后处理算法,进一步提高了系统的识别精度;
5)聚类、自适应步骤,利用前期积累的语音数据,可提取出环境的背景噪声,又可以利用之前对该段语音特点的分析,对系统的模型自适应使它能更好的模拟这个人的特点,使得识别结果更加准确;在说话人聚类方面,采用改进的层次聚类算法,它是一种先合并后判决的无监督自动聚类算法;在环境和说话人自适应方面,采用无监督MLLR算法框架;系统还采用了多遍自适应策略, 可进一步提高自适应的性能;
6)取结果步骤,根据识别器解析的信息,从中提取出多种可能的结果返回给用户,包括每个字或词的起止时间、最可能内容、其它候选参考信息,还提供了保存为cvs记录文档接口,同时提供了文本、音频混合存储和读取的接口方案;
所述人机语音交互平台模块还提供录音文件离线接入功能子模块,用于系统处于离线状态需要接入调度录音文件;提供定时接入录音文件功能,接入频率可为每小时、每天;生成录音文件接入日志,可根据日志找出遗漏录音的文件及接入失败的文件,以便下一次继续接入;对接入的录音文件进行分类存储,录音文件基本信息进行数据库表存储,包括开始时间、结束时间、主叫号码、录音号码;录音文件按专业、时间进行分类存储至服务器;
所述人机语音交互平台模块还提供调控人员培训及考试子模块,根据自动生成规范的调控语音和文档,建立调控语音规范库和培训题库,用于安排考试和培训;通过系统进行培训及考试,便于信息共享交流和知识快捷传播;该子模块可模拟事故发生前后调控电话工作场景,提供事故处理的录音信息,为调控人员提供一个更为真实的培训环境,使调控人员通过培训增强电网事故处理的实际能力和心理素质,提高事故处理过程中各相关环节分工配合的熟练程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西电网有限责任公司,未经广西电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910992666.2/1.html,转载请声明来源钻瓜专利网。