[发明专利]一种数据处理方法、装置和用于数据处理的装置在审
申请号: | 201810084098.1 | 申请日: | 2018-01-29 |
公开(公告)号: | CN110110292A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 姚光超 | 申请(专利权)人: | 北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/27;G10L15/06;G10L15/22 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 目标结构 目标数据类型 多元文法 结构数据 内存空间 数据对应 语音识别 减小 存储 占用 | ||
本发明实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括:从多元文法模型的结构数据中确定第一目标结构数据;确定所述第一目标结构数据对应的目标数据类型;按照所述目标数据类型,对所述第一目标结构数据进行存储。本发明实施例可以极大地减小多元文法模型占用的内存空间,进而可以提高语音识别的速度。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种数据处理方法、装置和用于数据处理的装置。
背景技术
语音识别,是指将人类语音中的词汇内容转换为计算机可读的输入,例如将语音信号转换为文本等。随着语音识别技术的不断发展,语音识别技术的应用场景也更加广泛,例如上述应用场景可以包括:语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
n-gram(n元文法)模型是语音识别中常用的一种语言模型,其中,n通常为大于1的正整数,且通常n越大则语言模型的性能越高,语音识别的结果也越准确。
离线语音识别是指将语音识别所需要的语言模型等相关资源存储在客户端,由客户端在不联网的情况下完成语音识别的技术。然而,语言模型的数据量通常较大,将语言模型存储在客户端,会占用客户端大量的内存空间;上述内存空间的占用不仅会影响离线语音识别的运行速度,还会影响客户端中其它应用的运行。
发明内容
本发明实施例提供一种数据处理方法、装置和用于数据处理的装置,以解决现有技术中离线语音识别内存占用过大的问题。
为了解决上述问题,本发明实施例公开了一种数据处理方法,包括:
从多元文法模型的结构数据中确定第一目标结构数据;
确定所述第一目标结构数据对应的目标数据类型;
按照所述目标数据类型,对所述第一目标结构数据进行存储。
可选地,所述第一目标结构数据包括:文法的条件概率、和/或、文法的回退权重;所述目标数据类型包括:单字节整型。
可选地,所述第一目标结构数据包括:所述多元文法模型中文法的词序列;所述目标数据类型包括:无符号双字节整型。
可选地,所述方法还包括:
从所述多元文法模型的结构数据中确定第二目标结构数据;所述第二目标结构数据包括:文法的回退位置、和/或、文法的回退位置对应的层数;
从所述多元文法模型的结构数据中删除所述第二目标结构数据,以得到压缩后的多元文法模型。
可选地,所述第二目标结构数据还包括:以文法为前缀的下一层文法的起始位置。
可选地,所述第二目标结构数据还包括:最高层文法对应的回退权重。
可选地,所述方法还包括:
从所述多元文法模型的数据中确定第一数据和第二数据;所述第一数据包括:文法的回退权重、和/或、文法的回退位置对应的层数;所述第二数据包括:文法的词序列;
将所述第一数据作为目标数据字段的高位进行存储,以及,将所述第二数据作为所述目标数据字段的低位进行存储。
可选地,所述目标数据字段包括:第一数据或者第二数据对应的字段。
另一方面,本发明实施例公开了一种语音识别方法,包括:
加载多元文法模型;所述多元文法模型的结构数据中包括:第一目标结构数据,且所述第一目标结构数据的类型为目标数据类型;
根据所述多元文法模型对文法进行语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司,未经北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810084098.1/2.html,转载请声明来源钻瓜专利网。