[发明专利]一种语言模型更新方法、装置及设备有效

申请号：	201710142662.6	申请日：	2017-03-10
公开（公告）号：	CN108573697B	公开（公告）日：	2021-06-01
发明（设计）人：	郑宏	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G10L15/183	分类号：	G10L15/183;G10L15/06
代理公司：	北京华沛德权律师事务所 11302	代理人：	马苗苗
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语言模型更新方法装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及数据处理领域，公开了一种语言模型更新方法、装置及设备，以解决现有技术中存在着无法对关联最新热点的语音信息进行识别的技术问题。该方法包括：获得客户端所产生的内容；对所述内容进行解析获得至少一个语言片段；基于所述至少一个语言片段对第一语言模型进行更新，所述第一语言模型中包含语言片段与语言片段的片段数量的对应关系。达到了可以基于更新后的语言模型对最近热点信息进行准确识别的技术效果。

技术领域

本发明涉及数据处理领域，尤其涉及一种语言模型更新方法、装置及设备。

背景技术

随着科学技术的不断发展，电子技术也得到了飞速的发展，电子产品的种类也越来越多，人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的电子设备，享受随着科技发展带来的舒适生活。例如，智能手表、智能手机、平板电脑等电子设备已经成为人们生活中一个重要的组成部分，其可以包含各种功能。

通常情况下，电子设备都具备语音识别功能，例如：电子设备可以基于语言模型识别出用户所产生的语音信息，现有技术中的语言模型通常都是离线训练完毕之后上线使用，基于该方案，导致现有技术中存在着无法对关联最新热点的语音信息进行识别的技术问题。

发明内容

本发明提供一种语言模型更新方法、装置及设备，以解决现有技术中存在着无法对关联最新热点的语音信息进行识别的技术问题。

第一方面，本发明实施例提供一种语言模型更新方法，包括：

获得客户端所产生的内容；

对所述内容进行解析获得至少一个语言片段；

基于所述至少一个语言片段对第一语言模型进行更新，所述第一语言模型中包含语言片段与语言片段的片段数量的对应关系。

结合第一方面，在第一种可选的实施例中，所述基于所述至少一个语言片段对第一语言模型进行更新，包括：