[发明专利]数据处理方法和服务器有效

申请号：	201810094342.2	申请日：	2018-01-31
公开（公告）号：	CN110111780B	公开（公告）日：	2023-04-25
发明（设计）人：	曹元斌;王剑;王天舟;温建华;李生;郎君;司罗	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/01;G10L15/02;G10L15/06;G10L15/18;G10L15/26;G10L15/30;H04L51/02
代理公司：	北京三友知识产权代理有限公司 11127	代理人：	李辉;徐焕
地址：	英属开曼***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据处理方法服务器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种数据处理方法和服务器，应用于聊天机器人中，其中，该方法包括：获取语音数据；根据语音识别模型将所述语音数据转换为文本数据，其中，所述语音识别模型是基于特定领域语言模型对基准语言模型进行线性插值得到的目标语言模型建立的，其中，所述特定领域语言模型是基于目标特定领域的语料数据训练得到的，所述特定领域与所述语音数据的内容相匹配。通过上述方案使得在定制聊天机器人的时候，如果没有充足的训练语料，那么可以通过领域语言模型对基准语言模型进行插值的方式得到特定领域的聊天机器人，从而达到提高语音识别准确度的技术效果。

技术领域

本申请属于互联网技术领域，尤其涉及一种数据处理方法和服务器。

背景技术

随着智能化技术的不断发展，对机器人的研究越来越多。机器人的研究势必会研究用户与机器人的语音交互。现有的聊天机器人一般都是面向比较特定的需求，例如，用于进行自动订票的聊天机器人，用于回答客户咨询的聊天机器人等等。

在与这些机器人进行语音交互的过程中，往往会因为训练语料的不足，或者是语音中的词汇太过专业，导致语音识别的准确度比较低。

针对上述问题，目前上述提出有效的解决方案。

发明内容

本申请目的在于提供一种数据处理方法和服务器，以达到提高聊天机器人的语音识别准确率的技术效果。

为解决上述技术问题，本申请实施例提供一种数数据处理方法和服务器是这样实现的：

一种数据处理方法，应用于聊天机器人中，包括：

获取语音数据；

根据语音识别模型将所述语音数据转换为文本数据，其中，所述语音识别模型是基于特定领域语言模型对基准语言模型进行线性插值得到的目标语言模型建立的，其中，所述特定领域语言模型是基于目标特定领域的语料数据训练得到的，所述特定领域与所述语音数据的内容相匹配。