[发明专利]基于历史数据及机器学习自适应获取词库领域的方法及系统有效
| 申请号: | 201711391038.6 | 申请日: | 2017-12-21 |
| 公开(公告)号: | CN108255956B | 公开(公告)日: | 2020-04-03 |
| 发明(设计)人: | 蔡劲松;苏少炜;陈孝良;冯大航;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/211;G06F40/30;G10L15/08 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
| 地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 历史数据 机器 学习 自适应 获取 词库 领域 方法 系统 | ||
1.一种基于历史数据及机器学习自适应获取语音词库领域的方法,包括:
步骤S0,ASR识别引擎接收用户发出语音指令,进行语音识别,得到语音识别结果;
步骤S1,对语音识别结果进行语义平面的句模分类,找到语音指令中的动核以及与其相关的动元;
步骤S2,摘取出所述语音指令中的动元,根据所述动元结合机器学习所选择出的数个词库;并根据用户历史数据,选取用户使用最频繁的数个词库领域;
步骤S3,在选择的词库中用自然语言处理方法进行句法平面的分词,综合多个词库领域的结果进行评估,求取评估分值最高的领域作为最优结果,输出所述最优结果,更新用户历史词库领域使用情况,以及通过历史数据和机器学习对词库内名词的权值进行优化,所述权值为所述名词的出现的概率,其中,综合多个词库领域的结果进行评估包括对语音识别结果中词与词之间的关联程度进行评估;
步骤S4,将最优结果结合语用平面的句类分析,确定最终的词库领域。
2.根据权利要求1所述的方法,其中,所述步骤S1中进行语义平面的句模分类采用模式匹配算法,获取语音指令中的动核以及与其相关的动元。
3.根据权利要求1所述的方法,其中,所述步骤S2中所述机器学习为深度学习。
4.根据权利要求1所述的方法,其中,
所述步骤S3中,在选择的词库中用自然语言处理中的N-最短路径方法进行句法平面的分词;在选择最短路径是采用贪心算法或Dijkstra最短路径算法。
5.根据权利要求1所述的方法,其中,所述步骤S3中,
综合多个词库领域的结果进行评估包括:对最短路算法结果进行评估。
6.根据权利要求1所述的方法,所述步骤S0中,所述ASR识别引擎采用自动语音识别技术。
7.一种基于历史数据及机器学习自适应获取语音词库领域的系统,包括:
ASR识别引擎,用于接收用户发出语音指令,进行语音识别,得到语音识别结果;
语义平面分析模块,对语音识别结果进行句模分类,找到语音指令中的动核以及与其相关的动元;摘取出所述语音指令中的动元,根据所述动元结合机器学习所选择出的数个词库;并根据用户历史数据,选取用户使用最频繁的数个词库领域;
句法平面分析模块,在选择的词库中对进行句法分词,并综合多个词库领域的结果进行评估,求取评估分值最高的词库领域作为最优结果,输出所述最优结果,更新用户历史词库领域使用情况,以及通过历史数据和机器学习对词库内名词的权值进行优化,所述权值为所述名词的出现的概率,其中,综合多个词库领域的结果进行评估包括对语音识别结果中词与词之间的关联程度进行评估;
语用平面分析模块,将所述最优结果结合语用平面的句类分析,确定最终的词库领域。
8.根据权利要求7所述的系统,其中,所述语义平面分析模块包括:
句模分类子模块,对所述识别结果进行语义平面的句模分类,采用模式匹配算法,找到语音指令中的动核以及与其相关的动元;
机器选择子模块,在摘取出动元之后,送往结合机器深度学习所选择出的数个词库;
历史选择子模块,根据用户历史数据,送往该用户使用最频繁的数个词库领域。
9.根据权利要求7所述的系统,其中,所述句法平面分析模块包括:
分词子模块,在选择的词库中用自然语言处理中的N-最短路径方法进行句法平面的分词;
评估及更新子模块,通过对词与词之间的关联程度进行评估,对最短路算法结果进行评估,求取评估分值最高的领域作为最优结果;并且更新用户历史词库领域使用情况,以及通过历史数据和机器学习对词库内名词的权值进行优化。
10.根据权利要求7所述的系统,所述ASR识别引擎采用自动语音识别技术。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711391038.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及装置
- 下一篇:一种基于创投领域精准数据化推荐匹配方法





