[发明专利]一种AI语音对话系统在审
申请号: | 201811292305.9 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109326288A | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 李足红;李洋全;黄涛涛;陈贵凤;田婧 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/34;G10L15/18 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 吴瑞芳 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种AI语音对话系统,包括终端系统和云端系统:本发明解决了原核心架构在终端,迭代速度慢;各个核心子系统之间耦合较深,不易独立扩展。该架构是着眼于未来AI语音对话系统的技术发展趋势而设计的,让人工智能语音电视持续发展具备了坚实基础。 | ||
搜索关键词: | 语音对话系统 技术发展趋势 核心子系统 人工智能 核心架构 坚实基础 云端系统 终端系统 耦合 迭代 架构 语音 终端 电视 | ||
【主权项】:
1.一种AI语音对话系统,其特征在于,包括终端系统和云端系统:所述终端系统包括名称为AI Voice UI的终端语音系统,所述终端语音系统包括核心逻辑引擎、语音处理引擎和UI引擎三个模块;所述核心逻辑引擎包括录音、语音识别、语义处理、功能执行、UI展示和播报六个核心逻辑,“录音”模块负责获取各种输入设备的音频数据,并将其作为输出,发送给下一个模块“语音识别”;“语音识别”模块将输入的录音数据转换为文本数据,输出给下一个模块“语义处理”;“语义处理”模块将输入的文本数据转换为结构化数据,输出给后面三个模块“功能执行”、“UI展示”和“语音播报”,“功能执行”模块负责调用本地功能接口,“UI展示”模块负责向用户以图形化的方式展示结果,“语音播报”模块负责以声音的方式给用户展示结果;所述语音处理引擎包括ASR、NLP和TTS,提供抽象接口和具体实现,语音处理引擎提供抽象接口,供具体的ASR、NLP和TTS实现,同时供前述的核心逻辑引擎调用;所述UI引擎主要提供对本地UI模板和云端UI模板的方式,而云端UI模板支持标准的H5方式和小程序方式,本地UI模板支持的样式固定且有限,供语音技能开发者选取;云端UI模板支持语音技能开发者自定义,以满足其个性化需求;所述云端系统包括云端中控决策系统和语音开放平台;所述中控决策模块包括核心策略模块、意图识别模块、语义接入模块和服务接口模块,“核心策略”模块以用户请求作为输入,并先调用“意图识别”模块,以获得用户的意图,然后根据用户意图调用“语义接入”模块,最后再根据语义结果调用对应的“服务接入”模块,最终将服务数据输出给请求端;所述语音开放平台为语音技能开发者提供开发、测试和发布语音技能的平台,语音技能开发者登录语音开放平台,输入技能名称、添加技能的意图数据、选取技能的UI模板、上传服务数据获取脚本,最后提交。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811292305.9/,转载请声明来源钻瓜专利网。