[发明专利]一种语音驱动的智能人机交互方法有效
申请号: | 201510823784.2 | 申请日: | 2015-11-24 |
公开(公告)号: | CN105513593B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 朱阿兴;刘军志;王德生;缪亚敏 | 申请(专利权)人: | 南京师范大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/18;G10L15/08;G06F3/0487 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李媛媛 |
地址: | 210097 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音驱动的智能人机交互方法。其处理流程为:用户在客户端通过语音告诉系统自己的需求;系统接收到语音指令后,利用语音识别技术将语音识别成字符串,进而根据语义库就解析用户输入的语义;系统的对话管理器结合知识库和对话上下文,组织回答语句,并以语音方式回答用户;用户得到应答后根据个人需求继续与系统对话,直到满足用户需求为止。与传统的人机交互途径(如鼠标、键盘、触摸屏等)相比,本发明的方法解放了人们的双手,使人机交互更符合人类认知和语言习惯,同时也提高了人机交互的趣味性,在网络购物、信息查询等所有需要与计算机和互联网进行交互的领域均具有广阔应用前景。 | ||
搜索关键词: | 一种 语音 驱动 智能 人机交互 方法 | ||
【主权项】:
1.一种语音驱动的智能人机交互方法,其特征在于,该方法的实现步骤如下:(1)语音输入界面接收用户输入的语音;(2)语音识别模块识别用户输入的语音,得到识别结果:字符串S;(3)语义理解模块对字符串S进行分词,并根据文法对分词结果中的每个短语添加语义标签;所述文法包括语言模型和语义分类器,其中,语言模型定义了所有由语音识别器处理的词汇空间,由文法的规则描述或统计文法领域的n元组集合定义;语义分类器将词汇短语映射到语义标签的一个有限集,由训练好的统计分类器实现;(4)对话管理器根据语义理解模块的语义解析结果,结合知识库确定将要执行的操作,具体为:①如果用户的语音输入指定了所感兴趣事物的属性,对话管理器将查询后台的领域知识库,确定对话主题的必要属性信息、可选属性信息和属性优先级;如果用户提供的属性信息不足,对话管理器将询问用户缺少的必要属性信息;如果用户提供的属性信息覆盖了对话主题的必要属性信息,对话管理器将让用户确认所感兴趣事物的信息;②如果用户的语音输入为查询某一问题或名词,对话管理器将调用第三方搜索引擎查询、筛选和重新组织相关信息,并在下一步将结果返回给用户;(5)对话管理器根据上一步确定的操作组织回答语句,并调用语音播放引擎向用户播放语句;其中,组织回答语句的过程分为查找语句模板和填充信息两步:在查找语句模板的步骤中,语句模板的类型由上一步所确定的操作类型决定:如果系统需要向用户询问相关信息,需使用询问疑问句;如果系统需要让用户确认信息,使用确认疑问句;如果系统需要将结果返回给用户,则使用陈述句;如果交互过程中出现语音识别拒识、超时、低可信度的问题,对话管理器将调用这些问题对应的提示语句;以上所有语句模板均存储在知识库中,对话管理器根据对话主题和查询类型提取语句模板;对话管理器确定语句模板之后,根据语义设置模板中的参数值,从而生成回答语句;(6)用户接收到语音播放引擎的语音提示后,根据提示进一步输入语音进行对话,直到对话管理器确认用户的需要已得到满足,并结束当前会话;(7)将会话所涉及的关键信息存储到用户案例库中,用于提高系统的智能化水平。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京师范大学,未经南京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510823784.2/,转载请声明来源钻瓜专利网。