[发明专利]用于提供语音服务的方法和装置有效
申请号: | 201710883349.8 | 申请日: | 2017-09-26 |
公开(公告)号: | CN107767869B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 谢波 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/03 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 提供 语音 服务 方法 装置 | ||
技术领域
本申请涉及计算机技术领域,具体涉及语音技术领域,尤其涉及用于提供语音服务的方法和装置。
背景技术
人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
人工智能领域中的语音识别技术是计算机科学领域与人工智能领域中的一个重要方向,主要用在智能语音服务技术中,对用户的发出的语音信号进行识别,而后基于识别结果生成响应信息,并通过语音合成技术将响应信息转化为语音信号输出。
现有的语音服务技术在对用户发出的语音服务请求进行响应时,大都采用将语音信号转换为对应的文字,而后对文字进行分析、检索进而确定响应策略的方式。然而,这个过程中忽略了说话人的不同语速所包含的不同的潜在需求信息,从而存在着提供的语音服务与用户需求匹配度差的问题。
发明内容
为了解决上述背景技术部分提到的一个或多个技术问题,本申请实施例提供了用于提供语音服务的方法和装置。
第一方面,本申请实施例提供了一种用于提供语音服务的方法,包括:获取语音输入信号;对语音输入信号的时域波形进行分析以确定语音输入信号的当前语速信息;比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,其中,标准语速信息集合包括至少一个标准语速信息,预设的需求信息集合包括与标准语速信息集合中的各标准语速信息对应的需求信息;根据第一需求信息以及解析语音输入信号获取的第二需求信息生成语音响应信号。
在一些实施例中,上述比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,包括:比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,以从标准语速信息集合中确定出与当前语速信息匹配的目标标准语速信息;在预设的需求信息集合中查找出与目标标准语速信息对应的需求信息,作为第一需求信息。
在一些实施例中,在比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息之前,上述方法还包括:基于语音输入信号对发出语音输入信号的用户进行识别;获取识别出的用户的标准语速信息集合。
在一些实施例中,上述根据第一需求信息以及解析语音输入信号获取的第二需求信息生成语音响应信号,包括:基于第二需求信息生成至少一个用于响应语音输入信号的候选语音信号;计算各候选语音信号与第一需求信息的关联度,根据关联度从候选语音信号中确定出语音响应信号。
在一些实施例中,上述方法还包括构建用户的标准语速信息集合的步骤,包括:获取与用户关联的历史语音服务记录,历史语音服务记录包括:用户发出的历史语音输入信号的语速信息、历史语音响应信号、用户对历史语音服务的反馈信息;筛选出反馈信息为正面反馈信息的历史语音服务对应的历史语音响应信号作为样本语音响应信号,筛选出反馈信息为正面反馈信息的历史语音服务对应的历史语音输入信号的语速信息作为样本语速信息;对样本语音响应信号进行解析以确定对应的与语速相关的第三需求信息,基于第三需求信息对语音响应信号进行聚类,根据各聚类中语音响应信号对应的样本语速信息生成各标准语速信息。
第二方面,本申请实施例提供了一种用于提供语音服务的装置,包括:获取单元,用于获取语音输入信号;分析单元,用于对语音输入信号的时域波形进行分析以确定语音输入信号的当前语速信息;确定单元,用于比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,并根据比对结果从预设的需求信息集合中确定出第一需求信息,其中,标准语速信息集合包括至少一个标准语速信息,预设的需求信息集合包括与标准语速信息集合中的各标准语速信息对应的需求信息;生成单元,用于根据第一需求信息以及解析语音输入信号获取的第二需求信息生成语音响应信号。
在一些实施例中,上述确定单元进一步用于按照如下方式确定出第一需求信息:比对当前语速信息和已获取的发出语音输入信号的用户的标准语速信息集合,以从标准语速信息集合中确定出与当前语速信息匹配的目标标准语速信息;在预设的需求信息集合中查找出与目标标准语速信息对应的需求信息,作为第一需求信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710883349.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:花洒主体(SF9001‑01)
- 下一篇:龙头主体(TJ‑8009‑01)