[发明专利]非中断性NUI命令在审
申请号: | 201980023600.0 | 申请日: | 2019-03-15 |
公开(公告)号: | CN111936964A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | E·巴达什;A·L·米勒;H·索姆奇 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L15/22;H04N21/4788 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 赵腾飞 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中断 nui 命令 | ||
本申请中描述的技术的各方面提供一种非中断性的自然用户界面(NUI)。在一些方面,在要发送到接收方的媒体中捕捉到NUI输入。传送的媒体中包括该NUI输入会导致观看或收听该媒体时对用户体验的中断。本申请中描述的技术的方面识别并移除或以其它方式模糊化该NUI输入,同时保留该媒体内容中不包括该NUI命令的周围部分。可以用在本申请中描述的技术中的示例媒体包括图像、视频和音频传输。可以在记录用于后续传输的媒体时或者在同步媒体通信会话期间提供非中断性的NUI输入。
背景技术
自然用户界面(NUI)允许用户通过语音、手势、眼球运动和其它手段与计算机进行通信。自动语音识别(ASR)允许计算设备理解人的语言。除了其他的功能外,理解人的语言能够实现语音到文本的转录(transcription)和语音命令。相机能够捕捉手势(诸如手部运动),并把它们翻译成计算机命令。
发明内容
提供本发明内容以便以简化方式引入一些概念,将在下面的具体实现方式中进一步描述这些概念。本概述并不意在识别所要求保护的主题的关键或必要特征,也不意在用于辅助确定所要求保护的主题的范围。
本申请中描述的技术的各方面提供一种非中断性的自然用户界面(NUI)。在一些方面,在要发送到接收方的媒体中捕捉到NUI输入。传送的媒体中包括该NUI输入会导致观看或收听该媒体时对用户体验的中断。例如,包括可听的命令从而增大音频通信中计算设备的音量会对收听该音频通信的用户体验造成中断。目前很难在用户提供控制输入在音频或视频媒体中进行捕捉时使用NUI控制。
本申请中描述的技术的方面识别并移除或以其它方式模糊化(obscure)该NUI输入,同时保留该媒体内容中不包括该NUI命令的周围部分。可以用在本申请中描述的技术中的示例媒体包括图像、视频和音频传输。
可以在记录用于后续传输的媒体时或者在同步媒体通信会话期间提供非中断性的NUI输入。例如,可以在记录用于上传到社交网络的视频的同时提供非中断性NUI输入。类似的,可以在直播电话会议、视频直播、视频会议等期间使用非中断性NUI输入。当在同步媒体通信会话期间使用非中断性NUI输入时,微小的时间延迟可被内置在媒体传输过程中,以允许媒体在被传送到其它设备之前进行编辑。
附图说明
在下面的详细描述中参考附图描述了该技术的各方面,其中:
图1是根据本申请中描述的技术各方面适合于使用非中断性自然用户界面(NUI)命令的示例性计算环境的框图;
图2是根据本申请中描述的技术的方面描绘能够用于处理基于语音的NUI命令的自动语音识别系统的示意图;
图3是根据本申请中描述的技术的方面描绘使用语音命令的非中断性NUI场景的示意图;
图4是根据本申请中描述的技术的方面描绘使用图像作为输入的非中断性NUI场景的示意图;
图5是根据本申请中描述的技术的方面描绘从使用图像作为输入的非中断性NUI场景生成的输出的示意图;
图6是根据本申请中描述的技术的方面描绘从使用图像作为输入的非中断性NUI场景生成的替代输出的示意图;
图7是根据本申请中描述的技术的方面描绘一种响应自然用户界面控制的方法的流程图;
图8是根据本申请中描述的技术的方面描绘一种响应自然用户界面控制的方法的流程图;
图9是根据本申请中描述的技术的方面描绘一种响应自然用户界面控制的方法的流程图;以及
图10是适用于实现本申请中描述的技术的方面的示例计算环境的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980023600.0/2.html,转载请声明来源钻瓜专利网。