[发明专利]活跃发言者位置检测有效
申请号: | 201680070404.5 | 申请日: | 2016-12-26 |
公开(公告)号: | CN108293103B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | O·A·怀特;R·柯特勒;A·巴塔查杰;A·P·M·库德勒;A·柯克;S·T·伯奇菲尔德;C·张 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | H04N7/14 | 分类号: | H04N7/14;G01S3/80;H04M3/56 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈斌;胡利鸣 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 活跃 发言者 位置 检测 | ||
提供了与确定活跃发言者的位置有关的示例。在一个示例中,房间的图像数据(54)从图像捕捉设备(52)被接收并且三维模型(64)被生成。第一音频数据(26)从图像捕捉设备处的第一话筒阵列(24)被接收。第二音频数据(34)从与图像捕捉设备横向间隔开的第二话筒阵列(30)被接收。第二话筒阵列的位置(82)被确定。使用音频数据以及第二话筒阵列的位置和角取向(68),活跃发言者的估计位置(84)被确定。使用该估计位置,图像捕捉设备的设置(90)被确定并被输出以突出显示该活跃发言者。
技术领域
本申请涉及有关活跃发言者位置检测的方法和装置。
背景技术
视频会议系统利用音频和视频电信允许一个位置处的参与者与另一位置处的参与者进行交互。一些视频会议系统可捕捉并传送多个参与者的视图以供在另一系统上显示。为了帮助一个位置处的观看者跟踪另一位置处的对话,视频会议系统可尝试确定在该另一位置处发言的人。然而,准确地标识活跃发言者存在挑战。本文所描述的技术解决方案提供了解决此类挑战的希望。
发明内容
本文公开了与确定活跃发言者的位置有关的各种示例。在一个示例中,用于确定活跃发言者的位置的方法可包括从图像捕捉设备接收活跃发言者和至少一个非活跃发言者所在的房间的图像数据。使用该图像数据,房间的至少一部分的三维模型可被生成。可从图像捕捉设备处的第一话筒阵列接收来自房间的第一音频数据。可从与图像捕捉设备横向隔开的第二话筒阵列接收来自房间的第二音频数据。
使用三维模型,可确定第二话筒阵列相对于图像捕捉设备的位置。使用至少第一音频数据、第二音频数据、第二话筒阵列的位置、以及第二话筒阵列的角取向可确定活跃发言者在三维模型中的估计位置。活跃发言者的估计位置可被用于计算图像捕捉设备的设置。此类设置可被输出以用于控制图像捕捉设备突出显示活跃发言者。
提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。此外,所要求保护的主题不限于解决在本公开的任一部分中所提及的任何或所有缺点的实现。
附图说明
图1是示出根据本公开的示例的用于确定活跃发言者的位置的视频会议设备和第二话筒阵列的示意性图示。
图2示出了根据本公开的示例的包括若干人和用于确定活跃发言者的位置的视频会议设备以及第二话筒阵列的房间的示意性透视图。
图3示出了图2的房间中的视频会议设备和第二话筒阵列的简化示意性俯视图。
图4示出了根据本公开的示例的图2的第二话筒阵列的示意性侧视图。
图5示出了根据本公开的示例的图2的第二话筒阵列的示意性俯视图。
图6示出了根据本公开的示例的具有声源定位分布的图2的第二话筒阵列。
图7A和7B是根据本公开的示例的用于确定活跃发言者的位置的方法的流程图。
图8示出了计算系统的示例的简化示意图。
具体实施方式
图1示出了用于确定活跃发言者在房间14中的位置的视频会议设备10的一个示例的示意性视图。视频会议设备10包括视频会议组件以便将该设备与不同位置处的一个或多个其他计算设备16通信地耦合。例如,视频会议设备 10可经由网络20与(诸)其他计算设备16通信地耦合。在一些示例中,网络 20可采取局域网(LAN)、广域网(WAN)、有线网络、无线网络、个域网、或其组合的形式,并且可包括因特网。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680070404.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通信系统
- 下一篇:信息处理系统、无线终端和信息处理方法