[发明专利]信息处理设备、信息处理方法有效
| 申请号: | 201980018039.7 | 申请日: | 2019-03-01 |
| 公开(公告)号: | CN111837401B | 公开(公告)日: | 2023-10-10 |
| 发明(设计)人: | 山岸靖明 | 申请(专利权)人: | 索尼公司 |
| 主分类号: | H04N21/435 | 分类号: | H04N21/435;H04N21/422;H04N21/431;H04N21/488;H04N21/84;G10L15/22;G06F3/0481;G06F3/16 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息处理 设备 方法 | ||
该信息处理装置设置有:AV解码器41,其获取并再现包括能够使用用于处理来自用户的语音请求的服务的服务对象的视频数据;以及应用程序执行环境43,其将用于向用户教导该服务对象的附加图像添加到再现的视频。附加图像具有对于每个服务对象唯一的视觉特征,使得该服务对象由服务中的语音识别唯一地确定。
技术领域
本技术涉及执行用于接收并再现包括视频的运动图像内容的信息处理的信息处理设备、信息处理设备和程序,并且具体地,涉及适合于例如运动图像内容与用于信息处理设备的用户的基于语音的信息服务一起工作的情况的信息处理设备、信息处理方法和程序。
背景技术
语音人工智能(AI)助理服务最近已经流行。这些服务是这样的信息服务,其中,支持该服务的终端通过使用麦克风等通过由信息处理设备的用户发出的语音来拾取请求,识别该请求,分析数据,执行对应于用户的请求的服务,并且通过声音等向用户响应执行的结果(例如,参见专利文献1)。Amazon Echo(注册商标)的Alexa(注册商标)目前被称为基于云的语音AI助理服务。
引用列表
专利文献
专利文献1:日本专利申请公开第2015-022310号
发明内容
技术问题
本技术的发明人已经研究了一种机制,在该机制中,如上所述的语音AI助理服务被用作用于在再现包括视频的运动图像内容的环境中收集关于出现在视频中的人或产品的信息的手段。例如,在作为观看者的用户然后想要知道并且存在诸如出现在运动图像内容中的人的角色、与出现在其中的其他人的关系、以及进一步地扮演该人的演员的简档的各种事物的情况下,用户可以实时地从语音AI助理服务接收信息。
然而,如果语音AI助理服务实际上被用作用于在再现包括视频的运动图像内容的环境中收集关于出现在视频中的人或产品的信息的手段,则在利用语音AI助理服务的属性的同时使用语音AI助理服务的合适方式尚未充分建立,并且堆叠了待解决的问题。
在这一点上,本技术的目的在于提供一种能够在观看再现视频时利用语音AI助理服务的属性的同时使用语音AI助理服务的信息处理设备、信息处理设备和程序。
问题的解决方案
为了解决上述问题,根据本技术的信息处理设备包括:媒体再现单元,其获取并再现包括能够利用服务的服务对象的视频数据,该服务处理通过来自用户的语音提出的请求;以及控制器,其将用于向用户通知关于服务对象的附加图像添加到再现的视频。
附加图像可以包括对于每个服务对象唯一的视觉特征,使得服务对象在服务中通过语音识别被唯一地确定。
附加图像可以呈现在附接到服务对象的位置处。
控制器可以被配置为根据用户或用户的属性来限制添加了附加图像的服务对象。
控制器可以被配置为根据用户或用户的属性执行添加了附加图像的服务对象出现的时段的视频的跳过再现。
控制器可以被配置为根据用户或用户的属性以第一倍速再现添加了附加图像的服务对象出现的时段的视频,并且以比第一倍速快的第二速度再现服务对象未出现的时段的视频。
控制器可以被配置为获取用于生成附加信息的元数据,并且基于所获取的元数据添加附加信息。
控制器可以被配置为获取包括元数据的适应集(AdaptationSet)的MPD文件,分析MPD文件,获取视频数据和元数据中的每一个作为MPEG-DASH的媒体段(Media Segment),并且彼此同步地呈现视频数据和基于元数据的附加图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980018039.7/2.html,转载请声明来源钻瓜专利网。





