[发明专利]一种利用GPU并行加速图像转换的屏幕图像获取方法有效
申请号: | 201510551426.0 | 申请日: | 2015-08-31 |
公开(公告)号: | CN105163128B | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 陆璐;古伟楷 | 申请(专利权)人: | 华南理工大学 |
主分类号: | H04N19/436 | 分类号: | H04N19/436;H04N19/40;H04N19/186 |
代理公司: | 广州市华学知识产权代理有限公司44245 | 代理人: | 陈宏升 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 gpu 并行 加速 图像 转换 屏幕 获取 方法 | ||
1.一种利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于,包括以下步骤:
利用GDI图形设备接口获取实时系统屏幕图像即RGB32图像,并基于OpenCL异构计算框架,利用GPU并行计算将获得的RGB32图像转换为视频编解码适用的YUV420图像,最终将YUV420图像数据推送出去;
所述的获取实时系统屏幕图像,是通过DirectShow Filter实现的,DirectShow Filter命名为Screen Recorder,Screen Recorder仅具有一个输出Pin,输出Pin的媒体类型为视频流MEDIATYPE_Video/MEDIASUBTYPE_NV12,Screen Recorder的整体对外功能为按设定的频率获取屏幕区域图像,并将其以YUV 4:2:0图像数据的NV12格式码流输出;
所述的Screen Recorder,其工作流程为:
Screen Recorder获取到屏幕区域图像后,根据图像大小创建OpenCL Buffer用以存放图像数据,用来和GPU设备进行数据传输;
将图像数据写入到OpenCL Buffer中后,对OpenCL Buffer中的图像根据用户设置的图像处理要求进行相应的图像处理工作;
图像处理完成后,将OpenCL Buffer中的图像数据从RGB颜色空间的位图图像数据格式转换为YUV 4:2:0图像数据的NV12格式存放;
完成图像数据转换后,从OpenCL Buffer中读取NV12格式图像数据回到系统内存中;
最后根据输出媒体类型将此图像数据封装成Sample并传递给下游Filter中,进入下一次获取屏幕区域图像的循环中。
2.根据权利要求1所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于:所述的图像处理和图像数据转换,都以OpenCL Buffer作为图像数据的存储载体,即这部分图像处理和图像数据转换工作过程中,图像数据都存放在GPU管理的显存中,和CPU管理的系统内存之间没有额外的数据传输操作;直到图像数据转换成NV12格式图像数据后,才从OpenCL Buffer中取回输出的图像数据到系统内存中。
3.根据权利要求1所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于:所述的图像处理和图像数据转换,都在GPU上进行,并且只进行了两次host端和device端之间的数据传输,分别是:(1)进行图像处理和图像数据转换前,将图像数据从host端传输到device端;(2)图像处理和图像数据转换完成后,将图像数据从device端取回到host端中。
4.根据权利要求1所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于,所述的GPU并行计算,包含以下步骤:
对转换图像的每个2×2像素区域安排一个work-item进行颜色空间转换和色度亚采样计算;
每个work-item从输入的RGB32图像中读取对应像素数据,并将计算结果数据按照NV12图像存储格式存放到输出图像中;
对转换图像的每个16×16像素区域的颜色空间转换和色度亚采样计算工作安排在一个work-group中进行,每个work-group的大小为8×8,其中有64个work-item。
5.根据权利要求1或4所述的利用GPU并行加速图像转换的屏幕图像获取方法,其特征在于:所述的GPU并行计算,具体包含以下步骤:
进行滤波计算前,检查当前work‐item对应像素位置是否超出处理图像范围,若超出则不进行后续计算和操作;
从输入的RGB32图像读入2×2像素区域数据时,使用内置内存访问函数vload8分别将2对连续存放的2个像素点的4个通道分量一次性读取到寄存器中;对于输入图像共进行了2次内存读取的访问请求;
根据输入的4个RGB32像素数据,计算得出4个亮度Y值和1对色度UV值;
将4个亮度Y值和1对色度UV值写入输出图像时,使用内置内存访问函数vstore2分别将2对连续存放的2个像素点的亮度Y值和1对色度UV值一次性写入到输出图像的Y‐plane和UV‐plane中,对于输出图像共进行了3次内存写入的访问请求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510551426.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于铝板拉力检测装置的橡胶吸盘夹紧机构
- 下一篇:研磨垫整理器及研磨装置