TI中文支持网
TI专业的中文技术问题搜集分享网站

AM5728 opencv使用opencl加速问题

测试环境:3套AM5728 开发板均测试过,使用SD卡启动,最新版 3.2版SDK, 3.1版SDK, 3.0版SDK,均测试过。

export OPENCV_OPENCL_DEVICE='TI AM57:ACCELERATOR:TI Multicore C66 DSP' 环境变量配置

测试算法和结果:

形态学腐蚀算法:

erode(in_image, out_image, element);

算法循环次数10000次。

使用Opencl 耗时166225ms

未使用Opencl耗时 165889ms

 

dilate_opencl(in_image, out_image, element);

算法循环次数10000次。

使用Opencl 耗时167123ms

未使用Opencl耗时 166283ms

 

Sobel(src, dst_x, src.depth(), 1, 0);

Sobel(src, dst_y, src.depth(), 0, 1);

convertScaleAbs(dst_x, dst_x);

convertScaleAbs(dst_y, dst_y);

addWeighted(dst_x, 0.5, dst_y, 0.5, 0, dst);

算法循环次数100次。

使用Opencl 耗时14573.1ms

未使用Opencl耗时 14536.6ms

均没有得到明显的加速。

同样程序在 PC 测试环境下测试结果:

形态学腐蚀算法:

erode(in_image, out_image, element);

算法循环次数 10000次。

使用Opencl 耗时28999ms

未使用Opencl耗时 82914ms

 

dilate_opencl(in_image, out_image, element);

算法循环次数10000次。

使用Opencl 耗时28234ms

未使用Opencl耗时 89367ms

 

Sobel(src, dst_x, src.depth(), 1, 0);

Sobel(src, dst_y, src.depth(), 0, 1);

convertScaleAbs(dst_x, dst_x);

convertScaleAbs(dst_y, dst_y);

addWeighted(dst_x, 0.5, dst_y, 0.5, 0, dst);

算法循环次数100次。

使用Opencl 耗时1201ms

未使用Opencl耗时 40058ms

看到明显的加速效果

此测试结果和 TI 在 http://processors.wiki.ti.com/index.php/OpenCV 给出的测试结果差距很大,请问一下我是遗漏了什么配置吗?

Jian Zhou:

是参考这个文档做的测试么?

http://processors.wiki.ti.com/index.php/OpenCV

感觉DSP没有工作起来。

Pengpeng Xu:

回复 Jian Zhou:

是的,就是根据那个文档做的,测试的是TI优化过的那几个算法

Jian Zhou:

回复 Pengpeng Xu:

那个文档发布的,肯定是经过验证的,你再检查下配置。

user5875077:

和你遇到同样的问题,你怎么解决的?

yongqing wang:

回复 user5875077:

这里的两份OPENCL的资料看看:www.jiang-niu.com/download.html

赞(0)
未经允许不得转载:TI中文支持网 » AM5728 opencv使用opencl加速问题
分享到: 更多 (0)