这段代码每次都在嵌套循环中运行 9600 次,并且在 iPhone4S 上运行的总时间必须少于 30 毫秒:
vImage_Buffer source = { sourceArea.data, patchSide, patchSide, patchSide };
vImage_Buffer destination = { (uchar*)malloc(patchSide * patchSide * sizeof(uchar)), patchSide, patchSide, patchSide };
vImage_AffineTransform transform = { warpingMatrix(0,0), warpingMatrix(0,1), warpingMatrix(1,0), warpingMatrix(1,1), 0, 0 };
if (vImageAffineWarp_Planar8(&source, &destination, NULL, &transform, 0, kvImageBackgroundColorFill) != kvImageNoError)
{
NSLog(@"Error in warping!");
}
它似乎没有那么快,因为一个 10x10 的补丁大约需要 0.0002 秒。我是否忽略了一些重大的性能错误?
我要解决的问题是匹配向后扭曲的图像,这是第一步。补丁在围绕一个点的 64 个不同位置被扭曲 64 次,每个点最多 150 个点。
10x10 是一个非常小的图像。您很容易将大部分时间花在开销/malloc 上。仪器时间跟踪应该有助于确定时间的去向。
4s 上的向量 ALU 也是 5s 或 5s 宽度的一半,因此不能提供太多胜过标量的能力。
关于ios - vImage 与具有 dispatch_apply 的正常循环具有相同的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25337267/
欢迎光临 OStack程序员社区-中国程序员成长平台 (https://ostack.cn/) | Powered by Discuz! X3.4 |