convolutionseparable_gold.cpp
来自「可分离据卷积,在GPU上实现并行运算」· C++ 代码 · 共 58 行
CPP
58 行
////////////////////////////////////////////////////////////////////////////////
// CPU下行卷积滤波
////////////////////////////////////////////////////////////////////////////////
extern "C" void convolutionRowCPU(
float *h_Result,
float *h_Data,
float *h_Kernel,
int dataW,
int dataH,
int kernelR
)
{
int x, y, k, d;
float sum;
for(y = 0; y < dataH; y++)
for(x = 0; x < dataW; x++)
{
sum = 0;
for(k = -kernelR; k <= kernelR; k++)
{
d = x + k;
if(d >= 0 && d < dataW)
sum += h_Data[y * dataW + d] * h_Kernel[kernelR - k];
}
h_Result[y * dataW + x] = sum;
}
}
////////////////////////////////////////////////////////////////////////////////
//CPU下列卷积滤波
////////////////////////////////////////////////////////////////////////////////
extern "C" void convolutionColumnCPU(
float *h_Result,
float *h_Data,
float *h_Kernel,
int dataW,
int dataH,
int kernelR
){
int x, y, k, d;
float sum;
for(y = 0; y < dataH; y++)
for(x = 0; x < dataW; x++)
{
sum = 0;
for(k = -kernelR; k <= kernelR; k++){
d = y + k;
if(d >= 0 && d < dataH)
sum += h_Data[d * dataW + x] * h_Kernel[kernelR - k];
}
h_Result[y * dataW + x] = sum;
}
}
⌨️ 快捷键说明
复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?