07d7d6733fb01e294f142df9c276572347827ca1
[goodguy/cinelerra.git] / cinelerra-5.1 / cinelerra / boxblur.C
1 #include "boxblur.h"
2 // from ffmpeg vf_boxblur
3
4 template<class dst_t, class src_t> static inline
5 void blurt(dst_t *dst, int dst_step, src_t *src, int src_step,
6                 int len, int radius, float s)
7 {
8         const int length = radius*2 + 1;
9         const int inv = s * ((1<<16) + length/2)/length;
10         int x, n, sum = src[radius*src_step];
11
12         for( x=0; x<radius; ++x )
13                 sum += src[x*src_step]<<1;
14         sum = sum*inv + (1<<15);
15         for( x=0; x<=radius; ++x ) {
16                 sum += (src[(radius+x)*src_step] - src[(radius-x)*src_step])*inv;
17                 dst[x*dst_step] = sum>>16;
18         }
19         n = len - radius;
20         for( ; x<n; ++x ) {
21                 sum += (src[(radius+x)*src_step] - src[(x-radius-1)*src_step])*inv;
22                 dst[x*dst_step] = sum >>16;
23         }
24         for ( ; x<len; ++x ) {
25                 sum += (src[(2*len-radius-x-1)*src_step] - src[(x-radius-1)*src_step])*inv;
26                 dst[x*dst_step] = sum>>16;
27         }
28 }
29 // specialize const float *src
30 template<class dst_t> static inline
31 void blurt(dst_t *dst, int dst_step, const float *src, int src_step,
32                 int len, int radius, float s)
33 {
34         const float length = radius*2 + 1;
35         const float inv = s / length;
36         int x, n;
37         float sum = src[radius*src_step];
38         for( x=0; x<radius; ++x )
39                 sum += src[x*src_step]*2;
40         sum = sum*inv;
41         for( x=0; x<=radius; ++x ) {
42                 sum += (src[(radius+x)*src_step] - src[(radius-x)*src_step])*inv;
43                 dst[x*dst_step] = sum;
44         }
45         n = len - radius;
46         for( ; x<n; ++x ) {
47                 sum += (src[(radius+x)*src_step] - src[(x-radius-1)*src_step])*inv;
48                 dst[x*dst_step] = sum;
49         }
50         for ( ; x<len; ++x ) {
51                 sum += (src[(2*len-radius-x-1)*src_step] - src[(x-radius-1)*src_step])*inv;
52                 dst[x*dst_step] = sum;
53         }
54 }
55
56 // s scales dst=src first pass
57 template<class dst_t, class src_t> static inline
58 void blur_power(dst_t *dst, int dst_step, src_t *src, int src_step,
59                 int len, int radius, int power, float s)
60 {
61         dst_t atemp[len], btemp[len];
62         dst_t *a = atemp, *b = btemp;
63         blurt(a, 1, src, src_step, len, radius, s);
64         while( power-- > 2 ) {
65                 blurt(b, 1, (const dst_t*)a, 1, len, radius, 1);
66                 dst_t *t = a; a = b; b = t;
67         }
68         if( power > 1 )
69                 blurt(dst, dst_step, (const dst_t*)a, 1, len, radius, 1);
70         else
71                 for( int i = 0; i<len; ++i ) dst[i*dst_step] = a[i];
72 }
73
74
75 BoxBlurPackage::BoxBlurPackage()
76  : LoadPackage()
77 {
78 }
79
80 BoxBlurUnit::BoxBlurUnit(BoxBlur *box_blur)
81  : LoadClient(box_blur)
82 {
83 }
84
85 template<class dst_t, class src_t>
86 void BoxBlurUnit::blurt_package(LoadPackage *package)
87 {
88         BoxBlur *box_blur = (BoxBlur *)server;
89         src_t *src_data = (src_t *)box_blur->src_data;
90         dst_t *dst_data = (dst_t *)box_blur->dst_data;
91         int radius = box_blur->radius;
92         int power = box_blur->power;
93         int vlen = box_blur->vlen;
94         int c0 = box_blur->c0, c1 = box_blur->c1;
95         int src_ustep = box_blur->src_ustep;
96         int dst_ustep = box_blur->dst_ustep;
97         int src_vstep = box_blur->src_vstep;
98         int dst_vstep = box_blur->dst_vstep;
99         BoxBlurPackage *pkg = (BoxBlurPackage*)package;
100         int u1 = pkg->u1, u2 = pkg->u2;
101         float s = 1.;
102         if( sizeof(src_t) != sizeof(dst_t) ) {
103                 switch( sizeof(dst_t) ) {
104                 case 1: s = sizeof(src_t)==2 ? 1/256. : 255.;  break;
105                 case 2: s = sizeof(src_t)==1 ?   256. : 65535.;  break;
106                 case 4: s = sizeof(src_t)==1 ? 1/256. : 1/65535.;  break;
107                 }
108         }
109         for( int u=u1; u<u2; ++u ) {
110                 src_t *sp = src_data + u*src_ustep;
111                 dst_t *dp = dst_data + u*dst_ustep;
112                 for( int c=c0; c<=c1; ++c ) {
113                         blur_power(dp+c, dst_vstep, sp+c, src_vstep,
114                                 vlen, radius, power, s);
115                 }
116         }
117 }
118
119 void BoxBlurUnit::process_package(LoadPackage *package)
120 {
121         BoxBlur *box_blur = (BoxBlur *)server;
122         int src_bpp = box_blur->src_bpp, dst_bpp = box_blur->dst_bpp;
123         switch( src_bpp ) {
124         case 1: switch( dst_bpp ) {
125                 case 1: blurt_package<uint8_t,  const uint8_t>(package);  break;
126                 case 2: blurt_package<uint16_t, const uint8_t>(package);  break;
127                 case 4: blurt_package<float,    const uint8_t>(package);  break;
128                 }
129                 break;
130         case 2: switch( dst_bpp ) {
131                 case 1: blurt_package<uint8_t,  const uint16_t>(package); break;
132                 case 2: blurt_package<uint16_t, const uint16_t>(package); break;
133                 case 4: blurt_package<float,    const uint16_t>(package); break;
134                 }
135                 break;
136         case 4: switch( dst_bpp ) {
137                 case 1: blurt_package<uint8_t,  const float>(package);    break;
138                 case 2: blurt_package<uint16_t, const float>(package);    break;
139                 case 4: blurt_package<float,    const float>(package);    break;
140                 }
141                 break;
142         }
143 }
144
145 BoxBlur::BoxBlur(int cpus)
146  : LoadServer(cpus, cpus)
147 {
148 }
149 BoxBlur::~BoxBlur()
150 {
151 }
152
153 LoadClient* BoxBlur::new_client() { return new BoxBlurUnit(this); }
154 LoadPackage* BoxBlur::new_package() { return new BoxBlurPackage(); }
155
156 void BoxBlur::init_packages()
157 {
158         int u = 0;
159         for( int i=0,n=LoadServer::get_total_packages(); i<n; ) {
160                 BoxBlurPackage *pkg = (BoxBlurPackage*)get_package(i);
161                 pkg->u1 = u;
162                 pkg->u2 = u = (++i * ulen) / n;
163         }
164 }
165
166 //dst can equal src, requires geom(dst)==geom(src)
167 //uv: 0=hblur, 1=vblur;  comp: -1=rgb,0=r,1=g,2=b
168 void BoxBlur::process(VFrame *dst, VFrame *src, int uv,
169                 int radius, int power, int comp)
170 {
171         this->radius = radius;
172         this->power = power;
173         this->uv = uv;
174         int src_w = src->get_w(), src_h = src->get_h();
175         ulen = !uv ? src_h : src_w;
176         vlen = !uv ? src_w : src_h;
177         c0 = comp<0 ? 0 : comp;
178         c1 = comp<0 ? 2 : comp;
179         src_data = src->get_data();
180         dst_data = dst->get_data();
181         int src_pixsz = BC_CModels::calculate_pixelsize(src->get_color_model());
182         int src_comps = BC_CModels::components(src->get_color_model());
183         src_bpp = src_pixsz / src_comps;
184         int dst_pixsz = BC_CModels::calculate_pixelsize(dst->get_color_model());
185         int dst_comps = BC_CModels::components(dst->get_color_model());
186         dst_bpp = dst_pixsz / dst_comps;
187         int dst_linsz = dst->get_bytes_per_line() / dst_bpp;
188         int src_linsz = src->get_bytes_per_line() / src_bpp;
189         src_ustep = !uv ? src_linsz : src_comps;
190         dst_ustep = !uv ? dst_linsz: dst_comps;
191         src_vstep = !uv ? src_comps : src_linsz;
192         dst_vstep = !uv ? dst_comps : dst_linsz;
193
194         process_packages();
195 }
196
197 void BoxBlur::hblur(VFrame *dst, VFrame *src, int radius, int power, int comp)
198 {
199         process(dst, src, 0, radius, power, comp);
200 }
201 void BoxBlur::vblur(VFrame *dst, VFrame *src, int radius, int power, int comp)
202 {
203         process(dst, src, 1, radius, power, comp);
204 }
205 void BoxBlur::blur(VFrame *dst, VFrame *src, int radius, int power, int comp)
206 {
207         process(dst, src, 0, radius, power, comp);
208         process(dst, dst, 1, radius, power, comp);
209 }
210