fix ffmpeg render options setup menus, tweak h264/h265 formats for cuda
[goodguy/cinelerra.git] / cinelerra-5.1 / cinelerra / ffmpeg.h
1 #ifndef FFMPEG_H
2 #define FFMPEG_H
3
4 #include <stdio.h>
5 #include <stdint.h>
6 #include <stdlib.h>
7 #include <unistd.h>
8 #include <string.h>
9
10 #include "arraylist.h"
11 #include "asset.inc"
12 #include "bccmodels.h"
13 #include "bcwindowbase.inc"
14 #include "condition.h"
15 #include "cstrdup.h"
16 #include "edl.inc"
17 #include "linklist.h"
18 #include "ffmpeg.inc"
19 #include "filebase.inc"
20 #include "fileffmpeg.inc"
21 #include "indexstate.inc"
22 #include "mutex.h"
23 #include "preferences.inc"
24 #include "thread.h"
25 #include "vframe.inc"
26
27 extern "C" {
28 #include "libavformat/avformat.h"
29 #include "libavformat/avio.h"
30 #include "libavcodec/avcodec.h"
31 #include "libavfilter/avfilter.h"
32 #include "libavutil/avutil.h"
33 #include "libavfilter/buffersrc.h"
34 #include "libavfilter/buffersink.h"
35 #include "libavutil/imgutils.h"
36 #include "libavutil/opt.h"
37 #include "libavutil/pixdesc.h"
38 #include "libswresample/swresample.h"
39 #include "libswscale/swscale.h"
40 }
41
42 class FFPacket  {
43         AVPacket pkt;
44 public:
45         operator AVPacket*() { return &pkt; }
46         operator AVPacket&() { return pkt; }
47         AVPacket *operator ->() { return &pkt; }
48
49         void init();
50         void finit();
51         FFPacket() { init(); }
52         ~FFPacket() { finit(); }
53 };
54
55 class FFrame : public ListItem<FFrame> {
56         AVFrame *frm;
57         int init;
58 public:
59         int64_t position;
60         FFStream *fst;
61
62         FFrame(FFStream *fst);
63         ~FFrame();
64
65         operator AVFrame*() { return frm; }
66         operator AVFrame&() { return *frm; }
67         AVFrame *operator ->() { return frm; }
68
69         int initted() { return init; }
70         void queue(int64_t pos);
71         void dequeue();
72         void set_hw_frame(AVFrame *frame);
73 };
74
75 class FFStream {
76 public:
77         FFStream(FFMPEG *ffmpeg, AVStream *st, int fidx);
78         ~FFStream();
79         static void ff_lock(const char *cp=0);
80         static void ff_unlock();
81         void queue(FFrame *frm);
82         void dequeue(FFrame *frm);
83
84         virtual int encode_activate();
85         virtual int decode_activate();
86         virtual AVHWDeviceType decode_hw_activate();
87         virtual int decode_hw_format(AVCodec *decoder, AVHWDeviceType type);
88         virtual int write_packet(FFPacket &pkt);
89         int read_packet();
90         int seek(int64_t no, double rate);
91         int flush();
92         int decode(AVFrame *frame);
93         void load_markers(IndexMarks &marks, double rate);
94
95         virtual int is_audio() = 0;
96         virtual int is_video() = 0;
97         virtual int decode_frame(AVFrame *frame) = 0;
98         virtual int encode_frame(AVFrame *frame) = 0;
99         virtual int init_frame(AVFrame *frame) = 0;
100         virtual int create_filter(const char *filter_spec, AVCodecParameters *avpar) = 0;
101         virtual void load_markers() = 0;
102         virtual IndexMarks *get_markers() = 0;
103         int create_filter(const char *filter_spec);
104         int load_filter(AVFrame *frame);
105         int read_filter(AVFrame *frame);
106         int read_frame(AVFrame *frame);
107         int open_stats_file();
108         int close_stats_file();
109         int read_stats_file();
110         int write_stats_file();
111         int init_stats_file();
112
113         FFMPEG *ffmpeg;
114         AVStream *st;
115         AVFormatContext *fmt_ctx;
116         AVCodecContext *avctx;
117
118         AVFilterContext *buffersink_ctx;
119         AVFilterContext *buffersrc_ctx;
120         AVFilterGraph *filter_graph;
121         AVFrame *frame, *fframe;
122         AVBSFContext *bsfc;
123
124         FFPacket ipkt;
125         int need_packet, flushed;
126
127         int frm_count;
128         List<FFrame> frms;
129         Mutex *frm_lock;
130
131         int64_t nudge;
132         int64_t seek_pos, curr_pos;
133         int fidx;
134         int reading, writing;
135         int seeked, eof;
136
137         int hw_pixfmt;
138         AVBufferRef *hw_device_ctx;
139
140         FILE *stats_fp;
141         char *stats_filename;
142         char *stats_in;
143         int pass;
144
145         int st_eof() { return eof; }
146         void st_eof(int v) { eof = v; }
147 };
148
149 class FFAudioStream : public FFStream {
150         float *inp, *outp, *bfr, *lmt;
151         int64_t hpos, sz;
152         int nch;
153
154         int read(float *fp, long len);
155         void realloc(long nsz, int nch, long len);
156         void realloc(long nsz, int nch);
157         void reserve(long nsz, int nch);
158         long used();
159         long avail();
160         void iseek(int64_t ofs);
161         float *get_outp(int len);
162         int64_t put_inp(int len);
163         int write(const float *fp, long len);
164         int zero(long len);
165         int write(const double *dp, long len, int ch);
166         int write_packet(FFPacket &pkt);
167 public:
168         FFAudioStream(FFMPEG *ffmpeg, AVStream *strm, int idx, int fidx);
169         virtual ~FFAudioStream();
170         int is_audio() { return 1; }
171         int is_video() { return 0; }
172         void init_swr(int ichs, int ifmt, int irate);
173         int get_samples(float *&samples, uint8_t **data, int len);
174         int load_history(uint8_t **data, int len);
175         int decode_frame(AVFrame *frame);
176         int encode_frame(AVFrame *frame);
177         int create_filter(const char *filter_spec, AVCodecParameters *avpar);
178         void load_markers();
179         IndexMarks *get_markers();
180
181         int encode_activate();
182         int64_t load_buffer(double ** const sp, int len);
183         int in_history(int64_t pos);
184         void reset_history();
185         int read(double *dp, long len, int ch);
186
187         int init_frame(AVFrame *frame);
188         int load(int64_t pos, int len);
189         int audio_seek(int64_t pos);
190         int encode(double **samples, int len);
191         int drain();
192
193         int idx;
194         int channel0, channels;
195         int sample_rate;
196         int mbsz, frame_sz;
197         int64_t length;
198
199         SwrContext *resample_context;
200         int swr_ichs, swr_ifmt, swr_irate;
201         int aud_bfr_sz;
202         float *aud_bfr;
203 };
204
205
206 class FFVideoConvert {
207 public:
208         Preferences *preferences;
209         struct SwsContext *convert_ctx;
210         AVFrame *sw_frame;
211
212         FFVideoConvert(Preferences *preferences) {
213                 this->preferences = preferences;
214                 convert_ctx = 0; sw_frame = 0;
215         }
216         ~FFVideoConvert() {
217                 if( convert_ctx ) sws_freeContext(convert_ctx);
218                 if( sw_frame ) av_frame_free(&sw_frame);
219         }
220
221         static AVPixelFormat color_model_to_pix_fmt(int color_model);
222         static int pix_fmt_to_color_model(AVPixelFormat pix_fmt);
223
224         int convert_picture_vframe(VFrame *frame, AVFrame *ip);
225         int convert_picture_vframe(VFrame *frame, AVFrame *ip, AVFrame *ipic);
226         int convert_cmodel(VFrame *frame, AVFrame *ip);
227         int transfer_cmodel(VFrame *frame, AVFrame *ifp);
228         int convert_vframe_picture(VFrame *frame, AVFrame *op);
229         int convert_vframe_picture(VFrame *frame, AVFrame *op, AVFrame *opic);
230         int convert_pixfmt(VFrame *frame, AVFrame *op);
231         int transfer_pixfmt(VFrame *frame, AVFrame *ofp);
232 };
233
234 class FFVideoStream : public FFStream, public FFVideoConvert {
235         int write_packet(FFPacket &pkt);
236 public:
237         FFVideoStream(FFMPEG *ffmpeg, AVStream *strm, int idx, int fidx);
238         virtual ~FFVideoStream();
239         int is_audio() { return 0; }
240         int is_video() { return 1; }
241         int decode_frame(AVFrame *frame);
242         AVHWDeviceType decode_hw_activate();
243         int decode_hw_format(AVCodec *decoder, AVHWDeviceType type);
244         AVHWDeviceType encode_hw_activate(const char *hw_dev);
245         int encode_hw_write(FFrame *picture);
246         int encode_frame(AVFrame *frame);
247         int create_filter(const char *filter_spec, AVCodecParameters *avpar);
248         void load_markers();
249         IndexMarks *get_markers();
250
251         int init_frame(AVFrame *picture);
252         int load(VFrame *vframe, int64_t pos);
253         int video_seek(int64_t pos);
254         int encode(VFrame *vframe);
255         int drain();
256
257         int idx;
258         double frame_rate;
259         int width, height;
260         int64_t length;
261         float aspect_ratio;
262
263         int interlaced;
264         int top_field_first;
265         int color_space, color_range;
266 };
267
268 class FFCodecRemap
269 {
270 public:
271         FFCodecRemap();
272         ~FFCodecRemap();
273         const char *old_codec, *new_codec;
274 };
275
276 class FFCodecRemaps : public ArrayList<FFCodecRemap>
277 {
278 public:
279         FFCodecRemaps() {}
280         int add(const char *val);
281         int update(AVCodecID &codec_id, AVCodec *&decoder);
282 };
283
284 class FFMPEG : public Thread {
285 public:
286         static Mutex fflock;
287         static void ff_lock(const char *cp=0) { fflock.lock(cp); }
288         static void ff_unlock() { fflock.unlock(); }
289
290         int check_sample_rate(AVCodec *codec, int sample_rate);
291         AVRational check_frame_rate(AVCodec *codec, double frame_rate);
292         AVRational to_sample_aspect_ratio(Asset *asset);
293         AVRational to_time_base(int sample_rate);
294         static int get_fmt_score(AVSampleFormat dst_fmt, AVSampleFormat src_fmt);
295         static AVSampleFormat find_best_sample_fmt_of_list(
296                 const AVSampleFormat *sample_fmts, AVSampleFormat src_fmt);
297
298         static void set_option_path(char *path, const char *fmt, ...);
299         static void get_option_path(char *path, const char *type, const char *spec);
300         static int get_format(char *format, const char *path, const char *spec);
301         static int get_codec(char *codec, const char *path, const char *spec);
302         static int scan_option_line(const char *cp,char *tag,char *val);
303         static int load_defaults(const char *path, const char *type,
304                  char *codec, char *codec_options, int len);
305         static int can_render(const char *fformat, const char *type);
306         static int renders_audio(const char *fformat) { return can_render(fformat, "audio"); }
307         static int renders_video(const char *fformat) { return can_render(fformat, "video"); }
308         static int get_ff_option(const char *nm, const char *options, char *value);
309         static void scan_audio_options(Asset *asset, EDL *edl);
310         static void load_audio_options(Asset *asset, EDL *edl);
311         static void scan_video_options(Asset *asset, EDL *edl);
312         static void load_video_options(Asset *asset, EDL *edl);
313         static void scan_format_options(Asset *asset, EDL *edl);
314         static void load_format_options(Asset *asset, EDL *edl);
315         static void set_asset_format(Asset *asset, EDL *edl, const char *text);
316         int get_file_format();
317         static int get_encoder(const char *options, char *format, char *codec, char *bsfilter);
318         static int scan_encoder(const char *line, char *format, char *codec, char *bsfilter);
319         int read_options(const char *options, AVDictionary *&opts, int skip=0);
320         int scan_options(const char *options, AVDictionary *&opts, AVStream *st);
321         int read_options(FILE *fp, const char *options, AVDictionary *&opts);
322         int load_options(const char *options, AVDictionary *&opts);
323         static int load_options(const char *path, char *bfr, int len);
324         void set_loglevel(const char *ap);
325         static double to_secs(int64_t time, AVRational time_base);
326         int info(char *text, int len);
327
328         int init_decoder(const char *filename);
329         int open_decoder();
330         int init_encoder(const char *filename);
331         int open_encoder(const char *type, const char *spec);
332         int close_encoder();
333
334         int total_audio_channels();
335         int total_video_channels();
336
337         int audio_seek(int ch, int64_t pos);
338         int video_seek(int layer, int64_t pos);
339
340         int decode(int chn, int64_t pos, double *samples, int len);
341         int decode(int layer, int64_t pos, VFrame *frame);
342         int decode_activate();
343         int encode(int stream, double **samples, int len);
344         int encode(int stream, VFrame *frame);
345         int encode_activate();
346
347         FileBase *file_base;
348         AVFormatContext *fmt_ctx;
349         ArrayList<FFAudioStream*> ffaudio;
350         ArrayList<FFVideoStream*> ffvideo;
351         AVDictionary *opts;
352         double opt_duration;
353         char *opt_video_filter;
354         char *opt_audio_filter;
355         char *opt_hw_dev;
356         char *opt_video_decoder;
357         char *opt_audio_decoder;
358         FFCodecRemaps video_codec_remaps;
359         FFCodecRemaps audio_codec_remaps;
360         char file_format[BCTEXTLEN];
361         int fflags;
362
363         class ffidx {
364         public:
365                 uint16_t st_idx, st_ch;
366                 ffidx() { st_idx = st_ch = 0; }
367                 ffidx(const ffidx &t) { st_idx = t.st_idx;  st_ch = t.st_ch; }
368                 ffidx(uint16_t fidx, uint16_t ch) { st_idx = fidx; st_ch = ch; }
369         };
370
371         ArrayList<ffidx> astrm_index;
372         ArrayList<ffidx> vstrm_index;
373         int mux_audio(FFrame *frm);
374         int mux_video(FFrame *frm);
375         Condition *mux_lock;
376         Condition *flow_lock;
377         int done, flow;
378
379         void start_muxer();
380         void stop_muxer();
381         void flow_off();
382         void flow_on();
383         void flow_ctl();
384         void mux();
385         void run();
386
387         int decoding, encoding;
388         int has_audio, has_video;
389
390         FFMPEG(FileBase *file_base=0);
391         ~FFMPEG();
392         int scan(IndexState *index_state, int64_t *scan_position, int *canceled);
393
394         int ff_audio_stream(int channel) { return astrm_index[channel].st_idx; }
395         int ff_video_stream(int layer) { return vstrm_index[layer].st_idx; }
396
397         int ff_total_audio_channels();
398         int ff_total_astreams();
399         int ff_audio_channels(int stream);
400         int ff_sample_rate(int stream);
401         const char *ff_audio_format(int stream);
402         int ff_audio_pid(int stream);
403         int64_t ff_audio_samples(int stream);
404         int ff_audio_for_video(int vstream, int astream, int64_t &channels);
405
406         int ff_total_video_layers();
407         int ff_total_vstreams();
408         int ff_video_width(int stream);
409         int ff_video_height(int stream);
410         int ff_set_video_width(int stream, int width);
411         int ff_set_video_height(int stream, int height);
412         int ff_coded_width(int stream);
413         int ff_coded_height(int stream);
414         float ff_aspect_ratio(int stream);
415         int ff_color_range(int stream);
416         int ff_color_space(int stream);
417         double ff_frame_rate(int stream);
418         const char *ff_video_codec(int stream);
419         int64_t ff_video_frames(int stream);
420         int ff_video_pid(int stream);
421         int ff_video_mpeg_color_range(int stream);
422
423         int ff_cpus();
424         const char *ff_hw_dev();
425         Preferences *ff_prefs();
426         void dump_context(AVCodecContext *ctx);
427 };
428
429 #endif /* FFMPEG_H */