rework android-rmt display, add a few buttons
[goodguy/history.git] / cinelerra-5.0 / cinelerra / ffmpeg.h
1 #ifndef FFMPEG_H
2 #define FFMPEG_H
3
4 #include <stdio.h>
5 #include <stdint.h>
6 #include <stdlib.h>
7 #include <unistd.h>
8 #include <string.h>
9
10 #include "arraylist.h"
11 #include "asset.inc"
12 #include "bccmodels.h"
13 #include "bcwindowbase.inc"
14 #include "condition.h"
15 #include "cstrdup.h"
16 #include "linklist.h"
17 #include "ffmpeg.inc"
18 #include "filebase.inc"
19 #include "fileffmpeg.inc"
20 #include "indexstate.inc"
21 #include "mutex.h"
22 #include "thread.h"
23 #include "vframe.inc"
24
25 extern "C" {
26 #include "libavfilter/buffersrc.h"
27 #include "libavfilter/buffersink.h"
28 #include "libavformat/avformat.h"
29 #include "libavformat/avio.h"
30 #include "libavcodec/avcodec.h"
31 #include "libavfilter/avfilter.h"
32 #include "libavutil/avutil.h"
33 #include "libavutil/opt.h"
34 #include "libavutil/pixdesc.h"
35 #include "libswresample/swresample.h"
36 #include "libswscale/swscale.h"
37 }
38
39 class FFPacket  {
40         AVPacket pkt;
41 public:
42         FFPacket();
43         ~FFPacket();
44         void init();
45         operator AVPacket*() { return &pkt; }
46         operator AVPacket&() { return pkt; }
47         AVPacket *operator ->() { return &pkt; }
48 };
49
50 class FFrame : public ListItem<FFrame> {
51         AVFrame *frm;
52         int init;
53 public:
54         int64_t position;
55         FFStream *fst;
56
57         FFrame(FFStream *fst);
58         ~FFrame();
59
60         operator AVFrame*() { return frm; }
61         operator AVFrame&() { return *frm; }
62         AVFrame *operator ->() { return frm; }
63
64         int initted() { return init; }
65         void queue(int64_t pos);
66         void dequeue();
67 };
68
69 class FFStream {
70 public:
71         FFStream(FFMPEG *ffmpeg, AVStream *st, int fidx);
72         ~FFStream();
73         static void ff_lock(const char *cp=0);
74         static void ff_unlock();
75         void queue(FFrame *frm);
76         void dequeue(FFrame *frm);
77
78         virtual int encode_activate();
79         virtual int decode_activate();
80         int read_packet();
81         int seek(int64_t no, double rate);
82         int write_packet(FFPacket &pkt);
83         int flush();
84         int decode(AVFrame *frame);
85         void load_markers(IndexMarks &marks, double rate);
86
87         virtual int is_audio() = 0;
88         virtual int is_video() = 0;
89         virtual int decode_frame(AVPacket *pkt, AVFrame *frame, int &got_frame) = 0;
90         virtual int encode_frame(AVPacket *pkt, AVFrame *frame, int &got_frame) = 0;
91         virtual int init_frame(AVFrame *frame) = 0;
92         virtual int create_filter(const char *filter_spec,
93                 AVCodecContext *src_ctx, AVCodecContext *sink_ctx) = 0;
94         virtual void load_markers() = 0;
95         int create_filter(const char *filter_spec);
96         int load_filter(AVFrame *frame);
97         int read_filter(AVFrame *frame);
98         int read_frame(AVFrame *frame);
99
100         FFMPEG *ffmpeg;
101         AVStream *st;
102         AVFormatContext *fmt_ctx;
103
104         AVFilterContext *buffersink_ctx;
105         AVFilterContext *buffersrc_ctx;
106         AVFilterGraph *filter_graph;
107         AVFrame *frame, *fframe;
108
109         class BSFilter {
110         public:
111                 AVBitStreamFilterContext *bsfc;
112                 const char *args;
113                 BSFilter(const char *bsf, const char *ap) {
114                         bsfc = av_bitstream_filter_init(bsf);
115                         args = ap ? cstrdup(ap) : 0;
116                 }
117                 ~BSFilter() {
118                         av_bitstream_filter_close(bsfc);
119                         delete [] args;
120                 }
121         };
122         void add_bsfilter(const char *bsf, const char *ap);
123         ArrayList<BSFilter *> bsfilter;
124         int bs_filter(AVPacket *pkt);
125
126         FFPacket ipkt;
127         int need_packet, flushed;
128
129         int frm_count;
130         List<FFrame> frms;
131         Mutex *frm_lock;
132         IndexMarks *index_markers;
133
134         int64_t nudge;
135         int64_t seek_pos, curr_pos;
136         int fidx;
137         int reading, writing;
138         int seeked, eof;
139
140         int st_eof() { return eof; }
141         void st_eof(int v) { eof = v; }
142 };
143
144 class FFAudioStream : public FFStream {
145         float *inp, *outp, *bfr, *lmt;
146         int64_t hpos, sz;
147         int nch;
148
149         int read(float *fp, long len);
150         void realloc(long nsz, int nch, long len);
151         void realloc(long nsz, int nch);
152         void reserve(long nsz, int nch);
153         long used();
154         long avail();
155         void iseek(int64_t ofs);
156         float *get_outp(int len);
157         int64_t put_inp(int len);
158         int write(const float *fp, long len);
159         int zero(long len);
160         int write(const double *dp, long len, int ch);
161 public:
162         FFAudioStream(FFMPEG *ffmpeg, AVStream *strm, int idx, int fidx);
163         virtual ~FFAudioStream();
164         int is_audio() { return 1; }
165         int is_video() { return 0; }
166         int get_samples(float *&samples, uint8_t **data, int len);
167         int load_history(uint8_t **data, int len);
168         int decode_frame(AVPacket *pkt, AVFrame *frame, int &got_frame);
169         int encode_frame(AVPacket *pkt, AVFrame *frame, int &got_frame);
170         int create_filter(const char *filter_spec,
171                 AVCodecContext *src_ctx, AVCodecContext *sink_ctx);
172         void load_markers();
173
174         int encode_activate();
175         int nb_samples();
176         int64_t load_buffer(double ** const sp, int len);
177         int in_history(int64_t pos);
178         void reset_history();
179         int read(double *dp, long len, int ch);
180
181         int init_frame(AVFrame *frame);
182         int load(int64_t pos, int len);
183         int audio_seek(int64_t pos);
184         int encode(double **samples, int len);
185
186         int idx;
187         int channel0, channels;
188         int sample_rate;
189         int mbsz, frame_sz;
190         int64_t length;
191
192         SwrContext *resample_context;
193         int aud_bfr_sz;
194         float *aud_bfr;
195 };
196
197
198 class FFVideoConvert {
199 public:
200         struct SwsContext *convert_ctx;
201
202         FFVideoConvert() { convert_ctx = 0; }
203         ~FFVideoConvert() { if( convert_ctx ) sws_freeContext(convert_ctx); }
204
205         static PixelFormat color_model_to_pix_fmt(int color_model);
206         static int pix_fmt_to_color_model(PixelFormat pix_fmt);
207
208         int convert_picture_vframe(VFrame *frame,
209                 AVPicture *ip, PixelFormat ifmt, int iw, int ih);
210         int convert_cmodel(VFrame *frame_out,
211                 AVPicture *ip, PixelFormat ifmt, int iw, int ih);
212         int transfer_cmodel(VFrame *frame_in,  //defaults->metadata
213                 AVFrame *ifp, PixelFormat ifmt, int iw, int ih);
214         int convert_vframe_picture(VFrame *frame,
215                 AVPicture *op, PixelFormat ofmt, int ow, int oh);
216         int convert_pixfmt(VFrame *frame_in,
217                  AVPicture *op, PixelFormat ofmt, int ow, int oh);
218         int transfer_pixfmt(VFrame *frame_in,  //metadata->defaults
219                  AVFrame *ofp, PixelFormat ofmt, int ow, int oh);
220 };
221
222 class FFVideoStream : public FFStream, public FFVideoConvert {
223 public:
224         FFVideoStream(FFMPEG *ffmpeg, AVStream *strm, int idx, int fidx);
225         virtual ~FFVideoStream();
226         int is_audio() { return 0; }
227         int is_video() { return 1; }
228         int decode_frame(AVPacket *pkt, AVFrame *frame, int &got_frame);
229         int encode_frame(AVPacket *pkt, AVFrame *frame, int &got_frame);
230         int create_filter(const char *filter_spec,
231                 AVCodecContext *src_ctx, AVCodecContext *sink_ctx);
232         void load_markers();
233
234         int init_frame(AVFrame *picture);
235         int load(VFrame *vframe, int64_t pos);
236         int video_seek(int64_t pos);
237         int encode(VFrame *vframe);
238
239         int idx;
240         double frame_rate;
241         int width, height;
242         int64_t length;
243         float aspect_ratio;
244
245         uint8_t *pkt_bfr;
246         int pkt_bfr_sz;
247         int64_t start_pts;
248 };
249
250 class FFMPEG : public Thread {
251 public:
252         static Mutex fflock;
253         static void ff_lock(const char *cp=0) { fflock.lock(cp); }
254         static void ff_unlock() { fflock.unlock(); }
255
256         int check_sample_rate(AVCodec *codec, int sample_rate);
257         AVRational check_frame_rate(AVCodec *codec, double frame_rate);
258         AVRational to_sample_aspect_ratio(Asset *asset);
259         AVRational to_time_base(int sample_rate);
260
261         static void set_option_path(char *path, const char *fmt, ...);
262         static void get_option_path(char *path, const char *type, const char *spec);
263         static int get_format(char *format, const char *path, char *spec);
264         static int scan_option_line(char *cp,char *tag,char *val);
265         int get_file_format();
266         int get_encoder(const char *options,
267                 char *format, char *codec, char *bsfilter, char *bsargs);
268         int get_encoder(FILE *fp,
269                 char *format, char *codec, char *bsfilter, char *bsargs);
270         int read_options(const char *options, AVDictionary *&opts);
271         int scan_options(const char *options, AVDictionary *&opts, AVStream *st);
272         int read_options(FILE *fp, const char *options, AVDictionary *&opts);
273         int load_options(const char *options, AVDictionary *&opts);
274         static int load_options(const char *path, char *bfr, int len);
275         void set_loglevel(const char *ap);
276         static double to_secs(int64_t time, AVRational time_base);
277         int info(char *text, int len);
278
279         int init_decoder(const char *filename);
280         int open_decoder();
281         int init_encoder(const char *filename);
282         int open_encoder(const char *type, const char *spec);
283         int close_encoder();
284
285         int total_audio_channels();
286         int total_video_channels();
287
288         int audio_seek(int ch, int64_t pos);
289         int video_seek(int layer, int64_t pos);
290
291         int decode(int chn, int64_t pos, double *samples, int len);
292         int decode(int layer, int64_t pos, VFrame *frame);
293         int decode_activate();
294         int encode(int stream, double **samples, int len);
295         int encode(int stream, VFrame *frame);
296         int encode_activate();
297
298         FileBase *file_base;
299         AVFormatContext *fmt_ctx;
300         ArrayList<FFAudioStream*> ffaudio;
301         ArrayList<FFVideoStream*> ffvideo;
302         AVDictionary *opts;
303         double opt_duration;
304         char *opt_video_filter;
305         char *opt_audio_filter;
306         char file_format[BCTEXTLEN];
307
308         class ffidx {
309         public:
310                 uint16_t st_idx, st_ch;
311                 ffidx() { st_idx = st_ch = 0; }
312                 ffidx(const ffidx &t) { st_idx = t.st_idx;  st_ch = t.st_ch; }
313                 ffidx(uint16_t fidx, uint16_t ch) { st_idx = fidx; st_ch = ch; }
314         };
315
316         ArrayList<ffidx> astrm_index;
317         ArrayList<ffidx> vstrm_index;
318         int mux_audio(FFrame *frm);
319         int mux_video(FFrame *frm);
320         Condition *mux_lock;
321         Condition *flow_lock;
322         int done, flow;
323         
324         void start_muxer();
325         void stop_muxer();
326         void flow_off();
327         void flow_on();
328         void flow_ctl();
329         void mux();
330         void run();
331
332         int decoding, encoding;
333         int has_audio, has_video;
334
335         FFMPEG(FileBase *file_base=0);
336         ~FFMPEG();
337         int scan(IndexState *index_state, int64_t *scan_position, int *canceled);
338
339         int ff_audio_stream(int channel) { return astrm_index[channel].st_idx; }
340         int ff_video_stream(int layer) { return vstrm_index[layer].st_idx; }
341
342         int ff_total_audio_channels();
343         int ff_total_astreams();
344         int ff_audio_channels(int stream);
345         int ff_sample_rate(int stream);
346         const char *ff_audio_format(int stream);
347         int ff_audio_pid(int stream);
348         int64_t ff_audio_samples(int stream);
349         int ff_audio_for_video(int vstream, int astream, int64_t &channels);
350
351         int ff_total_video_layers();
352         int ff_total_vstreams();
353         int ff_video_width(int stream);
354         int ff_video_height(int stream);
355         int ff_set_video_width(int stream, int width);
356         int ff_set_video_height(int stream, int height);
357         int ff_coded_width(int stream);
358         int ff_coded_height(int stream);
359         float ff_aspect_ratio(int stream);
360         double ff_frame_rate(int stream);
361         const char *ff_video_format(int stream);
362         int64_t ff_video_frames(int stream);
363         int ff_video_pid(int stream);
364
365         int ff_cpus();
366         void dump_context(AVCodecContext *ctx);
367 };
368
369 #endif /* FFMPEG_H */