Могу посоветовать посмотреть в сторону библиотек ffmpeg, недостаток в том, что нужно будет писать свой алгоритм синхронизации аудио с видео, плюс своя реализация вывода звука. Но это решит массу проблем, в т.ч. проблему с установкой кодеков и прочей ерунды.
|