Я только что установил OpenCV 2.4 из исходного кода на Ubuntu 12.04. Я пытаюсь использовать сценарий Python для записи первого кадра видео в изображение PNG, но получаю странные результаты. Вот код:
import numpy as np
import cv
import cv2
import sys
video = cv.CaptureFromFile(sys.argv[1])
frame = cv.QueryFrame(video)
proxy = cv.CreateImage(cv.GetSize(frame), 8, 1)
cv.CvtColor(frame, proxy, cv.CV_BGR2GRAY)
a = np.asarray(cv.GetMat(proxy))
cv2.imwrite('image.png', a)
Проблема в том, что изображение выглядит так:
Это файлы AVI, и в остальном все в порядке. Любые идеи?
Редактировать №1: Извините, вот информация о версии ffmpeg:
ffmpeg version 0.10.2-4:0.10.2-0ubuntu0jon1
built on Mar 18 2012 09:59:38 with gcc 4.6.3
configuration: --extra-version='4:0.10.2-0ubuntu0jon1' --arch=amd64 --prefix=/usr --libdir=/usr/lib/x86_64-linux-gnu --disable-stripping --enable-vdpau --enable-bzlib --enable-libgsm --enable-libschroedinger --enable-libspeex --enable-libtheora --enable-libvorbis --enable-pthreads --enable-zlib --enable-libvpx --enable-runtime-cpudetect --enable-libfreetype --enable-vaapi --enable-frei0r --enable-gpl --enable-postproc --enable-x11grab --enable-librtmp --enable-libvo-aacenc --enable-version3 --enable-libvo-amrwbenc --enable-version3 --enable-libdc1394 --shlibdir=/usr/lib/x86_64-linux-gnu --enable-shared --disable-static
libavutil 51. 35.100 / 51. 35.100
libavcodec 53. 61.100 / 53. 61.100
libavformat 53. 32.100 / 53. 32.100
libavdevice 53. 4.100 / 53. 4.100
libavfilter 2. 61.100 / 2. 61.100
libswscale 2. 1.100 / 2. 1.100
libswresample 0. 6.100 / 0. 6.100
libpostproc 52. 0.100 / 52. 0.100
Редактировать №2: В моем собственном устранении неполадок я обновил ffmpeg с версии по умолчанию 12.04 ubuntu до той, которую вы видите в Правке №1 выше. Похоже, это немного изменило ситуацию: видео, сгенерировавшее кадр в этом вопросе, теперь, похоже, работает нормально, но большие видео все еще присутствуют с поврежденными нижними половинами (или нижними третями или четвертями). Даже большие видео на самом деле полностью перестают работать. Я не совсем уверен, что с этим делать, кроме - опять же - неисправных или отсутствующих кодеков. Он выходит из строя прямо на QueryFrame
шаге.
Изменить № 3: я изменил код, чтобы использовать исключительно интерфейс cv2 (согласно ссылке в одном из комментариев ниже). Теперь video.retrieve()
всегда возвращает False
, и изображение не записывается.
Редактировать №4: Я выполнил следующую команду для видео перед использованием нового интерфейса cv2 для чтения видеокадров:
ffmpeg -sameq -i normal.avi p_normal.avi
Вывод команды выглядел нормально, за исключением этой строки после инициализации ffmpeg и ее описания ввода:
Несовместимый формат пикселей pal8 для кодека mpeg4, автоматический выбор формата yuv420p
Вот полный вывод команды:
Input #0, avi, from 'normal.avi':
Duration: 00:01:37.60, start: 0.000000, bitrate: 1312 kb/s
Stream #0:0: Video: rawvideo, pal8, 128x256, 5 tbr, 5 tbn, 5 tbc
Incompatible pixel format 'pal8' for codec 'mpeg4', auto-selecting format 'yuv420p'
[buffer @ 0x11a0f80] w:128 h:256 pixfmt:pal8 tb:1/1000000 sar:0/1 sws_param:
[buffersink @ 0x11a1380] auto-inserting filter 'auto-inserted scale 0' between the filter 'src' and the filter 'out'
[scale @ 0x1197da0] w:128 h:256 fmt:pal8 -> w:128 h:256 fmt:yuv420p flags:0x4
Output #0, avi, to 'p_normal.avi':
Metadata:
ISFT : Lavf53.32.100
Stream #0:0: Video: mpeg4 (FMP4 / 0x34504D46), yuv420p, 128x256, q=2-31, 200 kb/s, 5 tbn, 5 tbc
Stream mapping:
Stream #0:0 -> #0:0 (rawvideo -> mpeg4)
Press [q] to stop, [?] for help
frame= 488 fps= 0 q=0.0 Lsize= 1497kB time=00:01:37.60 bitrate= 125.6kbits/s
video:1480kB audio:0kB global headers:0kB muxing overhead 1.165352%
Что наиболее важно, код Python OpenCV для чтения кадра (с использованием интерфейса cv2) по-прежнему возвращает False (такое же поведение, как и раньше).
Изменить № 5: Я до сих пор следовал инструкциям, здесь для установки ffmpeg и его зависимостей из исходного кода, и все прошло гладко. Без переустановки OpenCV из исходного кода я все еще сталкиваюсь с той же проблемой, что и раньше, когда video.retrieve()
возвращает False. Пытаясь перекомпилировать OpenCV 2.4 из исходного кода, я получаю следующую ошибку во время компиляции:
Linking CXX shared library ../../lib/libopencv_highgui.so
/usr/bin/ld: /usr/local/lib/libavcodec.a(avpacket.o): relocation R_X86_64_32S against `av_destruct_packet' can not be used when making a shared object; recompile with -fPIC
/usr/local/lib/libavcodec.a: could not read symbols: Bad value
Если я перекомпилирую x264, libvpx и ffmpeg с флагом --enable-pic
, компиляция OpenCV все равно не удастся, на этот раз с (kdbwin.o
, .rodata
) вместо (avpacket.o
, av_destruct_packet
) соответственно в фрагменте выше.
Редактировать №6: Исправлена указанная выше ошибка, добавив --enable-shared
к параметрам конфигурации libvpx и ffmpeg. OpenCV успешно перекомпилирован и собран, и ffmpeg работал нормально. К сожалению, после выполнения предыдущей команды (ffmpeg -sameq -i normal.avi p_normal.avi
) мой скрипт still не смог получить ни одного фрейма; возвращенный флаг все еще был ложным. Есть еще идеи?
Изменить № 7: Вот последний сценарий, который я использую.
import numpy as np
import cv2
import sys
video = cv2.VideoCapture(sys.argv[1])
flag, frame = video.retrieve()
if not flag:
print 'Error'
quit()
proxy = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imwrite('image.png', proxy)
Изменить № 8: Понятно! Вот каким должен быть код:
import numpy as np
import cv2
import sys
video = cv2.VideoCapture(sys.argv[1])
if video.grab():
flag, frame = video.retrieve()
if not flag:
print 'Error'
quit()
proxy = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
cv2.imwrite('image.png', proxy)