>백엔드 개발 >파이썬 튜토리얼 >Python 프로그래밍: 카메라를 사용하여 비디오 캡처, 재생 및 저장

Python 프로그래밍: 카메라를 사용하여 비디오 캡처, 재생 및 저장

WBOY
WBOY앞으로
2023-04-24 12:43:111983검색

如何用 Python 捕获、播放和保存摄像头视频

며칠 전 한 독자가 팬 그룹에 질문을 했습니다.

Python에서 비디오 선명도와 대비를 향상시키는 방법은 무엇입니까?

이전에 Python을 사용하여 동영상을 조작하는 측면을 다루지 않았기 때문에 아직 다루지 않은 점을 독자들에게 알리게 되어 죄송합니다.

지난 이틀 동안 고민한 결과, 이 섹션에 내용을 추가해야 한다는 생각이 들었습니다. 한편으로는 참여 폭이 넓어지고 다른 한편으로는 다음에 대한 질문에 답할 수도 있습니다. 팬.

오늘은 먼저 영상 읽기와 재생, 영상 저장 등 Python에서 영상을 조작하는 가장 기본적인 작업부터 공유하겠습니다.

동영상 읽기

동영상을 캡처하려면 VideoCapture 개체를 만들어야 합니다. 해당 인수는 장치 인덱스 또는 비디오 파일 이름일 수 있습니다. 따라서 비디오를 읽는 방법에는 카메라에서 비디오를 읽는 것과 파일에서 비디오를 읽는 두 가지 방법이 있습니다.

카메라에서 비디오 읽기

카메라가 있는 노트북과 같이 카메라가 있는 장치의 경우 컴퓨터 카메라를 직접 활성화하고 카메라의 비디오 스트림을 읽을 수 있습니다.

import cv2 as cv
cap = cv.VideoCapture(0)
if not cap.isOpened():
print("Cannot open camera")
exit()
while True:
# 逐帧捕获
ret, frame = cap.read()
# 如果正确读取帧,ret为True
if not ret:
break
# 显示结果帧
cv.imshow('frame', frame)
if cv.waitKey(1) == ord('q'):
break
# 完成所有操作后,释放捕获器
cap.release()
cv.destroyAllWindows()

여기서는 장치 인덱스를 나타내는 VideoCapture 개체에 매개변수 0을 전달했습니다. 장치 인덱스는 어떤 카메라를 지정하는 숫자입니다. 일반적으로 카메라가 연결됩니다(저의 경우처럼). 그래서 그냥 0을 전달합니다. 1을 전달하여 두 번째 카메라를 선택할 수 있습니다.

cap.isOpened()는 비디오 캡처 여부를 결정하는 데 사용됩니다.

cap.read()는 부울 값(True/False)을 반환합니다. 프레임을 올바르게 읽었다면 True가 됩니다. 따라서 이 반환 값을 확인하면 영상의 끝부분을 확인할 수 있습니다.

cv.imshow 메소드는 비디오 프레임을 표시하는 데 사용됩니다. 비디오 재생의 원리는 프레임 단위로 재생하는 것입니다.

마지막에는 cap.release()를 통해 포로를 해제하는 것을 잊지 마세요.

이 코드를 실행하면 컴퓨터 카메라의 이미지가 실시간으로 재생되는 팝업 창이 나타납니다.

파일에서 비디오 재생

카메라에서 캡처하는 것과 동일하게 카메라 인덱스를 비디오 파일 이름으로 변경하면 됩니다.

또한 동영상을 표시할 때 cv.waitKey()를 통해 동영상 재생 속도를 제어할 수 있습니다. 설정이 너무 작으면 비디오가 매우 빨라져 2배속 재생과 동일해지고, 너무 크면 비디오가 매우 느려져 지연된 재생이 됩니다. 일반적으로 25밀리초가 적당합니다.

import cv2 as cv
cap = cv.VideoCapture('video.mp4')
while cap.isOpened():
ret, frame = cap.read()
# 如果正确读取帧,ret为True
if not ret:
break
cv.imshow('frame', frame)
if cv.waitKey(1) == ord('q'):
break
cap.release()
cv.destroyAllWindows()

이 코드를 실행하면 선택한 동영상 파일이 재생되는 팝업 창이 나타납니다.

비디오 저장

카메라에서 비디오를 읽으면 비디오를 로컬에 저장할 수 있습니다. 비디오를 캡처하고 프레임별로 처리합니다. 이 비디오를 저장하려면 cv.VideoWriter()를 사용하면 됩니다.

cv.VideoWriter()에는 5개의 매개변수가 있습니다.

  • 매개변수 1: 출력 파일 이름(예: output.mp4).
  • 매개변수 2: FourCC 코드, FourCC는 비디오 코덱을 지정하는 데 사용되는 4바이트 코드입니다.
  • 매개변수 3: 프레임 속도 수입니다.
  • 매개변수 4: 프레임 크기.
  • 매개변수 5: 색상 플래그. True이면 일반 컬러 출력이고, 그렇지 않으면 회색 이미지 출력입니다.

FourCC와 비디오 형식의 비교와 관련하여 몇 가지 일반적인 형식을 나열했습니다.

cv2.VideoWriter_fourcc('P','I','M','1') = MPEG-1 코덱 cv2.VideoWriter_fourcc ( 'M','J','P','G') = 모션-jpeg 코덱 --> mp4v cv2.VideoWriter_fourcc('M', 'P', '4', '2') = MPEG-4.2 코덱 cv2.VideoWriter_fourcc('D', 'I', 'V', '3') = MPEG-4.3 코덱 cv2.VideoWriter_fourcc('D', 'I', 'V', 'X') = MPEG-4 코덱 --> avi cv2.VideoWriter_fourcc('U', '2', '6', '3') = H263 코덱 cv2.VideoWriter_fourcc('I', '2', '6', '3') = H263I 코덱 cv2.VideoWriter_fourcc('F', 'L', 'V', '1') = FLV1 코덱

비디오 저장 코드:

import cv2 as cv
cap = cv.VideoCapture(0)
# 定义编解码器并创建VideoWriter对象
fourcc = cv.VideoWriter_fourcc(*'MJPG')
out = cv.VideoWriter('output.mp4', fourcc, 20.0, (640,480))
while cap.isOpened():
ret, frame = cap.read()
if not ret:
break
frame = cv.flip(frame, 1)
# 写翻转的框架
out.write(frame)
cv.imshow('frame', frame)
if cv.waitKey(1) == ord('q'):
break
# 完成工作后释放所有内容
cap.release()
out.release()
cv.destroyAllWindows()

이 코드를 실행하면 mp4 비디오에서 출력을 찾을 수 있습니다. 파일.

위 코드에서 비디오 작업을 종료하려면 키보드에서 q를 누르기만 하면 됩니다.

요약

오늘 소개할 내용은 python-opencv를 사용하여 영상을 조작하는 방법은 비교적 간단합니다. 물론, 동영상을 읽거나 저장할 때 동영상에 대한 일부 처리를 수행할 수도 있습니다. 이에 대해서는 다음 기사에서 소개하겠습니다.

위 내용은 Python 프로그래밍: 카메라를 사용하여 비디오 캡처, 재생 및 저장의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제