동영상 내장된 자막(Vobsub, 이미지형 자막)등을 srt or smi 글자 자막형태로 추출하는 방법! & 그냥 팟플레이어에서 자막확대하는 방법!
연구주제 (레버러토리) 2021. 8. 16. 17:07아래 사이트에 방법이 일단 나와있다.
MKV 동영상에 내장된 자막 추출하기 (2019.6.21)
https://tspace.tistory.com/140
요즘 자체자막이니, 동영상 내장자막등은 안타깝게도 한결같이 글자가 가독성에 대한 배려는 전혀 없이 코딱지만해서 이걸 제대로 보라는 건지 의아할 때가 있다.
순수하게 영상에 자막이 그냥 합쳐진 자체자막=하드섭의 추출과정은 아래 포스팅에서 예시한바 있다.
https://charlieman.tistory.com/1009
OCR 스캔을 일일히 영역지정해서 하고, 일일히 글자가 오류난 구간을 수정해야 하므로 상노가다!
여기서는 영상에서 자막옵션을 클릭하면 글씨가 나오는 내장자막이 있는 영상의 사례!
먼저 MKVToolNix GUI 등을 활용하여 한글 자막만 추출하는 방법도 있는데..
내장된 자막이 srt나 smi이면 바로 완벽한 자막이 추출가능하지만, VobSub일 경우 일단 Sub 파일등으로 자막이 추출된다.
Sub 파일은 이미지 파일이므로, 위 링크에선 다시 Subtitle Edit 프로그램을 열어서 자막파일을 넣고, OCR 스캔을 하여 smi로 바꾸는 방법등을 소개하지만,
애초 MKVToolNix GUI 등을 생략하고, 동영상 파일을 바로 Subtitle Edit 에 집어넣고 진행하는 것이 더욱 간편하다.
(설치가 안될때는 윈도우의 업데이트를 어느정도 해준다. "보안 업데이트" 항목은 생략하고 순수하게 "업데이트" 항목만 설치하다보면 재부팅후 어느새 설치가 된다.)
영상을 마우스 드래그로 프로그램에 끌어놓으면..
별도의 팝업창이 나타나고, 확인 버튼을 눌러준다.
하단에 빠르게 변환중 작업진행을 알리는 %가 빠르게 나타나고,
다시 OCR 작업을 하는 새창이 뜬다.
자막싱크등은 성공적으로 나오나, 텍스트 영역에 아무것도 없는 상태.. OCR 시작을 누른다.
아래는 진행중인 모습, 텍스트 영역이 조금씩 글자로 채워지는 것을 볼수 있다.
한 실제 영상보다 10배이상 재생속도가 나오는듯하지만, 컴퓨터의 CPU 성능에 따라서 다를수가 있다.
처리가 끝나면 활성화된 확인 버튼을 눌러줌!
이윽고 자막이 완료된 모습!
파일메뉴, 다른이름으로 저장을 들어가, srt 포맷으로 자막을 저장해주면 끝!
영상에 분리된 srt 자막이 뚝딱하고 만들어진 풍경!
어때요? 참 쉽죠??
이제 곰플등으로 재생을 해보면..?
srt를 우선적용한 자막으로, 제대로 큰 글씨로 나오는 것을 볼수 있다...
단, 모든 자막이 완벽하지는 않다..
위와같이 문법이 파괴된 자막들이 상당수인 것이다.
결국은 일일히 자막을 일일히 눈으로 보며 수동으로 수정해야 하는가!!!
다른 Subtitle Edit의 설명이긴 하나, 오류허용과 픽셀간격등의 옵션이 있을 경우, 좀더 글씨 인식의 오차를 줄일수도 있다.
알아봤자 쓸모 없는 팁 - DVD 자막을 SRT 자막으로 변환하기 (2019.3.31)
https://m.blog.naver.com/periwinkle99/221501644720
결국 다시 방법을 고심...
별도의 자막추출 방법보다는 동영상 재생 프로그램의 기능 자체를 찾아보았다.
자막 메뉴에 설정에서 "불투명 박스-사용체크"로 배경 영역을 좀 찐하게 해주고, 세로 위치를 적당히 조절한다음.
자막 스타일 설정에서 "이미지 자막 위치 사용자 설정 적용"에서 배율을 140% 정도로 확 확대하니 그제서야 드러누워 볼 만한 영상이 나온다.
단,, 이 방법도 자막이 두줄 자막일 경우 잘 먹히는데...
영상과 분리된 별도의 sub 자막등으로,
전체 영역에 걸쳐 자막이 나타나는 경우엔 먹히지가 않는다.