유튜브 동영상 자막 정제 및 다운로더
개요 이 프로젝트는 동영상 플랫폼의 자동 생성 자막(Auto-generated Captions)을 다운로드하여 가독성이 높은 문단 형태로 정제하는 웹 및 CLI 기반 Python 어플리케이션입니다. 개발 배경 및 목적 이 프로젝트는 사용자가 동영상 자막을 2차 자료로 활용할 때 직면하는 불편함을 근본적으로 해결하기 위해 시작되었습니다. 배경: 자막 파일을 다운로드하기 위한 기술적 장벽과, 자동 생성 자막의 부정확한 구두점 및 잦은 줄 바꿈으로 인한 텍스트 데이터의 현저한 비가독성 문제 목적: 기술적 및 데이터 품질 문제를 극복하고, 문맥을 고려하여 라인을 병합하고 정제된 텍스트를 확보하여 자막 파일을 분석 작업에 곧바로 활용할 수 있도록 지원 ...