- 작성자
1. 1시간 영상을 3분만에 파악하기
유튜브에 좋은 강의, 인터뷰, 기술 발표 영상이 많지만, 다 볼 시간이 없습니다. URL만 넣으면 핵심만 정리해주는 도구가 있으면 어떨까요?

2. 작동 원리

1. 자막 추출 — YouTube 자막(CC)을 텍스트로 가져옴
2. AI 분석 — 긴 자막 텍스트를 AI에게 보내서 핵심 추출
3. 요약 생성 — 핵심 포인트, 타임스탬프, 한줄 요약 출력
3. 1단계: 자막 추출
유튜브 영상의 자막을 가져오는 방법입니다:
# yt-dlp로 자막 다운로드
pip install yt-dlp
# 자동 생성 자막 포함해서 추출
yt-dlp --write-auto-sub --sub-lang ko,en --skip-download \
--sub-format vtt -o "subtitle" "https://youtube.com/watch?v=VIDEO_ID"
또는 Python에서 직접 가져올 수 있습니다:
from youtube_transcript_api import YouTubeTranscriptApi
transcript = YouTubeTranscriptApi.get_transcript("VIDEO_ID", languages=['ko', 'en'])
text = " ".join([t['text'] for t in transcript])
자막이 없는 영상은 Whisper로 음성을 텍스트로 변환할 수 있습니다:
# 음성 다운로드 후 Whisper로 변환
yt-dlp -x --audio-format mp3 "https://youtube.com/watch?v=VIDEO_ID"
whisper audio.mp3 --language ko --model medium
4. 2단계: AI 요약
추출한 자막을 AI에게 보내서 요약을 요청합니다:
const prompt = `다음은 유튜브 영상의 자막입니다. 핵심 내용을 요약해주세요.
요약 형식:
1. 한줄 요약 (1문장)
2. 핵심 포인트 (5-7개, 불릿 포인트)
3. 주요 타임스탬프 (중요한 부분의 시간대)
4. 결론/핵심 메시지
자막:
${transcriptText}`;
긴 영상 처리
1시간 영상의 자막은 수만 자가 됩니다. AI의 컨텍스트 제한을 고려해서:
- 청크 분할: 10분 단위로 나눠서 각각 요약 → 전체 요약
- 긴 컨텍스트 모델: Claude(200K 토큰)나 Gemini(1M 토큰)은 대부분의 영상을 한 번에 처리 가능
5. 3단계: 출력 형식
마크다운 요약
# 영상 요약: "React 19 새로운 기능 총정리"
## 한줄 요약
React 19에서 Server Components가 기본이 되고, use() 훅과 Actions가 추가됨
## 핵심 포인트
- Server Components가 기본 아키텍처로 채택
- use() 훅으로 프로미스와 컨텍스트를 직접 사용 가능
- Actions로 폼 처리가 간단해짐
- 자동 메모이제이션 (React Compiler)
- Document Metadata를 컴포넌트에서 직접 관리
## 타임스탬프
- 00:00 인트로
- 03:25 Server Components 설명
- 15:40 use() 훅 데모
- 28:10 Actions와 폼 처리
- 42:00 React Compiler
6. Claude Code에서 사용하기
Claude Code 안에서 MCP 서버로 등록하거나, 간단한 스크립트로 실행할 수 있습니다:
# 사용 예시
node summarize.js "https://youtube.com/watch?v=VIDEO_ID"
# 또는 Claude Code에서 직접
"이 유튜브 영상 요약해줘: https://youtube.com/watch?v=..."
7. 정리
| 단계 | 도구 | 역할 |
|---|---|---|
| 자막 추출 | yt-dlp / youtube_transcript_api | 영상 → 텍스트 |
| 음성 변환 | Whisper (자막 없을 때) | 음성 → 텍스트 |
| AI 요약 | Claude / Gemini API | 텍스트 → 요약 |
| 출력 | 마크다운 | 구조화된 요약문 |
URL 하나로 1시간 영상의 핵심을 3분만에 파악할 수 있습니다. 매일 쏟아지는 콘텐츠 중에서 정말 볼 가치가 있는 것만 골라볼 수 있게 됩니다.