logo
게시일

AI 유튜브 영상 요약기 만들기

다른 언어로 읽기: English
작성자

1. 1시간 영상을 3분만에 파악하기

유튜브에 좋은 강의, 인터뷰, 기술 발표 영상이 많지만, 다 볼 시간이 없습니다. URL만 넣으면 핵심만 정리해주는 도구가 있으면 어떨까요?

유튜브 요약 개요

2. 작동 원리

작동 원리
1. 자막 추출 — YouTube 자막(CC)을 텍스트로 가져옴
2. AI 분석 — 긴 자막 텍스트를 AI에게 보내서 핵심 추출
3. 요약 생성 — 핵심 포인트, 타임스탬프, 한줄 요약 출력

3. 1단계: 자막 추출

유튜브 영상의 자막을 가져오는 방법입니다:

# yt-dlp로 자막 다운로드
pip install yt-dlp

# 자동 생성 자막 포함해서 추출
yt-dlp --write-auto-sub --sub-lang ko,en --skip-download \
  --sub-format vtt -o "subtitle" "https://youtube.com/watch?v=VIDEO_ID"

또는 Python에서 직접 가져올 수 있습니다:

from youtube_transcript_api import YouTubeTranscriptApi

transcript = YouTubeTranscriptApi.get_transcript("VIDEO_ID", languages=['ko', 'en'])
text = " ".join([t['text'] for t in transcript])

자막이 없는 영상은 Whisper로 음성을 텍스트로 변환할 수 있습니다:

# 음성 다운로드 후 Whisper로 변환
yt-dlp -x --audio-format mp3 "https://youtube.com/watch?v=VIDEO_ID"
whisper audio.mp3 --language ko --model medium

4. 2단계: AI 요약

추출한 자막을 AI에게 보내서 요약을 요청합니다:

const prompt = `다음은 유튜브 영상의 자막입니다. 핵심 내용을 요약해주세요.

요약 형식:
1. 한줄 요약 (1문장)
2. 핵심 포인트 (5-7개, 불릿 포인트)
3. 주요 타임스탬프 (중요한 부분의 시간대)
4. 결론/핵심 메시지

자막:
${transcriptText}`;

긴 영상 처리

1시간 영상의 자막은 수만 자가 됩니다. AI의 컨텍스트 제한을 고려해서:

  • 청크 분할: 10분 단위로 나눠서 각각 요약 → 전체 요약
  • 긴 컨텍스트 모델: Claude(200K 토큰)나 Gemini(1M 토큰)은 대부분의 영상을 한 번에 처리 가능

5. 3단계: 출력 형식

마크다운 요약

# 영상 요약: "React 19 새로운 기능 총정리"

## 한줄 요약
React 19에서 Server Components가 기본이 되고, use() 훅과 Actions가 추가됨

## 핵심 포인트
- Server Components가 기본 아키텍처로 채택
- use() 훅으로 프로미스와 컨텍스트를 직접 사용 가능
- Actions로 폼 처리가 간단해짐
- 자동 메모이제이션 (React Compiler)
- Document Metadata를 컴포넌트에서 직접 관리

## 타임스탬프
- 00:00 인트로
- 03:25 Server Components 설명
- 15:40 use() 훅 데모
- 28:10 Actions와 폼 처리
- 42:00 React Compiler

6. Claude Code에서 사용하기

Claude Code 안에서 MCP 서버로 등록하거나, 간단한 스크립트로 실행할 수 있습니다:

# 사용 예시
node summarize.js "https://youtube.com/watch?v=VIDEO_ID"

# 또는 Claude Code에서 직접
"이 유튜브 영상 요약해줘: https://youtube.com/watch?v=..."

7. 정리

단계도구역할
자막 추출yt-dlp / youtube_transcript_api영상 → 텍스트
음성 변환Whisper (자막 없을 때)음성 → 텍스트
AI 요약Claude / Gemini API텍스트 → 요약
출력마크다운구조화된 요약문

URL 하나로 1시간 영상의 핵심을 3분만에 파악할 수 있습니다. 매일 쏟아지는 콘텐츠 중에서 정말 볼 가치가 있는 것만 골라볼 수 있게 됩니다.