איך הפכתי הקלטת מסך ל-Tutorial מקצועי ב-3 דקות עם Claude Code

לחץ להאזנה

הסיפור מאחורי הפוסט הזה

אתמול הוספתי פיצ'ר חדש ל-Claude Code – ניהול משימות גלובלי. רציתי לתעד את זה בווידאו, אבל הקלטת מסך גולמית זה משעמם. אין הסבר, אין מוזיקה, אין הקשר.

אז ישבתי עם Claude Code ובשיחה אחת יצרנו pipeline שלם שהופך הקלטת מסך לטוטוריאל מקצועי – עם קריינות בעברית, מוזיקת רקע, כתוביות, והכל מועלה אוטומטית ליוטיוב.

התוצאה? מהקלטה גולמית של 40 שניות → לטוטוריאל מלוטש של 90 שניות, תוך כ-3 דקות עבודה.

השלבים שעברתי

תהליך העבודה המלא – מניתוח הווידאו ועד ההעלאה

שלב 1: ניתוח הווידאו עם Gemini

הדבר הראשון שעשיתי זה להעלות את הווידאו ל-Gemini ולבקש ממנו לזהות את הרגעים המשמעותיים:

"תנתח את הווידאו הזה ותזהה כל רגע דמו עם timecode מדויק"

Gemini זיהה 12 רגעים שונים – יצירת משימות, עדכוני קאנבן בזמן אמת, הזרקת משימות בין פרויקטים, ועוד. כל אחד עם timestamp מדויק.

שלב 2: כתיבת התסריט

במקום תסריט רשמי, רציתי משהו נינוח – כמו שיתוף בין חברים:

"חברים, תראו קטע סופר מגניב שעובד עם קלוד קוד. אז שבוע שעבר הכניסו ניהול משימות גלובלי…"

התסריט יצא 715 תווים – מספיק כדי להסביר את כל הפיצ'רים בצורה טבעית.

שלב 3: הפקת קריינות עם הקול שלי

יש לי קול משוכפל ב-ElevenLabs. Claude Code פשוט השתמש בו:

npx ts-node generate_speech.ts \
  -t "חברים, תראו קטע סופר מגניב..." \
  -o narration.mp3

47 שניות של קריינות טבעית בעברית – עם הקול שלי!

שלב 4: יצירת כתוביות

הקריינות עברה תמלול אוטומטי עם ElevenLabs Scribe:

npx ts-node transcribe.ts \
  -i narration.mp3 \
  -o narration.srt \
  -l he

17 כתוביות עם תזמון מדויק לכל מילה.

שלב 5: יצירת מוזיקת רקע

ביקשתי מוזיקה שתתאים:

npx ts-node generate_music.ts \
  --prompt "Upbeat tech background music, soft electronic, inspiring" \
  --duration 95 \
  --instrumental

95 שניות של מוזיקה מקורית – נוצרה ב-45 שניות.

שלב 6: עריכת הווידאו

פה קרה הקסם של ffmpeg:

האטה פי 2 – מ-40 שניות ל-80 שניות (כדי שהקריינות לא תיחתך)
10 שניות נוספות בסוף – פריים קפוא עם מוזיקה
מיקס אודיו – קריינות + מוזיקה (מוזיקה ב-15% ווליום)
Fadeout – 3 שניות בסוף
כתוביות מוטבעות – עברית עם תמיכה ב-RTL

ffmpeg -y -i video.mp4 \
  -vf "subtitles='narration.srt':force_style='FontName=Arial,FontSize=22'" \
  -c:a copy \
  final.mp4

שלב 7: הפצה

הווידאו הסופי הועלה ליוטיוב ונשלח לוואטסאפ שלי לבדיקה – הכל אוטומטית.

מה מיוחד פה?

1. הכל בשיחה אחת

לא הייתי צריך לפתוח תוכנת עריכה, להתעסק עם ממשקים. פשוט תיארתי מה אני רוצה ו-Claude Code עשה את העבודה.

2. איטרציה מהירה

הגרסה הראשונה נחתכה לפני שהקריינות נגמרה. אמרתי "תאט פי 2, תוסיף 10 שניות בסוף" – ותוך דקה הייתה גרסה מתוקנת בוואטסאפ.

3. Skills כ-Building Blocks

כל שלב הוא skill נפרד שאפשר להשתמש בו שוב:

speech-generator – קריינות
transcribe – כתוביות
music-generator – מוזיקה
youtube-uploader – העלאה
whatsapp – שליחה

4. עלות זניחה

כל הפקת הווידאו עלתה בערך 19 סנט:

Gemini: $0.02
קריינות: $0.05
מוזיקה: $0.10
שאר: חינם

הטכניקה העוצמתית: Skill Composition

Skill Composition – כל בלוק עושה דבר אחד, והאורכסטרטור מחבר ביניהם

הגילוי הגדול מהפרויקט הזה הוא skill composition – היכולת לשלב skills קיימים ליצירת workflow חדש.

במקום לכתוב קוד חדש, ה-tutorial-creator פשוט מתזמר skills קיימים:

┌─────────────────────────────────────────────────────────────┐
│                    tutorial-creator                          │
├─────────────────────────────────────────────────────────────┤
│  video-analyzer → speech-generator → transcribe             │
│        ↓                                                    │
│  music-generator → ffmpeg editing → embed-subtitles         │
│        ↓                                                    │
│  youtube-uploader → whatsapp                                │
└─────────────────────────────────────────────────────────────┘

כל skill עושה דבר אחד טוב. ה-orchestrator מחבר ביניהם.

מה הלאה?

יצרתי מזה skill מלא בשם tutorial-creator. עכשיו כל פעם שאני מקליט מסך, אני יכול להפוך את זה לטוטוריאל מקצועי בפקודה אחת:

/tutorial-creator path/to/recording.mp4

התוצאה:

וידאו מקצועי עם קריינות
כתוביות בעברית
מוזיקת רקע
מועלה ליוטיוב
נשלח לוואטסאפ לאישור

הכל אוטומטי. הכל משיחה אחת.

לסיכום

זה לא על כלים חדשים. זה על אופן עבודה חדש.

במקום:

לפתוח Premiere/DaVinci
לערוך ידנית
לסנכרן קריינות
לייצא ולהעלות

עכשיו:

לתאר מה אני רוצה
לקבל גרסה ראשונה
לתת feedback
לקבל גרסה סופית

זמן עבודה: 3 דקות במקום שעה.

זה העתיד של יצירת תוכן – שיחה עם AI שמתזמר את כל הכלים בשבילך.

הפוסט הזה נכתב אחרי שהתהליך עצמו הפך ל-skill. מטא ככה.