הסיפור מאחורי הפוסט הזה
אתמול הוספתי פיצ'ר חדש ל-Claude Code – ניהול משימות גלובלי. רציתי לתעד את זה בווידאו, אבל הקלטת מסך גולמית זה משעמם. אין הסבר, אין מוזיקה, אין הקשר.
אז ישבתי עם Claude Code ובשיחה אחת יצרנו pipeline שלם שהופך הקלטת מסך לטוטוריאל מקצועי – עם קריינות בעברית, מוזיקת רקע, כתוביות, והכל מועלה אוטומטית ליוטיוב.
התוצאה? מהקלטה גולמית של 40 שניות → לטוטוריאל מלוטש של 90 שניות, תוך כ-3 דקות עבודה.
השלבים שעברתי

שלב 1: ניתוח הווידאו עם Gemini
הדבר הראשון שעשיתי זה להעלות את הווידאו ל-Gemini ולבקש ממנו לזהות את הרגעים המשמעותיים:
"תנתח את הווידאו הזה ותזהה כל רגע דמו עם timecode מדויק"
Gemini זיהה 12 רגעים שונים – יצירת משימות, עדכוני קאנבן בזמן אמת, הזרקת משימות בין פרויקטים, ועוד. כל אחד עם timestamp מדויק.
שלב 2: כתיבת התסריט
במקום תסריט רשמי, רציתי משהו נינוח – כמו שיתוף בין חברים:
"חברים, תראו קטע סופר מגניב שעובד עם קלוד קוד. אז שבוע שעבר הכניסו ניהול משימות גלובלי…"
התסריט יצא 715 תווים – מספיק כדי להסביר את כל הפיצ'רים בצורה טבעית.
שלב 3: הפקת קריינות עם הקול שלי
יש לי קול משוכפל ב-ElevenLabs. Claude Code פשוט השתמש בו:
npx ts-node generate_speech.ts \
-t "חברים, תראו קטע סופר מגניב..." \
-o narration.mp3
47 שניות של קריינות טבעית בעברית – עם הקול שלי!
שלב 4: יצירת כתוביות
הקריינות עברה תמלול אוטומטי עם ElevenLabs Scribe:
npx ts-node transcribe.ts \
-i narration.mp3 \
-o narration.srt \
-l he
17 כתוביות עם תזמון מדויק לכל מילה.
שלב 5: יצירת מוזיקת רקע
ביקשתי מוזיקה שתתאים:
npx ts-node generate_music.ts \
--prompt "Upbeat tech background music, soft electronic, inspiring" \
--duration 95 \
--instrumental
95 שניות של מוזיקה מקורית – נוצרה ב-45 שניות.
שלב 6: עריכת הווידאו
פה קרה הקסם של ffmpeg:
- האטה פי 2 – מ-40 שניות ל-80 שניות (כדי שהקריינות לא תיחתך)
- 10 שניות נוספות בסוף – פריים קפוא עם מוזיקה
- מיקס אודיו – קריינות + מוזיקה (מוזיקה ב-15% ווליום)
- Fadeout – 3 שניות בסוף
- כתוביות מוטבעות – עברית עם תמיכה ב-RTL
ffmpeg -y -i video.mp4 \
-vf "subtitles='narration.srt':force_style='FontName=Arial,FontSize=22'" \
-c:a copy \
final.mp4
שלב 7: הפצה
הווידאו הסופי הועלה ליוטיוב ונשלח לוואטסאפ שלי לבדיקה – הכל אוטומטית.
מה מיוחד פה?
1. הכל בשיחה אחת
לא הייתי צריך לפתוח תוכנת עריכה, להתעסק עם ממשקים. פשוט תיארתי מה אני רוצה ו-Claude Code עשה את העבודה.
2. איטרציה מהירה
הגרסה הראשונה נחתכה לפני שהקריינות נגמרה. אמרתי "תאט פי 2, תוסיף 10 שניות בסוף" – ותוך דקה הייתה גרסה מתוקנת בוואטסאפ.
3. Skills כ-Building Blocks
כל שלב הוא skill נפרד שאפשר להשתמש בו שוב:
speech-generator– קריינותtranscribe– כתוביותmusic-generator– מוזיקהyoutube-uploader– העלאהwhatsapp– שליחה
4. עלות זניחה
כל הפקת הווידאו עלתה בערך 19 סנט:
- Gemini: $0.02
- קריינות: $0.05
- מוזיקה: $0.10
- שאר: חינם
הטכניקה העוצמתית: Skill Composition

הגילוי הגדול מהפרויקט הזה הוא skill composition – היכולת לשלב skills קיימים ליצירת workflow חדש.
במקום לכתוב קוד חדש, ה-tutorial-creator פשוט מתזמר skills קיימים:
┌─────────────────────────────────────────────────────────────┐
│ tutorial-creator │
├─────────────────────────────────────────────────────────────┤
│ video-analyzer → speech-generator → transcribe │
│ ↓ │
│ music-generator → ffmpeg editing → embed-subtitles │
│ ↓ │
│ youtube-uploader → whatsapp │
└─────────────────────────────────────────────────────────────┘
כל skill עושה דבר אחד טוב. ה-orchestrator מחבר ביניהם.
מה הלאה?
יצרתי מזה skill מלא בשם tutorial-creator. עכשיו כל פעם שאני מקליט מסך, אני יכול להפוך את זה לטוטוריאל מקצועי בפקודה אחת:
/tutorial-creator path/to/recording.mp4
התוצאה:
- וידאו מקצועי עם קריינות
- כתוביות בעברית
- מוזיקת רקע
- מועלה ליוטיוב
- נשלח לוואטסאפ לאישור
הכל אוטומטי. הכל משיחה אחת.
לסיכום
זה לא על כלים חדשים. זה על אופן עבודה חדש.
במקום:
- לפתוח Premiere/DaVinci
- לערוך ידנית
- לסנכרן קריינות
- לייצא ולהעלות
עכשיו:
- לתאר מה אני רוצה
- לקבל גרסה ראשונה
- לתת feedback
- לקבל גרסה סופית
זמן עבודה: 3 דקות במקום שעה.
זה העתיד של יצירת תוכן – שיחה עם AI שמתזמר את כל הכלים בשבילך.
הפוסט הזה נכתב אחרי שהתהליך עצמו הפך ל-skill. מטא ככה.

כתיבת תגובה