חי בסרט: ג'מיני של גוגל מפיח כעת חיים בתמונות סטילס

ענקית הטק הציגה באחרונה יכולת חדשה של כלי ה-GenAI להפוך תמונות סטטיות לסרטונים יצירתיים עם סאונד, בהתבסס על מודל Veo 3 המתקדם שלה ● מסתמן שזו ראשיתו של עידן חדש ביצירת תוכן למשפיענים ומשווקים כאחד

יודע להפוך תמונת קופסה סטטית לסרטון שבו הקופסה נפתחת וקונפטי עף ממנה. ג'מיני.צילום: לכידת מסך מסרטון היוטיוב של גוגל

גוגל עשתה באחרונה צעד נוסף ומשמעותי בעולם הבינה המלאכותית היוצרת, עם השקת תכונה פורצת דרך באפליקציית ג'מיני שלה, המאפשרת למשתמשים ליצור סרטונים מתמונות סטטיות. היכולת המופלאה החדשה הזו, המופעלת על ידי מודל Veo 3 המתקדם ביותר של גוגל, מתוארת כ"קפיצת מדרגה אמיתית לעתיד" וכ"קסם" על ידי משתמשים שניסו אותה ושבהירו כי התכונה הותירה אותם "חסרי מילים".

התהליך פשוט למדי: המשתמשים מעלים תמונה סטטית לאפליקציית ג'מיני או לממשק האינטרנט שלה, ולאחר מכן מספקים לכלי הנחיית טקסט (פרומפט) המתארת את התנועה והאודיו הרצויים בסרטון. התוצאה היא קליפ באורך שמונה שניות וברזולוציית 720p בפורמט 16:9, עם אודיו מותאם.

Veo 3, שהושק במאי האחרון, ידוע ביכולתו לייצר תנועה מציאותית ולטפל בהנחיות מפורטות, וככל שההנחיה מפורטת יותר – כך הסרטון מתקרב לחזון המקורי של המשתמש. המודל הזה מאפשר מגוון רחב של שימושים יצירתיים, כגון יצירת סרטוני אנימציה של אובייקטים יומיומיים, הפיכת ציורים לחיים, או הוספת תנועה לסצנות טבע. מעבר לכך, Veo 3 מאפשר יצירת ממים מצחיקים, הפיכת בדיחות פרטיות לסרטונים ואף הוספת "נגיעה אישית" לרגעים מיוחדים. כעת, כאמור, רותמת גוגל את היכולות הללו להפחת חיים בתמונות הסטילס שלנו.

על סף עידן חדש ביצירת תוכן?

רובי פיין, המייסד של Chrome Unboxed – אתר טכנולוגי המתמקד בעיקר במערכת ההפעלה Chrome OS ובמכשירי כרומבוק – כתב ופרסם מאמר שכותרתו "ניסיתי זה עתה את תכונת ההפיכה מצילום לווידיאו החדשה של ג'מיני, ואני המום". בכתבת ביקורת זו הסביר פיין על סמך ניסיונו כי ה-AI במקרה זה לא רק מניעה את התמונה כולה, אלא "נראה שהיא מבינה את האובייקטים, העומק וההקשר של התמונה". פיין ציין כי התכונות הללו מאפשרות למערכת להוסיף אל תמונת הסטילס שהפכה לסרטון אלמנטים עדינים, כמו תנועות מצלמה, גלים מתגלגלים, אדים עולים מספל קפה או עננים בתנועתם בשמיים, וכל זאת תוך שמירה על יציבות שאר התמונה. הוא הוסיף וקבע כי "הרמה של הפרטים והתנועה הריאליסטית היא מה שכל כך מדהים".

גם מתנסה אחר, ברנדן גאהן, מנכ"ל Creator Authority, התייחס לחווית שימוש בתכונה החדשה וציין כי "כלי וידיאו מבוססי AI כאלה חוסכים ליוצרים כאבי ראש טכניים, כך שהם יכולים להתמקד בקהל שלהם".

Big news from #GoogleIO: We are thrilled to introduce the next wave of generative media models on Vertex AI: Veo 3, Imagen 4, and Lyria 2.

Check out these new models and capabilities → https://t.co/2JoD0mzliH pic.twitter.com/CbZCuj0KmN

— Google Cloud (@googlecloud) May 21, 2025

התכונה – עדיין לא פעילה בישראל

התלהבתם? ובכן, המתינו רגע – התכונה החדשה זמינה בינתיים למנויי Google AI Pro ו-Ultra באזורים נבחרים. נכון לעכשיו, היכולת ליצור סרטון מתמונה אינה זמינה באזור הכלכלי האירופי, בשוויץ או בבריטניה, ולצערנו גם בישראל היא טרם נצפתה פעילה.

בנוגע למשתמשים משלמים – נזכיר כי מנוי AI Pro עולה 20 דולר לחודש, בעוד מנוי AI Ultra, המציע תכונות ויכולות מתקדמות יותר, עולה 250 דולר בחודש – חשוב לציין כי קיימות מגבלות מסוימות לשירות החדשני גם עבורם. מספר הסרטונים שניתן ליצור ביום מוגבל לשלושה גם אם אתם מנויי AI Pro ולחמישה עבור מנויי Ultra.

מגבלה נוספת היא העובדה שפורמט הווידיאו נעול ל-16:9, מה שיכול שלא להתאים לפלטפורמות מסוימות כמו, אינסטגרם או טיקטוק. אם כי יש להניח שנושא זה ישתנה במהרה.

Introducing SynthID, a new tool to help watermark and identify synthetic images created by Imagen.

Created in partnership with @GoogleDeepMind, SynthID embeds a digital watermark directly into the pixels of an image. Learn more → https://t.co/tPL4ocMDuO pic.twitter.com/FPrMh7Lf3B

— Google Cloud (@googlecloud) September 6, 2023

ואיך ישמרו עלינו מפני ניצול לרעה (למשל החייאת תמונת ה-X והגחכתו.ה בסרטון)? ובכן, גוגל הדגישה את מחויבותה לבטיחות ביצירת תוכן מבוסס AI. כל הסרטונים שנוצרו באמצעות Veo באפליקציית ג'מיני מסומנים בסימן מים גלוי וב-SynthID – סימן מים דיגיטלי בלתי נראה המוטבע בכל פריים – ואלו מציינים בעצם כי הסרטונים הם פרי עבודה של GenAI. צעדים אלה, יחד עם בדיקות מקיפות והערכות שיתופיות (המכונות Red teaming), שנועדו למנוע יצירת תוכן המפר את המדיניות, אמורים להבטיח למשתמשים חוויה אחראית שניתן לסמוך עליה.

דוד שרון, שתפקידו בגוגל הוא ראש תחום היצירה מולטימודלית באפליקציות ג'מיני, ציין כי ענקית הטק פועלת רבות כדי "להיות בטוחים בתוצאות". בנוסף, אם נתקלתם בעניינים לא פתורים, כמו בג'מיני – ניתן לספק משוב לגוגל באמצעות כפתורי 'לייק' ו-'דיסלייק', מה שגם תורם לשיפור מתמיד של אמצעי הבטיחות והחוויה הכוללת.

יצירת וידיאו מתמונה: תחרות גוברת וציפיות גבוהות מג'מיני

כדאי לשים לב כי בתחום יצירת סרטוני הווידיאו מתמונת סטילס באמצעות GenAI ישנם כבר מספר שחקנים בולטים שמציעים יכולות מרשימות למדי – ביניהם Adobe Firefly, Luma AI (עם Dream Machine), וכן Leonardo.Ai ו-RunwayML. חברות אלו כבר מאפשרות למשתמשים להפוך תמונות סטטיות לסרטונים קצרים ואנימטיביים.

עם זאת, ההשקה האחרונה מבית גוגל, המשלבת את יכולות יצירת הווידיאו של מודל Veo 3 ישירות בתוך ג'מיני, מעוררת ציפיות גבוהות במיוחד. נראה כי הגישה המשולבת של גוגל, יחד עם הוספת יכולות האודיו המובנות, עשויה להשפיע באופן דרמטי יותר על שוק יצירת התוכן, ממה שעשו החברות החלוצות במקרה זה, ולספק כלי עוצמתי ונגיש ליצירה וידיאו.

ככלל, מסתמן כי היכולת החדשה הזו היא על תקן משנה-משחק חדש בזירת יצירת התוכן – ומשדרגת אותה עוד יותר. התכונה עתידה להוביל, כך לפי מבקרים, לעלייה בהפקת תכני וידיאו יצירתיים אצל משתמשים שיצרו כד כה רק תמונות סטטיות. פיין בכתבתו מדגיש כי מדובר בפלטפורמה חדשה ליוצרים, משפיענים ומשווקים כאחד, ואז קובע: "מרגיש שאנו נמצאים על סף עידן חדש ביצירת תוכן", שבו סיפור חזותי קצר נוצר מתמונות או איורים, ואף מאתגר את הדומיננטיות של הפקת וידיאו מסורתית.

תגובות

(0)

סרטון AI של בראד פיט וטום קרוז מטלטל את הוליווד

בשבועות האחרונים: עלייה דרמטית במתקפות כופרה על ארגוני SMB ישראליים

שדרן הרדיו האמריקני המפורסם נגד גוגל: "הם גנבו את קולי"

פיטר שטיינברגר, מפתח OpenClaw, הצטרף ל-OpenAI

כיצד לעבור ממערכות AI שמספקות תובנות והמלצות לסוכני AI?

סלברייט תרכוש את SCG Canada הקנדית

אפל "עושה פסח" בקוד של מערכת ההפעלה הבאה שלה, iOS 27

פודקאסט: דילוג לאתר חלופי תחת אש במנורה מבטחים

בינה מלאכותית לעורכי דין: לא הכחדה – שלב באבולוציה

פודקאסט: דילוג לאתר חלופי תחת אש במנורה מבטחים

שלוש הערות על השבוע הטכנולוגי

הקוסם רפפורט "העלים" בשרוולו את צוק והוא משבש הסייבר החדש

ה-AI ואתם: המדריך לסמנכ"ל התפעול

"ב-2026 נכפיל את היקף השירותים והמוצרים ברובד 5 בנימבוס"

השקעות ב-AI והחזר השקעה: נקודת מבט עדכנית עבור מנהלי כספים וטכנולוגיה

צוואר הבקבוק הוא אנחנו: המבנה הארגוני החדש ששייך לבוטים