גוגל חשפה את Veo 2: מודל AI חדשני ליצירת וידיאו מטקסט

לדברי ענקית הטק, המודל המתקדם משולב ב-Gemini Advanced ו-Whisk ומאפשר יצירת סרטונים קצרים באיכות גבוהה ● בנוסף, גוגל מסייעת גם להבין דולפינים - ובעתיד אולי לשוחח איתם

גוגל הציגה אותו והבטיחה יצירת סרטוני וידיאו מופלאים - מטקסט בלבד. Veo 2.צילום: לכידת מסך מבלוג גוגל לאבס

גוגל הכריזה אתמול (ג') על השקת מודל הבינה המלאכותית המתקדם שלה ליצירת וידיאו, Veo 2, המאפשר למשתמשים להפוך הנחיות טקסט לסרטוני וידיאו דינמיים. החברה הודיעה כי החל מהיום, מנויי תוכנית Gemini Advanced יוכלו ליצור ולשתף סרטונים קצרים באמצעות מודל זה, המסוגל להפיק קטעי וידיאו באורך של עד שמונה שניות, ברזולוציית 720p ובפורמט רוחבי של 16:9.

לדברי גוגל, Veo 2 מציג הבנה משופרת של חוקי הפיזיקה ותנועות אנושיות בעולם האמיתי, מה שמאפשר לו יצירת סרטונים מציאותיים יותר, עם תנועות חלקות ופרטים חזותיים מדויקים.

Dive into video creation with @GeminiApp — rolling out today.🪂

Transform text prompts into cinematic 8-second videos with Veo 2 in Gemini Advanced. Select Veo 2 from the model dropdown menu to get started.

Prompt: Write the word "GOOGLE" out of skydiving parachutes opening up pic.twitter.com/IHTmhELUut

— Google (@Google) April 15, 2025

בנוסף לשילובו ב-Gemini Advanced, ענקית הטק בישרה כי היא מביאה את יכולות Veo 2 גם ל-Whisk – ניסוי בתחום הבינה המלאכותית הג'נרטיבית שלה. Whisk מאפשר למשתמשים ליצור יצירות ויזואליות חדשות באמצעות הנחיות טקסט ותמונה, וכעת, עם שילוב Veo 2, ניתן גם להנפיש יצירות אלו לסרטונים קצרים באורך של עד שמונה שניות.

אנג'לה סאן, מנהלת פלטפורמות מולטי-מודל באפליקציית ג'מיני, ואוליביה סטורמן, מנהלת מוצר ביחידת גוגל לאבס (Google Labs), מסרו בבלוג הרשמי של החברה כי "ב-ג'מיני, אתם יכולים כעת לתרגם הנחיות מבוססות טקסט לסרטוני וידיאו דינמיים". גוגל ציינה כי השימוש ביצירת וידיאו ב-Gemini מוגבל בכמות חודשית, והמשתמשים יקבלו התראה כאשר הם מתקרבים למגבלה. כדי להבטיח שימוש בטוח, כל הסרטונים שנוצרו באמצעות Veo 2 יסומנו באמצעות SynthID, סימן מים דיגיטלי המוטבע בכל פריים כדי לציין שהסרטון נוצר על ידי AI.

Sonunda AI studio üzerinden Google VEO 2 bana da açıldı. Google'In bunu tamamen ücretsiz olarak açması inanılmaz :)) ChatGPT ile fotoğrafıma dışavurumculuk akımı uygulattım. Sonra Google VEO 2 ile videosunu yaptım. pic.twitter.com/Yg4O0qj3dR

— Erhan Meydan (@erhanmeydan) April 16, 2025

גוגל טוענת שהמודל השיג בתוצאות מעולות

גוגל לאבס פרסמה אף היא פוסט ארוך ועשיר בהדגמות של ביצועי המודל החדש, ובו ציינה כי Veo 2 השיג תוצאות מצוינות, בהשוואות ישירות מול מודלים מובילים אחרים ליצירת וידיאו, על בסיס הערכות של אנשים. ההשוואות בוצעו על פני מאגר הנתונים MovieGenBench של מטא (Meta). לדברי החברה בפוסט, "Veo השיגה תוצאות מתקדמות בהשוואות ראש בראש של תפוקות על ידי מדרגים אנושיים". החברה הדגישה כי Veo 2 השיג את הביצועים הטובים ביותר בכל הכרוך בהעדפה כללית וביכולתו לעקוב במדויק אחר ההנחיות שסופקו.

יצוין כי בדיווחים שונים על החידוש מצוין כי אמנם יצירת וידיאו באמצעות Veo 2 בתוך ג'מיני דורשת מנוי Google One AI Premium, שעלותו 19.99 דולר בחודש, אך ניתן לעקוף זאת והשתמש ב-Veo 2 בחינם דרך AI Studio של גוגל – המיועד במקור למפתחים לבדיקת מודלים – אך שמאפשר גם למשתמשים "רגילים" להירשם ולנסות את המודל ללא צורך במנוי.

באשר לאופן השימוש בכלי הווידיאו עבור מנויי Gemini Advanced: כדי ליצור סרטונים, יש לבחור ב-Veo 2 מהתפריט הנפתח של המודלים בתוך ג'מיני. כעת עליכם פשוט לתאר את הסצנה שאתם רוצים ליצור באמצעות הנחיה מפורטת ככל האפשר. ככל שהתיאור מפורט יותר, כך יש לכם יותר שליטה על התוצר הסופי. לאחר יצירת הסרטון, ניתן לשתף אותו בקלות באמצעות כפתור השיתוף, במיוחד בפלטפורמות כמו טיקטוק (TikTok) ויוטיוב, במדור YouTube Shorts שלה.

גוגל ציינה כי קיימת מגבלה חודשית על מספר הסרטונים שניתן ליצור, והמשתמשים יקבלו התרעה כשיתקרבו למצוי מכסה זו.

Meet DolphinGemma, an AI helping us dive deeper into the world of dolphin communication. 🐬 pic.twitter.com/2wYiSSXMnn

— Google DeepMind (@GoogleDeepMind) April 14, 2025

גוגל מסייעת גם להבין דולפינים

אך הענקית ממאונטיין וויו לא מסתפקת בחידוש האחרון הזה, וחשפה ממש כעת גם התקדמות בפיתוח מודל בינה מלאכותית אחר בשם DolphinGemma, שמטרתו לסייע למדענים בפענוח התקשורת של הדולפינים.

המודל, שנבנה על בסיס טכנולוגיות אודיו של גוגל והוכשר על מאגר נתונים אקוסטי של פרויקט דולפין הבר (WDP), נועד לזהות דפוסים, מבנים ורצפים קוליים בקרב דולפינים. למעשה בסופו של דבר מתכוונת גוגל גם ליצור רצפים קוליים חדשים דמויי דולפינים, כך שאפשר שהדבר יסייע לבני האנוש לדבר איתם בשפתם.

תגובות

(0)

צק פוינט: ה-AI עולה כיתה – ומפעילה מתקפות סייבר מתוחכמות

בכירים מדברים על מהפכת ה-AI בעולם הפינטק

אפל מתכננת מעבד עם 1.5 טרה-בייט זיכרון RAM מובנה

אילו חברות היי-טק מצטיינות באחריות תאגידית?

"בנינו דאטה סנטר ומתחם בראייה של עשרות שנים קדימה"

מריבוי ספקיות ועד AI בצללים – אתגרי הבינה המלאכותית בארגוני הבריאות

"נכנסו שחקנים חדשים לארגון: צריך לזהותם ולנטר את פעילותם"

שני סטארט-אפים ביום אחד: Oak ו-Hemispheric נחשפו

הבינה המלאכותית יכולה להוציא אתכם לחופשה

הנחת היסוד שעליה נבנה הניהול המודרני מתחילה להתערער

חצי גמר המונדיאל: המציאות ניצחה את ה-AI

המתח בשיאו במונדיאל – ואפילו ה-AI לא יכולה לחזות מי יעלו לגמר

מעבדת ה-AI המהירה בעולם: מה ארגונים יכולים ללמוד מפורמולה 1?

נשים ומחשבים: אופק כהן, סייקוד

זה השילוב המנצח האמיתי במונדיאל

כך סוכני AI מייצרים לולאת אבטחה שלומדת בעצמה

גוגל חשפה את Veo 2: מודל AI חדשני ליצירת וידיאו מטקסט