גוגל חשפה את Veo 2: מודל AI חדשני ליצירת וידיאו מטקסט

לדברי ענקית הטק, המודל המתקדם משולב ב-Gemini Advanced ו-Whisk ומאפשר יצירת סרטונים קצרים באיכות גבוהה ● בנוסף, גוגל מסייעת גם להבין דולפינים - ובעתיד אולי לשוחח איתם

גוגל הציגה אותו והבטיחה יצירת סרטוני וידיאו מופלאים - מטקסט בלבד. Veo 2.

גוגל הכריזה אתמול (ג') על השקת מודל הבינה המלאכותית המתקדם שלה ליצירת וידיאו, Veo 2, המאפשר למשתמשים להפוך הנחיות טקסט לסרטוני וידיאו דינמיים. החברה הודיעה כי החל מהיום, מנויי תוכנית Gemini Advanced יוכלו ליצור ולשתף סרטונים קצרים באמצעות מודל זה, המסוגל להפיק קטעי וידיאו באורך של עד שמונה שניות, ברזולוציית 720p ובפורמט רוחבי של 16:9.

לדברי גוגל, Veo 2 מציג הבנה משופרת של חוקי הפיזיקה ותנועות אנושיות בעולם האמיתי, מה שמאפשר לו יצירת סרטונים מציאותיים יותר, עם תנועות חלקות ופרטים חזותיים מדויקים.

בנוסף לשילובו ב-Gemini Advanced, ענקית הטק בישרה כי היא מביאה את יכולות Veo 2 גם ל-Whisk – ניסוי בתחום הבינה המלאכותית הג'נרטיבית שלה. Whisk מאפשר למשתמשים ליצור יצירות ויזואליות חדשות באמצעות הנחיות טקסט ותמונה, וכעת, עם שילוב Veo 2, ניתן גם להנפיש יצירות אלו לסרטונים קצרים באורך של עד שמונה שניות.

אנג'לה סאן, מנהלת פלטפורמות מולטי-מודל באפליקציית ג'מיני, ואוליביה סטורמן, מנהלת מוצר ביחידת גוגל לאבס (Google Labs), מסרו בבלוג הרשמי של החברה כי "ב-ג'מיני, אתם יכולים כעת לתרגם הנחיות מבוססות טקסט לסרטוני וידיאו דינמיים". גוגל ציינה כי השימוש ביצירת וידיאו ב-Gemini מוגבל בכמות חודשית, והמשתמשים יקבלו התראה כאשר הם מתקרבים למגבלה. כדי להבטיח שימוש בטוח, כל הסרטונים שנוצרו באמצעות Veo 2 יסומנו באמצעות SynthID, סימן מים דיגיטלי המוטבע בכל פריים כדי לציין שהסרטון נוצר על ידי AI.

גוגל טוענת שהמודל השיג בתוצאות מעולות

גוגל לאבס פרסמה אף היא פוסט ארוך ועשיר בהדגמות של ביצועי המודל החדש, ובו ציינה כי Veo 2 השיג תוצאות מצוינות, בהשוואות ישירות מול מודלים מובילים אחרים ליצירת וידיאו, על בסיס הערכות של אנשים. ההשוואות בוצעו על פני מאגר הנתונים MovieGenBench של מטא (Meta). לדברי החברה בפוסט, "Veo השיגה תוצאות מתקדמות בהשוואות ראש בראש של תפוקות על ידי מדרגים אנושיים". החברה הדגישה כי Veo 2 השיג את הביצועים הטובים ביותר בכל הכרוך בהעדפה כללית וביכולתו לעקוב במדויק אחר ההנחיות שסופקו.

יצוין כי בדיווחים שונים על החידוש מצוין כי אמנם יצירת וידיאו באמצעות Veo 2 בתוך ג'מיני דורשת מנוי Google One AI Premium, שעלותו 19.99 דולר בחודש, אך ניתן לעקוף זאת והשתמש ב-Veo 2 בחינם דרך AI Studio של גוגל – המיועד במקור למפתחים לבדיקת מודלים – אך שמאפשר גם למשתמשים "רגילים" להירשם ולנסות את המודל ללא צורך במנוי.

באשר לאופן השימוש בכלי הווידיאו עבור מנויי Gemini Advanced: כדי ליצור סרטונים, יש לבחור ב-Veo 2 מהתפריט הנפתח של המודלים בתוך ג'מיני. כעת עליכם פשוט לתאר את הסצנה שאתם רוצים ליצור באמצעות הנחיה מפורטת ככל האפשר. ככל שהתיאור מפורט יותר, כך יש לכם יותר שליטה על התוצר הסופי. לאחר יצירת הסרטון, ניתן לשתף אותו בקלות באמצעות כפתור השיתוף, במיוחד בפלטפורמות כמו טיקטוק (TikTok) ויוטיוב, במדור YouTube Shorts שלה.

גוגל ציינה כי קיימת מגבלה חודשית על מספר הסרטונים שניתן ליצור, והמשתמשים יקבלו התרעה כשיתקרבו למצוי מכסה זו.

גוגל מסייעת גם להבין דולפינים

אך הענקית ממאונטיין וויו לא מסתפקת בחידוש האחרון הזה, וחשפה ממש כעת גם התקדמות בפיתוח מודל בינה מלאכותית אחר בשם DolphinGemma, שמטרתו לסייע למדענים בפענוח התקשורת של הדולפינים.

המודל, שנבנה על בסיס טכנולוגיות אודיו של גוגל והוכשר על מאגר נתונים אקוסטי של פרויקט דולפין הבר (WDP), נועד לזהות דפוסים, מבנים ורצפים קוליים בקרב דולפינים. למעשה בסופו של דבר מתכוונת גוגל גם ליצור רצפים קוליים חדשים דמויי דולפינים, כך שאפשר שהדבר יסייע לבני האנוש לדבר איתם בשפתם.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים