סרט טוב? כשהבינה המלאכותית הופכת לבמאית קולנוע
Omni, מודל יצירת הווידיאו החדש של גוגל, השאיר את אנשי המקצוע וחובבי הקולנוע פעורי פה ביכולות שלו ● המדור סוקר הפעם אותו ואת המודלים הבולטים האחרים בתחום
גוגל הכריזה בחודש שעבר על Omni, מודל יצירת הווידיאו החדש שלה, והשאירה כמה פיות פעורים. מדובר בעוד שלב בהתפתחות תחום הבינה המלאכותית היוצרת לווידיאו, ששועט קדימה, וגם כאן, כמעט בכל יום צץ מודל חדש, יותר ריאליסטי וכזה שיש לו יכולת טובה יותר להוציא יצירות שנראים כמו סרטים אמיתיים.
המשמעויות לתעשיות הקולנוע, השיווק והפרסום הן אדירות: הפקה שדרשה ימי צילום, עריכה, איפור, תלבושות, חזרות, הפקה ועשרות ניצבים פתאום מצטמצמת לעבודת מחשב של כמה שעות לכל היותר, והכול רק תלוי בכמה טוקנים אתם (או חברת ההפקה) מוכנים להשקיע. התחום הפך כל כך מתקדם, עד כדי כך שמוקדם יותר החודש הודיעה גוגל שתשתף פעולה עם אולפני A24 ביצירת תפאורות ובמות שיהיו מיוחדות להפקות בינה מלאכותית.
מחוללי הסרטונים הם תופעה מפירת סדר באומנות השביעית. על אף שיש כמה מודלים, כמו Omni, שישאירו אתכם עם פה פעור לגבי מה שהם יכולים ליצור, זה לא שיש כרגע מודל אחד שאפשר לקרוא לו "הכי טוב". מה שמסתמן בשוק הזה הוא התמחות, כלומר – המודל הכי טוב לשימוש מסוים. מיהם השחקנים הבולטים, נכון לכתיבת שורות אלה? ולמה, ואת מי, הם משמשים?
Omni
הרעיון מאחורי Omni הוא שהמודל מסוגל ליצור סרטונים כמעט מכל סוג קלט – מה שנקרא גם מולטי מודאלי: טקסט, תמונה, וידיאו, קול או שילוב שלהם. החידוש ב-Omni הוא שהסרטון עצמו הופך להיות ישות שאפשר לתפעל דרך פרומפט: לערוך, להזיז, לשנות סגנון, להחליף רקע, להמשיך סצנה או לתקן תנועה – והכול בשיחה טבעית ובאיכות גבוהה, עם פיזיקה מציאותית ואודיו מובנה. כשמשלבים אותו עם מוצרי הווידיאו האחרים של גוגל, כמו Veo ,Flow ויוטיוב שורטס – מדובר ב-"מערכת הפעלה יצירתית" של ממש. למעשה, זה מאפשר ליצור ולהפיץ סרט בכל התהליך, מ-א' ועד ת' – והכול בתוך המערכת האקולוגית של גוגל. האינטרס שיש כאן לחברת הענק ברור.
Runway
Runway הוא כלי לקולנוענים, שנותן פייט ל-Omni ביצירה עקבית של דמויות, סביבות וסגנונות בין שוטים, ודור 4.5 שלו מוצג על ידי המפתחים כקפיצת מדרגה בשליטה, תנועה ודינמיות. זהו כלי לאנשים שבאמת רוצים לשלוט ביצירה שלהם ויש להם הבנה קולנועית בבנייה של פריימים.
Kling Video
המודל הזה, שמקורו בסין, מציע גישה קצת יותר ידידותית, ובחברה מתגאים ביכולת שלו לייצר אחידות בין סצנות ובהפקה של טקסט מדובר לקול ותנועת שפתיים – משהו שמודלים לקהל הרחב לא פעם נופלים בו. Kling Video מיועד בעיקר לפרסומאים, אבל אליה וקוץ בה – הוא כרגע תומך בחמש שפות בלבד, ביניהן אנגלית וסינית בכמה מבטאים.
Luma, עם Ray 3.2
גם המודל הזה פונה לאנשי שיווק ופרסום. יש לו גישה מאוד חזקה של סטורי בורדינג ובניית סצנות מסודרת – בין אם הן סצנות ריאליסטיות או פנטסטיות, נוסח Inception. יש לחברה גם מודל בשם Uni 1.0, שהתכלית שלו היא לתמוך במותגים ולהבין אותם, ולקיים את השפה המותגית שלהם לאורך ולרוחב של תוצרי וידיאו שונים. Luma מכוון גם ליצירת תכנים עבור המדיה החברתית, ואף מציע יצירת תזמונים, כדי למטב קביעות בהעלאת תכנים – עניין שמאוד חשוב בפלטפורמות סושיאל מבוססות וידיאו, כמו יוטיוב או טיקטוק (יוטיוב יותר, והם ממש קשוחים עם זה).
Vidu
זאת חברה פחות מוכרת בישראל, אבל יש לה מודל מעניין, שמתמקד בהפיכת תיאורים טקסטואליים לסרטונים. הוא מתאים במיוחד ליצירות קולנועיות או סטוריז קצרים ומדיה חברתית, ותכנים תיירותיים. החברה מתגאה בתזרים עבודה פשוט וקל להבנה, ופחות בקולנועיות סבוכה.

מודל AI על שם אחת החיות החמודות בטבע. צילום: ShutterStock
Pika
ואם כבר הזכרנו מדיה חברתית, יש את Pika. המודל הזה לא מתמקד באיכות, אלא בלדבר את השפה של המדיה החברתית – של תכנים קצרים עם עריכה תזזיתית. הוא טוב במיוחד ליצירה של סרטונים קצרים לטיקטוק, רילס או שורטס.
Firefly
המודל של אדובי הוא ההיפך הגמור של Pika, ובין כל המודלים שאני מציין כאן, הוא הכי מותאם לתרבות "ארגונית" בשמרנות שלו. הוא פחות בעניין של "בואו ניצור סרטון מגניב" כמו שהוא כלי שנועד להטמעת וידיאו בעבודה של מעצבים, עורכים ומחלקות קריאייטיב בתוך ארגונים סדורים.

מודל שנוי במחלוקת. Seedance. צילום: ShutterStock
Seedance
לבסוף, איך אפשר בלי להזכיר את Seedance מעוררת המחלוקת מבית בייטדאנס, אימתה הורתה של טיקטוק? Seedance, כמנוע יצירת וידיאו, הימם את העולם באיכות התוצאות שהפיק וברמת הריאליזם שלו. אלא שהוא גם גרם לשערוריות ואיומים בתביעות מצד גופים כמו דיסני, על הפרת זכויות יוצרים ושימוש ללא רשות בדמויות שבבעלותה, כמו דמויות מצוירות וגיבורי מארוול. בעניין הזה נזכיר גם את Grok של אילון מאסק, שיש לו פחות עכבות, וגם הוא גרר איתו שערוריות כשאפשר למשתמשים ליצור תכנים בוטים, לא פעם ללא רשות של המונפשים או המונפשות, תוך פגיעה בפרטיותם.ן והטרדה.
בשורה התחתונה, עידן ה-"מודל האחד שינצח את כולם" פינה את מקומו להתמזגות מרתקת, שבה לכל יוצר, פרסומאי או קולנוען יש את כלי העבודה המדויק עבורו. המהפכה הזו משנה לנגד עינינו את הדרך שבה סרטים, פרסומות ותכני מדיה חברתית "מצולמים", נכתבים, מופקים ומופצים, כשהגבול בין דמיון למציאות הולך ומיטשטש בתוך שעות בודדות של עבודת מחשב. עכשיו, הבחירה עם איזה מודל לעבוד ובאילו גבולות אתיים לפעול נמצאת בידיים שלכם, בהנחה שאתם רוצים ליצור תכנים כאלה. כל מה שנותר לכם לעשות הוא לנסח את הפרומפט הנכון, להחליט כמה טוקנים אתם מוכנים להשקיע – וללחוץ על Generate.










תגובות
(0)