"ננו בננה": גוגל הוסיפה כלי AI מתקדם לעריכת תמונות בג'ימיני

Gemini 2.5 Flash, המכונה "ננו בננה", הוא לדברי ענקית הטק מודל AI פורץ דרך בעריכת תמונות ● גוגל מבטיחה שהכלי משנה את יצירת התוכן החזותי בזכות הבנה סמנטית עמוקה, דיוק פיזיקלי ויכולות עריכה מתקדמות

המודל החדש שמעכשיו יצור ויערוך עבורכם גם בגוגל תמונות. ננו בננה.

גוגל הציגה לאחרונה את Gemini 2.5 Flash, כלי בינה מלאכותית שיצרה זרוע דיפמיינד (Google DeepMind) שלה. הכי מכונה "ננו בננה" בשל יכולותיו, המתוארות כקומפקטיות אך עוצמתיות. 

"ננו בננה" למעשה הוא מודל קיים שכבר הציג יכולות מהפכניות מבוססות AI, והחידוש הוא שהכלי שולב באחרונה באפליקציית ג'מיני (Gemini) ובפלטפורמות גוגל נוספות, מה שהפך אותו לנגיש יותר לקהל הרחב. עוד לפני השקתו ב-ג'מיני, זכה "ננו בננה" להערכה רבה, ואף להתפעמות של משתמשיו, בזכות מה שתואר כיכולתו לשמור על עקביות בדמויות, לשלב סצנות באופן חלק ולבצע עריכות מורכבות בדיוק מדהים.

הכלי קיבל דירוג יוצא דופן והוא ממוקם בראש טבלת הכלים המובילים של עורכי תמונות ב-LM Arena. דירוג זה משקף ביצועים משופרים באופן ניכר, כולל ציוני ELO, שבהם הוא עולה על קודמיו ועל כלים מתחרים כמו Flux Kontext מבית Black Forest Labs.

האם הכלי הורג את פוטושופ?

המודל מוגדר כפורץ דרך וככזה שישנה את הדרך שבה אנו יוצרים ומעבדים תוכן חזותי. לפי גוגל, "ננו בננה" מציג רמת שליטה ויצירתיות מתקדמות, מטשטש את הקו בין דמיון למציאות, ומציע איזון עדין בין דיוק טכני לחופש אמנותי.

ליבת היכולות של Gemini 2.5 Flash טמונה בעריכה וטרנספורמציה של תמונות בדיוק יוצא דופן. הוא מאפשר להוסיף או להסיר מתמונות אלמנטים, כגון אובייקטים או אנשים, באופן חלק ותוך שמירה על שלמותה הטבעית של הסצנה המקורית. המודל מסוגל גם להפוך אובייקטים ולחזות פרספקטיבות נסתרות, מה שמבטיח התאמות ויזואליות דינמיות ומציאותיות.

היוטיובר מתיו ברמן, יזם סדרתי, מהנדס וחובב בינה מלאכותית, המפעיל ערוץ יוטיוב פופולרי שמסקר חידושי טכנולוגיה, ערך הדגמה של יכולות המודל. הוא הציג תמונה של שני סמארטפונים והנחה את הכלי "להפוך" אותם. "ננו בננה" לא רק סובב את המכשירים באופן מדויק, אלא גם יצר באופן מושכל את צידם השני, כולל ממשקי מערכת ההפעלה. ברמן ציין כי המודל "ידע איך נראה הצד השני של ה-iPhone. הוא ידע איך נראים כל האייקונים של ה-iPhone, מערכת ההפעלה כולה", וזה בעיניו מדגיש את המודעות ההקשרית העמוקה של המודל.

יוטיובר אחר, בשם Sirio טען כי "ננו בננה הרג את פוטושופ". מומלץ מאוד לצפות גם בהדגמות שלו ליכולות המודל – למשל ביצירת תמונה שבה אילון מאסק וסם אלטמן – מתנשקים בחושניות.

בנוסף, יכולות העריכה של הכלי כוללות גם הצלחה בהשלמת פנים, בשינויי רקע ובהצבת אובייקטים בתוך התמונות שבהן הוא עוסק.

המודל מפגין גם הבנה חסרת תקדים של פיזיקה ואור בעולם האמיתי. הוא מדמה במדויק תאורה, השתקפויות ותכונות חומריות, וכתוצאה מכך מתקבלים ויז'ואליים מציאותיים ביותר. באחת ההדגמות ברמן הוסיף זוג משקפי שמש מחזירי אור לצילום פורטרט שלו. מודל ה-AI שילב את המשקפיים בצורה חלקה, ושיקף בעדשותיה במדויק את שדה הפרחים הצהובים שמסביב. ברמן הביע התפעלות: "תסתכלו על ההשתקפות במשקפיים. זה מטורף לחלוטין. אתם ממש יכולים לראות את כל הפרחים הצהובים בהשתקפות".

גם עבור פרויקטים הדורשים הדמיה תלת-ממדית, מספק Gemini 2.5 Flash, כך מסתמן, תוצאות יוצאות דופן. הוא יכול ליצור זוויות מרובות של אובייקטים או דמויות, מה שמאפשר יצירת תנוחות ופרספקטיבות מגוונות. יכולת זו היא בעיקר בעלת ערך רב לאנימטורים, למפתחי משחקים ולמעצבי מוצרים הזקוקים לעיבודי תלת-ממד מדויקים ומציאותיים.

אותה הדמות תישמר – לא משנה מה תשנו בתמונה

אחד היתרונות הבולטים של הכלי הוא שמירה על עקביות הדמויות. המודל מדגים יכולת לשמר מראה מדויק של דמות על פני הקשרים שונים ואף טרנספורמציות סגנוניות.

צוות הבלוג של גוגל למזרח התיכון וצפון אפריקה הדגיש בפוסט בנידון את הנקודה הזו וציין: "אנחנו יודעים שבעריכת תמונות של עצמך או של אנשים שאתה מכיר היטב, פגמים עדינים חשובים – תיאור שהוא 'כמעט זהה אבל לא לגמרי' לא מרגיש נכון". לפיכך, הסבירו, יכולת מוקפדת זו מאפשרת לשמור על מראה עקבי של אדם, חיית מחמד או אובייקט על פני עריכות שונות, גם עם שינויים דרמטיים כמו תלבושות חדשות או הגדרות שונות.

הכלי גם מצטיין באפשרות להחיל סגנונות אמנותיים או נושאיים על תמונות, ולהבטיח אסתטיקה אחידה בין עריכות, מבלי להתפשר על האיכות. הוא גם מאפשר לשלב מספר תמונות ליצירת סצנות חדשות, ולבצע עריכות רב-שלביות, שבהן ניתן לשנות חלקים ספציפיים בתמונה, תוך שמירה על שאר המתועד בה כפי שהיה.

בבלוג של גוגל צוין בפוסט על הוספת המודל לג'מיני כי: "אנשים כבר יצאו מדעתם בגללו בהצגות מוקדמות… כעת, אנו נרגשים לשתף שהוא משולב באפליקציית ג'מיני, כך שיש לכם יותר שליטה מאי פעם ליצור את התמונה המושלמת".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים