הולך ומשתדרג: ChatGPT יכול כעת לראות, לשמוע ולדבר

OpenAI הודיעה באחרונה שהצ’טבוט מבוסס מודל השפה הגדול שלה קיבל עוד תכונות שיאפשרו לו לתקשר איתכם ביותר נוחות מעכשיו ● האם זה טוב או רע לעולם ומה יאמרו על החידוש החוששים מ-AI?

באג. ChatGPT.צילום: Shutterstock

"אנחנו מתחילים להשיק יכולות קול ותמונה חדשות ב-ChatGPT", בישרה אתמול (ב') חברת הבינה המלאכותית היוצרת OpenAI למשתמשיה הרבים. לפי החברה, התכונות שמתווספות כעת לצ'טבוט שלה "מציעות סוג חדש ואינטואיטיבי יותר של ממשק, בכך שהן מאפשרות לכם לנהל שיחה קולית או להראות ל-ChatGPT על מה אתם מדברים".

הוספת הקול והתמונה לאפשרויות הקלט של ChatGPT אמורה לספק דרכים נוספות להשתמש בבוט היוצר, שהפך מאז השקתו למאוד פופולרי בלאו הכי.

כדי להמחיש את החידוש הסבירה OpenAI שהמשתמש יכול למשל לצלם תמונה של נקודת ציון תוך כדי נסיעה ולקיים שיחה בלייב עם הכלי בנוגע לשאלה מה מעניין במקום שתועד. או לדוגמה החברה הציעה, "כשאתם בבית, צלמו תמונות של המקרר והמזווה שלכם, כדי להבין מה יש לארוחת ערב (ושאלו שאלות המשך למתכון שלב אחר שלב)".

בחברה מציעים למשתמשים פשוט לעבור במקום לכתוב, לדבר עם ChatGPT, ולבקש ממנו לדבר אליכם בחזרה במתכונת של שיחה. לצ'אטבוט יש חמישה קולות שונים אופציונליים, שמתוכם תוכלו לבחור את הקול המועדף עליכם.

Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.

Sound on 🔊 pic.twitter.com/3tuWzX0wtS

— OpenAI (@OpenAI) September 25, 2023

יכולת הקול החדשה מופעלת על ידי מודל טקסט לדיבור חדש, המסוגל לייצר אודיו עם קול דמוי אדם מטקסט בלבד וממספר שניות של דיבור שסרק כדוגמה. ב-OpenAI מספרים כי שיתפו פעולה עם שחקני קול מקצועיים, כדי ליצור כל אחד מהסוגי הקולות. כמו כן כתבה החברה בפוסט שהעלתה לבלוג שלה אודות החידושים, שהיא משתמשת גם ב-Whisper, מערכת זיהוי הדיבור שלה בקוד פתוח, כדי לתמלל את המילים המדוברות של המשתמשים לטקסט.

בנוסף, כאמור, כעת יכולים המשתמשים להציג ל-ChatGPT תמונה אחת או יותר. למשל, מציעים ב-OpenAI, לבקש מהצ'טבוט לפתור את התהייה מדוע מכשיר חשמלי שלכם לא מתחיל לעבוד, על ידי צילום של כפתוריו ומחווניו, או להעלות לכלי גרף מורכב עם נתונים הקשורים לעבודה ולבקש ממנו לנתח אותם. כדי להתמקד בחלק מסוים של תמונה, הוסבר, ניתן להשתמש בכלי הציור באפליקציה של החברה בנייד.

לפי ההסברים, הבנת התמונה על ידי הכלי מופעלת באמצעות GPT-3.5 ו-GPT-4 ומודלים אלה מיישמים את כישורי החשיבה השפתית שלהם על מגוון רחב של תמונות, כגון תצלומים, צילומי מסך ומסמכים המכילים טקסט ותמונות כאחד.

האם הצ'טבוט ההולך ומשתדרג מפוקח ובטוח?

המטרה של OpenAI היא, לדבריה, לבנות כלי בינה מלאכותית חזקה, המכונה AGI (ר"ת Artificial general intelligence), שיהיה בטוח ומועיל. לפיכך בחברה הופכים עוד ועוד יכולות וכלים שפיתחו לזמינים בהדרגה, "מה שמאפשר לנו לבצע שיפורים ולצמצם סיכונים לאורך זמן ובמקביל להכין את כולם למערכות חזקות יותר בעתיד. אסטרטגיה זו הופכת חשובה עוד יותר עם מודלים מתקדמים הכוללים קול ואימג'ים", צוין בפוסט.

בחברה גם הבטיחו למודאגים בנוגע להפיכת כלי הבינה המלאכותית היוצרת המוביל לעוד יותר חכם אפילו, שקיפות לגבי מגבלות המודל. OpenAI הצהירה בפוסט כי המשתמשים כנראה ירצו להסתמך על יכולות ChatGPT לנושאים מיוחדים, למשל בתחומים כמו מחקר. "אנו שקופים לגבי מגבלות המודל ומונעים מקרי שימוש בסיכון גבוה ללא אימות מתאים", צוין בפוסט. "תוכלו לקרוא עוד על הגישה שלנו לבטיחות והעבודה שלנו עם Be My Eyes בכרטיס המערכת לקלט תמונה", הציעה החברה.

בכל אופן, אם לחזור לפרטים הטכניים של האירוע – לפי העדכון, לעת עתה מוטב לנהל את התקשורת עם הצ'טבוט ותכונותיו החדשות באנגלית. בחברה הודו שהוא "גרוע" עם שפות אחרות וגרוע במיוחד עם כמה שפות ספציפיות, שעברית אינה אחת מהן.

וכתמיד העדכון מתגלגל – האפשרות להעלאת קול ותמונות ל-ChatGPT תגיע ותוצע קודם כל למשתמשי Plus ו-Enterprise, והדבר יקרה במהלך השבועיים הקרובים. היכולות הללו ימשיכו ויגיעו גם לידי משתמשים "רגילים", כולל מפתחים, זמן קצר לאחר מכן.

אם התלהבתם, רצוי שתדעו גם כי כהתחלה פיצ'ר הקול יגיע ל-iOS ואנדרואיד ותכונת התמונות תהיה זמינה בכל הפלטפורמות.

תגובות

(0)

יש לכם כסף בחשבון אבל העסקה לא אושרה? יש לזה פתרון

"בתוך חמש שנים יפעלו בישראל 100 אלף מעבדים ייעודיים ל-AI"

"צריכת החשמל הגדלה בגלל ה-AI – אתגר משמעותי למשק האנרגיה בישראל"

"הבינה המלאכותית טורפת את הקלפים גם בעולם ניתוח הנתונים"

לא שעשע את המשתמשים: מטא הסירה את Muse Image מאינסטגרם

מהפכת GPT-5.6: פריצת דרך בביצועים, סוכנים אוטונומיים והורדת עלויות

לקראת הבחירות: טיקטוק פתחה במערכה נגד ספאם פוליטי ומטעה מבוסס AI

מצב ההיי-טק החרדי: זינוק בשילוב צעירים ונשים

ארבעה דורות של ענקיות טכנולוגיה יתחרו בחצי גמר המונדיאל

האם חוות השרתים מוכוונות AI הן בועה או המהפכה הבאה?

סייבר במהירות מכונה: כך ארגונים צריכים להיערך לעידן החדש

נשים ומחשבים: דגנית בר, סליריקס

ליונל מסי-סאטיה נאדלה שוב עשה את זה

מהי אחריות ההנהלה על שימוש בקוד פתוח בעידן ה-CRA?

משבר זיכרון: האם הבינה המלאכותית הורגת את שאר תעשיית הטק?

סיילספורס מביסה את אורקל ורונאלדו-הואנג יורד מבמת המונדיאלים

הולך ומשתדרג: ChatGPT יכול כעת לראות, לשמוע ולדבר

האם הצ'טבוט ההולך ומשתדרג מפוקח ובטוח?

תגובות

כתיבת תגובה לבטל

אירועים קרובים

ידיעות מובילות

כך מסייע ה-IT לניהול אירועי המכביה ה-22

ירון יהב מונה למנמ"ר קבוצת הנדל"ן BST

פריצת דרך בממשלה: המנמ"ר שודרג לסמנכ"ל – וידווח ישירות למנכ"ל

אורלי אברמוביץ', סמנכ"לית מחשוב ודיגיטל בקבוצת בזן – פורשת מתפקידה

פרולוג'יק תפיץ בישראל את סוויטת פתרונות אבטחת המידע של איילנד

קבוצת מלם תים מקימה את אגף פתרונות המומחה Xpert Solutions

יש לכם כסף בחשבון אבל העסקה לא אושרה? יש לזה פתרון

"בתוך חמש שנים יפעלו בישראל 100 אלף מעבדים ייעודיים ל-AI"

"צריכת החשמל הגדלה בגלל ה-AI – אתגר משמעותי למשק האנרגיה בישראל"

"הבינה המלאכותית טורפת את הקלפים גם בעולם ניתוח הנתונים"

לא שעשע את המשתמשים: מטא הסירה את Muse Image מאינסטגרם

מהפכת GPT-5.6: פריצת דרך בביצועים, סוכנים אוטונומיים והורדת עלויות

לקראת הבחירות: טיקטוק פתחה במערכה נגד ספאם פוליטי ומטעה מבוסס AI

מצב ההיי-טק החרדי: זינוק בשילוב צעירים ונשים

ארבעה דורות של ענקיות טכנולוגיה יתחרו בחצי גמר המונדיאל

האם חוות השרתים מוכוונות AI הן בועה או המהפכה הבאה?

סייבר במהירות מכונה: כך ארגונים צריכים להיערך לעידן החדש

נשים ומחשבים: דגנית בר, סליריקס

ליונל מסי-סאטיה נאדלה שוב עשה את זה

מהי אחריות ההנהלה על שימוש בקוד פתוח בעידן ה-CRA?

משבר זיכרון: האם הבינה המלאכותית הורגת את שאר תעשיית הטק?

סיילספורס מביסה את אורקל ורונאלדו-הואנג יורד מבמת המונדיאלים

הולך ומשתדרג: ChatGPT יכול כעת לראות, לשמוע ולדבר

האם הצ'טבוט ההולך ומשתדרג מפוקח ובטוח?

תגובות

כתיבת תגובה לבטל

אירועים קרובים

תוכן פרסומי

תוכן פרסומי

תוכן פרסומי

ידיעות מובילות

כך מסייע ה-IT לניהול אירועי המכביה ה-22

ירון יהב מונה למנמ"ר קבוצת הנדל"ן BST

פריצת דרך בממשלה: המנמ"ר שודרג לסמנכ"ל – וידווח ישירות למנכ"ל

אורלי אברמוביץ', סמנכ"לית מחשוב ודיגיטל בקבוצת בזן – פורשת מתפקידה

פרולוג'יק תפיץ בישראל את סוויטת פתרונות אבטחת המידע של איילנד

קבוצת מלם תים מקימה את אגף פתרונות המומחה Xpert Solutions