בדיקת מודל ה-R1 של דיפסיק

לא הצליח לצנזר את עצמו בעברית. דיפסיק.

מטריד: כלי ה-GenAI הסיני דיפסיק נכשל בגדול במבחן אמינות מידע

בדיקת NewsGuard חשפה שהצ'טבוט החדש שחולל השבוע מהומת עולם בזירת ה-AI העולמית, מספק תשובות מדויקות רק ב-17% מהמקרים ואולי חמור מכך - נוטה להכניס עמדות של הממשלה הסינית לתשובותיו

אירועים קרובים