בדיקת מודל ה-R1 של דיפסיק

מטריד: כלי ה-GenAI הסיני דיפסיק נכשל בגדול במבחן אמינות מידע
בדיקת NewsGuard חשפה שהצ'טבוט החדש שחולל השבוע מהומת עולם בזירת ה-AI העולמית, מספק תשובות מדויקות רק ב-17% מהמקרים ואולי חמור מכך - נוטה להכניס עמדות של הממשלה הסינית לתשובותיו