أعلنت شركة أوبن إيه آي عن إطلاق تحديث جديد لنموذجها “تشات جي بي تي”، تحت اسم GPT-5.3 إنستانت، مع تحسينات تستهدف تقليل ظاهرة “الهلوسة” التي تؤدي إلى تقديم معلومات غير دقيقة أو غير موجودة، وجعل الحوار أكثر تفاعلاً ودقة.
أبرز مميزات التحديث:
-
النموذج الجديد خفّض ظاهرة الهلوسة بنسبة تصل إلى 26.8% مقارنة بالإصدار السابق، وفق تقييمات داخلية.
-
أصبح GPT-5.3 إنستانت هو النموذج الافتراضي داخل “تشات جي بي تي” والأكثر استخداماً بين المستخدمين، ومتاحة أيضاً للمطورين عبر واجهات البرمجة.
-
التحديث يشمل نموذج “إنستانت” فقط، فيما تعمل الشركة على ترقية نماذج “ثينكينغ” و”برو” إلى الإصدار 5.3 لاحقاً.
نتائج التقييمات الداخلية:
-
التقييم الأول ركّز على مجالات الطب، التمويل، والقانون لقياس دقة المعلومات الحساسة.
-
التقييم الثاني اعتمد على ملاحظات المستخدمين اليومية أثناء استخدام النموذج.
-
انخفاض الهلوسة بنسبة 26.8% عند استخدام البحث عبر الإنترنت.
-
تحسّنت موثوقية الإجابات بنسبة 19.7% عند الاعتماد على المعرفة الداخلية للنموذج.
-
عند تحليل ملاحظات المستخدمين، انخفضت الهلوسة بنحو 22.5% في إجابات البحث على الويب.
تحسين تجربة الحوار:
-
التحديث جعل أسلوب الحوار أكثر مباشرة وارتباطاً بالسؤال.
-
قلل من حالات رفض الإجابة على أسئلة غير مخالفة لقواعد السلامة.
-
خفّض الردود التي تتضمن مقدمات دفاعية أو تعليقات أخلاقية مطولة.
-
ركّز على عناصر الاستخدام اليومي مثل نبرة الإجابة، تدفق الحوار، وارتباط الرد بالسؤال.
فهم أفضل للسياق:
-
أصبح النموذج قادرًا على فهم السياق الضمني للأسئلة وتحديد المعلومات الأكثر أهمية.
-
مثال: سؤال عن أكبر صفقة في دوري البيسبول الأميركي؛ الإصدار الجديد يقدم المعلومات الأساسية مع التركيز على تأثير الحدث بدلاً من تلخيص نتائج البحث فقط.
المنافسة والقيود التقنية:
-
شركات أخرى تعمل على تقليل الهلوسة، مثل أنثروبيك ونموذجها “كلود سونيت 4.6”.
-
جوجل واجهت انتقادات بعد أن قدم نموذج “غيما 3” معلومات غير صحيحة، ما دفعها لسحبه.
-
النموذج لا يزال يواجه قيوداً في بعض اللغات مثل الكورية واليابانية حيث قد تبدو الإجابات أقل سلاسة.
اختبارات السلامة:
-
اختبارات معيارية أظهرت أداءً جيداً في التعامل مع المحتوى غير المسموح به.
-
سجل تراجع نسبي في بعض الفئات مثل المحتوى الجنسي وفئة إيذاء النفس مقارنة بـ GPT-5.2 إنستانت، بينما كان الأداء في باقي الفئات مماثلاً أو أفضل.
-
التراجع المسجل يحمل دلالة إحصائية منخفضة.
خطط مستقبلية:
-
أوبن إيه آي ألمحت إلى إصدار GPT-5.4 قريباً، متوقع أن يصدر “في وقتٍ أقرب مما يتوقع المستخدمون”.
كتبت: جهاد شعبان
