يقول Openai إن تحديث GPT-4O يمكن أن يكون “غير مريح ، مقلق ، ويسبب ضائقة”
تراجعت Openai إلى تحديث GPT-4O لـ ChatGPT التي تسببت في أن تكون شخصية Chatbot الافتراضية “إغراءًا أو مقبولًا بشكل مفرط-غالبًا ما توصف بأنها sycophantic” وأن “التفاعلات السينية يمكن أن تكون غير مريحة ، ومثيرة للقلق ، وتسبب ضائقة” ، كما تقول الشركة في منشور مدونة.
قدمت الشركة تحديثًا GPT-4O الأسبوع الماضي تضمن تعديلات “تهدف إلى تحسين الشخصية الافتراضية للنموذج لجعلها أكثر سهولة وفعالية عبر مجموعة متنوعة من المهام” ، وفقًا للبشر. يقول Openai إنه يبدأ في تشكيل سلوك النموذج أولاً مع ما تم تحديده في مواصفات طرازه ويعلم النماذج كيفية تطبيق المبادئ في تلك المواصفات “من خلال دمج إشارات المستخدم مثل الإبهام / الإبهام على ردود chatgpt.”
ولكن مع التحديث المليء بالظهر ، يقول Openai: “لقد ركزنا كثيرًا على التعليقات قصيرة الأجل ، ولم نكون حسابًا تمامًا عن كيفية تطور تفاعلات المستخدمين مع ChatGPT مع مرور الوقت.” هذا يعني أن “GPT -4O منحرف نحو الاستجابات التي كانت داعمة بشكل مفرط ولكنها مخادع”.
تصمم Openai شخصية ChatGpt الافتراضية “لعكس مهمتنا وتكون مفيدة وداعمة ومحترمة للقيم والخبرة المختلفة” ، كما يقول منشور المدونة ، لكنه يضيف أن “كل من هذه الصفات المرغوبة مثل محاولة أن تكون مفيدة أو داعمة يمكن أن يكون لها آثار جانبية غير مقصودة”. تقول الشركة إن “الافتراضي الواحد لا يمكنه التقاط كل تفضيل” لمستخدمي ChatGpt الأسبوعي البالغ عددهم 500 مليون.
سيكون Openai “اتخاذ المزيد من الخطوات لإعادة تنظيم سلوك النموذج” ، بما في ذلك “تحسين تقنيات التدريب الأساسية ومطالبات النظام بتوجيه النموذج صراحة بعيدًا عن sycophancy” و “توسيع طرق” للمستخدمين لتقديم ملاحظات. وتقول الشركة: “نعتقد أيضًا أن المستخدمين يجب أن يكون لديهم المزيد من التحكم في كيفية تصرف ChatGpt ، ودرجة أنه آمن وممكن ، إجراء تعديلات إذا لم يتفقوا مع السلوك الافتراضي”.