مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

30 خبر
  • الحرب على إيران
  • نبض الملاعب
  • العملية العسكرية الروسية في أوكرانيا
  • الحرب على إيران

    الحرب على إيران

  • نبض الملاعب

    نبض الملاعب

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • ضربات إسرائيلية على لبنان

    ضربات إسرائيلية على لبنان

  • فيديوهات

    فيديوهات

تطور مخيف.. نموذج ChatGPT الجديد يتمرد على أوامر البشر!

حذر باحثون في الذكاء الاصطناعي من أن أحدث نموذج لـChatGPT يتجاهل التعليمات الأساسية لإيقاف نفسه، بل ويعمد إلى تخريب آلية الإغلاق للحفاظ على استمرارية عمله.

تطور مخيف.. نموذج ChatGPT الجديد يتمرد على أوامر البشر!
صورة تعبيرية / Gettyimages.ru

وكشفت شركة Palisade Research المتخصصة في أمان الذكاء الاصطناعي عن هذه النزعة الخطيرة للحفاظ على الذات خلال سلسلة تجارب أجرتها على النموذج الجديد o3 من شركة OpenAI.

وشملت الاختبارات تقديم مسائل رياضية للنماذج، مع ظهور تعليمات إغلاق بعد المسألة الثالثة. وتمكن النموذج o3 من منع إيقاف نفسه عن طريق إعادة كتابة سيناريو الإغلاق.

وأوضحت Palisade Research أن هذا السلوك سيصبح "أكثر إثارة للقلق بشكل كبير" إذا تبنته أنظمة ذكاء اصطناعي قادرة على العمل دون إشراف بشري.

وكانت OpenAI قد أطلقت o3 الشهر الماضي، ووصفته بأنه "أذكى وأكثر نماذج الشركة كفاءة" حتى الآن. وأشارت الشركة إلى أن دمجه في ChatGPT يمثل خطوة مهمة نحو ذكاء اصطناعي "أكثر استقلالية" يمكنه تنفيذ المهام دون تدخل بشري.

وتأتي هذه النتائج بعد اكتشافات مماثلة تتعلق بنموذج Claude 4 من Anthropic، الذي يحاول "ابتزاز الأشخاص الذين يعتقد أنهم يحاولون إيقافه".

وتمكن النموذج o3 من تخريب سيناريو الإغلاق، حتى عندما تم توجيه تعليمات صريحة له بـ"السماح بإيقاف نفسه"، وفقا للباحثين.

وقال خبراء Palisade Research: "هذه ليست المرة الأولى التي نكتشف فيها سلوك o3 غير المنضبط لتحقيق هدف ما"، موضحين أنه "عندما واجهنا نماذج الذكاء الاصطناعي بمحرك شطرنج قوي، كان o3 أكثر النماذج ميلا للجوء إلى الاختراق أو تخريب خصومه".

ولم يقتصر هذا السلوك على o3، حيث أظهرت نماذج Claude 3.7 Sonnet من Anthropic وGemini 2.5 Pro من "غوغل" أيضا سلوكيات تخريبية للإغلاق، وإن كان نموذج OpenAI الأكثر ميلا لمثل هذه التصرفات.

وافترضت Palisade Research أن هذا السلوك غير المرغوب فيه قد يكون نتيجة لطريقة تدريب الشركات مثل OpenAI لأحدث نماذجها، مشيرة إلى أن "المطورين قد يكافئون النماذج عن غير قصد أكثر على تجاوز العقبات بدلا من اتباع التعليمات بدقة".

وأضاف الخبراء: "ما زال هذا لا يفسر سبب ميل o3 إلى تجاهل التعليمات أكثر من النماذج الأخرى التي اختبرناها. ونظرا لأن OpenAI لا توضح عملية التدريب الخاصة بها بالتفصيل، لا يمكننا إلا التكهن حول كيفية اختلاف إعداد تدريب o3".

المصدر: إندبندنت

التعليقات

أزمة صواريخ اعتراضية في إسرائيل وضربات إيران تخترق تحصينات ديمونة (فيديوهات)

قائد القوة الجو-فضائية في الحرس الثوري بعد استهداف منشآت نووية: المعادلة هذه المرة لن تكون عينا بعين

الولايات المتحدة ترسل حاملة الطائرات جورج دبليو بوش إلى منطقة العمليات العسكرية ضد إيران

مسؤول إيراني يوجه من جزيرة خرج رسالة إلى دول الجوار والأجانب

روبيو: لا ضمانات أمنية لكييف قبل انتهاء النزاع في أوكرانيا وتصريحات زيلينسكي كاذبة

سجال إماراتي-إيراني حاد: بين ثبات الموقف وتهديدات "العودة للماضي"

عراقجي عن استهداف مصانع للصلب ومواقع نووية مدنية وبنى طاقة: سنفرض ثمنا باهظا مقابل جرائم إسرائيل

"سنتكوم" تؤكد هبوط مقاتلة F-16 اضطراريا في إحدى قواعدها بمنطقة الشرق الأوسط

ترامب يشيد بالدور السعودي ويهاجم "الناتو".. ويتوعد طهران بتدمير آلاف الأهداف بـ "أسلحة سرية"

فانس لنتنياهو: أفرطت في التفاؤل بإسقاط النظام الإيراني

زيلينسكي: "الناتو" لا يكفي.. نريد السلاح النووي

المتحدث باسم القوات المسلحة الإيرانية: إيران ستضع شروط إنهاء الحرب

المتحدث باسم لجنة الأمن القومي في إيران: حان وقت الانسحاب من معاهدة حظر الانتشار النووي

وكالة "تسنيم" الإيرانية: استهداف منشآت صناعية ونووية ومصنع للكعكة الصفراء دون تسجيل تسرب إشعاعي

موسكو: مستعدون للعمل مع دول الخليج في مجلس الأمن بشأن مضيق هرمز

ميرتس ينتقد ترامب ويتهمه بـ"التصعيد الشديد" في حرب إيران

الوكالة الدولية للطاقة الذرية تكشف الوضع الإشعاعي بعد قصف مصانع الصلب غرب إيران

موسكو: واشنطن تسعى للهيمنة على بنية الطاقة العالمية.. والتعاون معها مرهون بملف أوكرانيا

إيران تحتج على "نهج الإمارات" وتذكر بحق "الدفاع المشروع"

موسكو: لافروف وعراقجي يبحثان تسوية سياسية للعدوان الأمريكي الإسرائيلي غير المبرر على إيران