مباشر

Stories

29 خبر
  • خليفة بايدن في مقارعة ترامب
  • الحرب على غزة
  • العملية العسكرية الروسية في أوكرانيا
  • خليفة بايدن في مقارعة ترامب

    خليفة بايدن في مقارعة ترامب

  • الحرب على غزة

    الحرب على غزة

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • كواليس الأولمبياد في فرنسا

    كواليس الأولمبياد في فرنسا

  • محاولة اغتيال ترامب

    محاولة اغتيال ترامب

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

من هو الجندي الإسرائيلي "المسلم" الذي حضر مع نتنياهو ووقف له الكونغرس مصفقا؟ (فيديو)

بايدن يصدر قرارا بتأجيل ترحيل لبنانيين من الولايات المتحدة بسبب التوترات بين حزب الله وإسرائيل

صحيفة: الحرس الثوري الإيراني زود حزب الله اللبناني بقنابل وصواريخ تحمل رؤوسا إلكترومغناطيسية متفجرة

كيربي حول صفقة تبادل بين إسرائيل وحماس: لا يزال هناك فجوات ونعتقد أن بعض التنازلات ستحلها

نيبينزيا: على واشنطن تسديد ما عليها للأمم المتحدة قبل إلقاء المواعظ على الآخرين

مشاهد من كمائن "القسام" ضد جنود إسرائيليين داخل مخيمي يبنا والشابورة بمدينة رفح جنوب غزة (فيديو)

الرئيس الإيراني معلقا على التصفيق لنتنياهو: التصفيق لا يطهر المجرمين من قتل الأبرياء والأطفال

بومبيو يقترح على ترامب هزيمة روسيا بـ500 مليار دولار لأوكرانيا

وسائل إعلام: اجتماع رباعي في روما يوم الأحد المقبل للوصول لاتفاق هدنة في قطاع غزة

إعلام عبري: إسرائيل تطالب بالحصول على قائمة بأسماء المختطفين الأحياء قبل تنفيذ الصفقة

إعلام مصري: القاهرة أبلغت المشاركين في اجتماع روما تمسكها بانسحاب إسرائيلي كامل من معبر رفح

مجلس الأمن القومي التركي يصدر بيانا عن سوريا وأوكرانيا وإسرائيل وعدد من الملفات

اليابان.. إشكال وملاسنة بين سياح إسرائيليين ومتضامنين محليين مع فلسطين (فيديوهات)