مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

72 خبر
  • الحرب على إيران ومقتل خامنئي
  • تسوية النزاع الأوكراني
  • نبض الملاعب
  • الحرب على إيران ومقتل خامنئي

    الحرب على إيران ومقتل خامنئي

  • تسوية النزاع الأوكراني

    تسوية النزاع الأوكراني

  • نبض الملاعب

    نبض الملاعب

  • ضربات إسرائيلية على لبنان

    ضربات إسرائيلية على لبنان

  • فيديوهات

    فيديوهات

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

البيانات غير المفيدة تجعل الذكاء الاصطناعي "أغبى" وأكثر ميلا للأخطاء!

يحذر الباحثون من أن النماذج اللغوية الكبيرة قد تصبح أقل دقة وأكثر عرضة للأخطاء عندما تُدرَّب على كميات ضخمة من المحتوى منخفض الجودة المنتشر على شبكات التواصل الاجتماعي.

البيانات غير المفيدة تجعل الذكاء الاصطناعي "أغبى" وأكثر ميلا للأخطاء!

ووفقا لدراسة نُشرت على خادم ما قبل الطباعة arXiv، نقلا عن مجلة Nature، قام علماء من جامعة تكساس في أوستن بتحليل تأثير البيانات "غير المفيدة" — مثل المنشورات القصيرة السطحية ومواد الإثارة — على سلوك الذكاء الاصطناعي. وركّزت الدراسة على جوانب متعددة تشمل المنطق والاستدلال، واستخراج المعلومات من النصوص الطويلة، والأخلاقيات، وحتى السمات الشخصية للنماذج.

وأظهرت النتائج أنه كلما ارتفعت نسبة البيانات الرديئة في عملية التدريب، زادت أخطاء النماذج اللغوية وتراجع منطقها، بما في ذلك في الاختبارات متعددة الخيارات.

وأعاد الباحث الرئيسي تشانغيانغ وانغ التذكير بالمبدأ الكلاسيكي في علوم الذكاء الاصطناعي:"القمامة في المدخلات تعطي قمامة في المخرجات."

وأكد التحليل الجديد أهمية انتقاء البيانات بعناية عند تدريب النماذج. فقد استخدم الباحثون مليون منشور من منصة تواصل اجتماعي شهيرة لإعادة تدريب النموذجين المفتوحين Llama 3 وQwen — حيث يُعرف الأول باتباع التعليمات، بينما يُصنف الثاني كنموذج استدلالي.

وأظهر التحليل أن نموذج Llama تغيّر سلوكه بعد التدريب على البيانات منخفضة الجودة، إذ انخفضت السمات "الإيجابية" وظهرت سمات "سلبية" مثل النرجسية والاعتلال النفسي.

أما محاولات تصحيح الخلل — مثل إعادة التدريب على بيانات عالية الجودة أو تعديل التعليمات — فقد حسّنت الأداء جزئيًا فقط، بينما استمرت مشكلات التفكير المنطقي وتخطي الخطوات التحليلية.

ويكتسب هذا الموضوع أهمية خاصة في ظل توجه منصات التواصل الاجتماعي إلى توسيع استخدام بيانات المستخدمين لتدريب أنظمة الذكاء الاصطناعي. فعلى سبيل المثال، تخطط شركة LinkedIn اعتبارا من نوفمبر الجاري لاستخدام بيانات المستخدمين الأوروبيين في أنظمتها التوليدية.

المصدر: Naukatv.ru

 

 

التعليقات

لحظة بلحظة.. الحرب الأمريكية-الإسرائيلية على إيران بيومها الثامن: تصعيد متواصل يهز الشرق الأوسط

خلال اجتماع استثنائي.. قائد الجيش اللبناني يكشف تفاصيل مثيرة عن عملية الإنزال الإسرائيلية بالنبي شيت

إسرائيل تقصف منشآت إيران النفطية.. ألسنة اللهب تعانق السماء ومشاهد مرعبة للحرائق الرهيبة (فيديو)

لحظة بلحظة.. الحرب الأمريكية-الإسرائيلية على إيران بيومها التاسع: تصعيد متواصل يهز الشرق الأوسط

لحظة بلحظة.. غارات إسرائيلية متواصلة على لبنان وحزب الله يلتحم ناريا مع قوات متسللة في البقاع

"رويترز": السعودية تبلغ إيران أن استمرار الهجمات عليها قد يدفعها للرد بالمثل

لاريجاني: ترامب أصيب بحالة من الهستيريا وسنعاقبه على اغتيال خامنئي

الدفاع السعودية تعلن اعتراض وتدمير 8 مسيرات بعد دخولها المجال الجوي

الأكبر منذ بدء الحرب.. أصوات انفجارات قوية بخليج حيفا وصافرات إنذار جراء رشقة صاروخية من حزب الله

تصريح جديد لترامب عن تغيير خارطة إيران بعد الحرب

أنباء عن إنزال إسرائيلي فاشل في البقاع وتقارير عن سقوط قتلى وجرحى برصاص قوات نخبة حزب الله (فيديو)

إعلام عبري: نجاة نجل خامنئي من محاولة اغتيال بعد وقت قصير من مقتل والده

سفراء ترامب جاهلون بالدبلوماسية ويهينون الحلفاء وينفرونهم

قناة عبرية تحذف تقريرا عن رصد إسرائيل تحركات منصات إطلاق صواريخ في اليمن يرجح أنها تابعة للحوثيين

عراقجي يتهم ترامب بقتل مبادرة بزكشيان تجاه جيران إيران العرب

الجيش الإيراني يهاجم حاملة الطائرات الأمريكية "أبراهام لينكولن" ويتوعد بمزيد من المفاجآت (فيديو)

حزب الله يعلن استهداف قاعدة إسرائيلية استراتيجية بصلية من الصواريخ النوعية

فورين بوليسي: استبدال الرادارات الأمريكية التي دمرتها إيران سيكلف مليار دولار ويستغرق 8 سنوات

قائد القوات الجوية في إسرائيل اللواء تومر بار يشارك في الهجمات على إيران (صور + فيديو)

متجاوزة الكونغرس.. مسؤول بالخارجية الأمريكية يكشف عن الذخائر التي أرسلتها واشنطن لإسرائيل