التكنولوجيا عاجزة أمام أسماء شخصيات "صراع العروش"!

العلوم والتكنولوجيا

التكنولوجيا عاجزة أمام أسماء شخصيات
شخصيتا: أم التنانين وجون سنو في مسلسل صراع العروش
انسخ الرابطhttps://ar.rt.com/lqnz

تشكل شخصيات مسلسل "صراع العروش" والعديد من روايات الخيال الأخرى، مشكلة حقيقية بالنسبة للتكنولوجيا المصممة لفك رموز اللغات والكلمات المكتوبة.

وتكمن المشكلة في أن الأسماء الغريبة، مثل "داينيريز" و"غري ورم"، لا تشبه معظم الأسماء من العالم الواقعي، كما لا تلتقطها التكنولوجيا في أغلب الأحيان، لأنها لا تعبّر عن الحالات الطبيعية.

وطُوّرت الخوارزميات ودُرّبت على اكتشاف الأسماء، من خلال دراسة مقالات الصحف.

وتبيّن أنه يوجد أسلوب كتابة مختلف تماما في الروايات غير الخيالية، يجعل اكتشاف الأسماء الخيالية أمرا مستحيلا تقريبا.

واختبر الباحثون قدرة 4 أدوات مختلفة من عناصر معالجة اللغة الطبيعية (NLP)، على التعرف على أسماء الشخصيات الشهيرة في 40 رواية، بما في ذلك "صراع العروش".

وتُستخدم أدوات معالجة اللغة الطبيعية (NLP) بشكل شائع في العديد من التطبيقات اليومية، مثل "سيري" و"غوغل".

ومع ذلك، فإن التكنولوجيا غير مكتملة وتفشل أمام أسماء وأحداث دنيوية أخرى.

ونشر باحثو جامعة "Vrije" في أمستردام، تحليلهم الأخير في "PeerJ"، حيث يسلطون الضوء على أنواع الأسماء والنصوص، التي تشكل تحديا كبيرا، مع إدراك بعض علامات الاسم الملموسة، مثل البدء بحرف كبير أو أن يكون مسبوقا بضمير.

ويمكن لمؤلفي الروايات الخيالية تكوين أسمائهم الخاصة، مثل "تايوين" أو "رولو"، التي لها أوجه تشابه محدودة جدا مع الأسماء الحقيقية.

وتنشأ المشكلات عندما تظهر أسماء الشخصيات مباشرة من القاموس، كأسماء أو صفات، مثل "غري ورم. تي". هذه الأسماء لا تتصرف مثل الأسماء "العادية"، لذا تواجه أنظمة البرمجة اللغوية العصبية (NLP) صعوبة في التعرف عليها في النص.

وعلى سبيل المثال، يمكن الإشارة إلى "داينيريز تارغارين" بـ "داينيريزم"، ولكنها تمتلك عددا كبيرا من الألقاب الأخرى، مثل "داني" و"أم التنانين" و"خاليسي" و"مايسا"، ما يصعّب المهمة على التكنولوجيا الحديثة.

المصدر: ديلي ميل

موافق

هذا الموقع يستخدم ملفات تعريف الارتباط .بامكانك قراءة شروط الاستخدام لتفعيل هذه الخاصية اضغط هنا