مباشر

روبوت دردشة من غوغل يجتاز اختبار الترخيص الطبي للولايات المتحدة!.. فهل يحل مكان البشر؟

تابعوا RT على
أفادت دراسة تمت مراجعتها يوم الأربعاء أن روبوت الدردشة الطبي من غوغل الذي يعمل بالذكاء الاصطناعي قد حقق درجة النجاح في اختبار ترخيص طبي أمريكي صعب.

لكن إجاباته لا تزال أدنى من إجابات الأطباء البشر.

في العام الماضي، أطلق إصدار ChatGPT - الذي يدعم مطوره OpenAI من قبل شركة "مايكروسوفت" المنافِسة لشركة غوغل - سباقا بين عمالقة التكنولوجيا في مجال الذكاء الاصطناعي المزدهر.

وفي حين تم تحقيق الكثير بشأن الاحتمالات المستقبلية - ومخاطر - الذكاء الاصطناعي، فإن الصحة هي أحد المجالات التي أظهرت فيها التكنولوجيا بالفعل تقدما ملموسا، مع خوارزميات قادرة على قراءة فحوصات طبية معينة.

وكشفت غوغل لأول مرة النقاب عن أداة الذكاء الاصطناعي الخاصة بها للإجابة عن الأسئلة الطبية، والتي تسمى Med-PaLM، في دراسة ما قبل الطباعة في ديسمبر. وعلى عكس ChatGPT، لم يتم إصداره للجمهور.

ويقول عملاق التكنولوجيا الأمريكي إن Med-PaLM هو أول نموذج لغة كبير، وتقنية ذكاء اصطناعي مدربة على كميات هائلة من النصوص التي ينتجها الإنسان، لاجتياز امتحان الترخيص الطبي الأمريكي (USMLE).

وتبلغ درجة النجاح في الامتحان، الذي يجتازه طلاب الطب والأطباء المتدربون في الولايات المتحدة، حوالي 60%.

وفي فبراير، قالت دراسة إن ChatGPT حقق نتائج النجاح أو تلك القريبة من النجاح.

وفي دراسة تمت مراجعتها من قبل الأقران ونشرت في مجلة Nature يوم الأربعاء، قال باحثو غوغل إن Med-PaLM حقق 67.6% في أسئلة الاختبار من متعدد على غرار USMLE.

وقالت الدراسة "Med-PaLM يعمل بشكل مشجع، لكنه لا يزال أدنى من الأطباء".

ولتحديد وتقليل "الهلوسة" - وقت تقديم نماذج الذكاء الاصطناعي معلومات خاطئة - قالت غوغل إنها طورت معيارا جديدا للتقييم.

وقال كاران سينغال، الباحث في غوغل والمعد الرئيسي للدراسة الجديدة، إن الفريق استخدم المعيار لاختبار نسخة جديدة من نموذجهم بنتائج "مثيرة للغاية".

ووصل Med-PaLM 2 إلى 86.5% في امتحان USMLE، متفوقا على الإصدار السابق بحوالي 20%، وفقا لدراسة ما قبل الطباعة الصادرة في مايو والتي لم تخضع لمراجعة الأقران.

وقال جيمس دافنبورت، عالم الكمبيوتر في جامعة باث بالمملكة المتحدة، والذي لم يشارك في البحث، إن هناك فرقا كبيرا بين الإجابة على "الأسئلة الطبية والطب الفعلي" الذي يشمل تشخيص وعلاج مشاكل صحية حقيقية.

وقال أنتوني كوهين، خبير الذكاء الاصطناعي في جامعة ليدز بالمملكة المتحدة، إن الهلوسة من المحتمل أن تكون دائما مشكلة مثل هذه النماذج اللغوية الكبيرة، بسبب طبيعتها الإحصائية.

وقال كوهين "ينبغي دائما اعتبار هذه النماذج مساعدة وليست من صناع القرار النهائيين".

وقال سينغال إنه في المستقبل سيمكن استخدام Med-PaLM لدعم الأطباء وتقديم بدائل ربما لم يتم النظر فيها بطريقة أخرى.

وذكرت صحيفة "وول ستريت جورنال" في وقت سابق من هذا الأسبوع أن Med-PaLM 2 يخضع للاختبار في مستشفى Mayo Clinic للأبحاث المرموقة بالولايات المتحدة منذ أبريل.

وقال سينغال إنه لا يستطيع التحدث عن شراكات محددة. لكنه شدد على أن أي اختبار لن يكون "سريريا، أو يواجه المريض، أو قد يتسبب في إلحاق الضرر بالمرضى".

وأضاف أنه سيكون بدلا من ذلك عاملا من أجل "المزيد من المهام الإدارية التي يمكن أتمتتها بسهولة نسبية ومخاطر منخفضة".

المصدر: ساينس ألرت

هذا الموقع يستخدم ملفات تعريف الارتباط .بامكانك قراءة شروط الاستخدام لتفعيل هذه الخاصية اضغط هنا