عندما تصبح بوكيمون معيارًا: جدلية شفافية تقييم نماذج الذكاء الاصطناعى

لعبة بوكيمون
لعبة بوكيمون
كتبت رنا أمين

في مفارقة لافتة، لم تسلم حتى لعبة بوكيمون الشهيرة من الجدل الدائر حول معايير تقييم نماذج الذكاء الاصطناعي، فقد انتشر الأسبوع الماضي منشور على منصة X بشكل واسع، زاعمًا أن نموذج Gemini من تطوير جوجل تفوق على نموذج Claude من شركة Anthropic في التقدم داخل ثلاثية ألعاب بوكيمون الأصلية.

ووفقًا للمنشور، تمكن Gemini من الوصول إلى مدينة “Lavender Town”، بينما ظل Claude عالقًا في “Mount Moon” منذ أواخر فبراير.

لكن، ما لم يُذكر في المنشور هو أن Gemini كان يملك أفضلية تقنية. فقد أشار عدد من مستخدمي Reddit إلى أن المطور المسؤول عن بث Gemini على منصة Twitch قام بتطوير خريطة مصغّرة مخصصة تساعد النموذج في التعرف على العناصر داخل اللعبة، مثل الأشجار القابلة للقطع. هذه الأداة تقلل من الحاجة لتحليل الصور قبل اتخاذ القرارات، مما يمنح Gemini تفوقًا واضحًا.

ورغم أن استخدام لعبة بوكيمون كمعيار أداء للذكاء الاصطناعي يُعد أمرًا شبه هزلي، إلا أنه يسلط الضوء على نقطة جوهرية: كيفية تنفيذ التقييم يمكن أن تؤثر بشكل كبير على النتائج النهائية.

فعلى سبيل المثال، أعلنت شركة Anthropic عن نتيجتين مختلفتين لنموذج Claude 3.7 Sonnet في اختبار SWE-bench Verified، المصمم لتقييم قدرات النماذج على البرمجة. سجل النموذج دقة بلغت 62.3%، بينما ارتفعت إلى 70.3% عند استخدام هيكل مخصص طورته الشركة.

وفي خطوة مشابهة، قامت شركة Meta مؤخرًا بتعديل نسخة من نموذجها Llama 4 Maverick خصيصًا لتحسين أدائه في معيار LM Arena. واللافت أن النسخة العادية من النموذج سجلت أداءً أقل بكثير في نفس التقييم.

هذه الحالات تكشف عن مشكلة أعمق: معايير التقييم ليست مثالية أصلًا، واستخدام أدوات مخصصة أو غير قياسية قد يزيد من تعقيد المقارنات بين النماذج الجديدة، مما يجعل عملية تقييم الذكاء الاصطناعي أقل شفافية وأكثر جدلية بمرور الوقت.

 

Google News تابع آخر أخبار اليوم السابع على Google News

Trending Plus

اليوم السابع Trending

الأكثر قراءة

فنيون وعمال وبائعون.. تعرف على 747 فرصة عمل جديدة فى الجيزة

باريس سان جيرمان يتحدى فلامنجو فى نهائى كأس القارات للأندية الليلة

معلومة قانونية.. تعرف على عقوبة دفن جثة بدون تصريح

تفاصيل رقم قياسى للأهلى فى ذكرى التتويج باللقب الأفريقى الثانى

هل يشترط امتلاك توكتوك للتقديم فى منظومة الإحلال والحصول على السيارة الكيوت؟


أتلتيكو مدريد ضيفا على بالياريس فى كأس الملك بحثا عن النجمة الـ11

شبح الوباء يلوح فى أوروبا.. K سلالة إنفلونزا جديدة تنتشر بسرعة.. إغلاق فصول فى إسبانيا وتوجيهات العمل عن بعد فى فرنسا.. وتوصيات بارتداء الكمامات وأهمية التطعيم.. وحكومات تتحرك بحذر خوفا من تكرار كابوس الجائحة

تصعيد أمريكى خطير ضد فنزويلا.. ترامب يعلن حصار كراكاس

كريم سعد مخرج فيلم 4 عُرفى بطولة أحمد فهمى والتصوير الشهر المقبل

مواعيد إجازة نصف العام 2026 لصفوف النقل والثانوية والإعدادية


شبورة وأمطار على عدة مناطق.. تفاصيل طقس اليوم الأربعاء 17-12-2025

شادي محمد: حسام حسن قدم مباراة فنية كبيرة مع المنتخب أمام نيجيريا

أحمد عبد القادر نجم الأهلى يحتفل بزفافه وسط أسرته فى الدقهلية.. فيديو وصور

أمم أفريقيا 2025.. منتخب مصر يفوز على نيجيريا بعد غياب دام 9 سنوات

أهداف مباراة مصر ونيجيريا الودية

منتخب مصر يهزم نيجيريا 2 - 1 فى البروفة الأخيرة قبل أمم أفريقيا.. صور

تعرف على أصوات محمد صلاح وحسام حسن فى جائزة ذا بيست

أسطورة ليفربول يوجه رسالة نارية إلى كاراجر: محمد صلاح لم يخطئ

محامى عروس المنوفية: المتهم أقر فى التحقيقات بتعديه على زوجته حتى الموت

أحمد صلاح وسعيد يعودان للقاهرة بعد فسخ التعاقد مع طائرة السويحلى الليبى

لا يفوتك


المزيد من Trending Plus
Youm7 Applcation Icons
اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع هواوى