عندما تصبح بوكيمون معيارًا: جدلية شفافية تقييم نماذج الذكاء الاصطناعى

لعبة بوكيمون
لعبة بوكيمون
كتبت رنا أمين

في مفارقة لافتة، لم تسلم حتى لعبة بوكيمون الشهيرة من الجدل الدائر حول معايير تقييم نماذج الذكاء الاصطناعي، فقد انتشر الأسبوع الماضي منشور على منصة X بشكل واسع، زاعمًا أن نموذج Gemini من تطوير جوجل تفوق على نموذج Claude من شركة Anthropic في التقدم داخل ثلاثية ألعاب بوكيمون الأصلية.

ووفقًا للمنشور، تمكن Gemini من الوصول إلى مدينة “Lavender Town”، بينما ظل Claude عالقًا في “Mount Moon” منذ أواخر فبراير.

لكن، ما لم يُذكر في المنشور هو أن Gemini كان يملك أفضلية تقنية. فقد أشار عدد من مستخدمي Reddit إلى أن المطور المسؤول عن بث Gemini على منصة Twitch قام بتطوير خريطة مصغّرة مخصصة تساعد النموذج في التعرف على العناصر داخل اللعبة، مثل الأشجار القابلة للقطع. هذه الأداة تقلل من الحاجة لتحليل الصور قبل اتخاذ القرارات، مما يمنح Gemini تفوقًا واضحًا.

ورغم أن استخدام لعبة بوكيمون كمعيار أداء للذكاء الاصطناعي يُعد أمرًا شبه هزلي، إلا أنه يسلط الضوء على نقطة جوهرية: كيفية تنفيذ التقييم يمكن أن تؤثر بشكل كبير على النتائج النهائية.

فعلى سبيل المثال، أعلنت شركة Anthropic عن نتيجتين مختلفتين لنموذج Claude 3.7 Sonnet في اختبار SWE-bench Verified، المصمم لتقييم قدرات النماذج على البرمجة. سجل النموذج دقة بلغت 62.3%، بينما ارتفعت إلى 70.3% عند استخدام هيكل مخصص طورته الشركة.

وفي خطوة مشابهة، قامت شركة Meta مؤخرًا بتعديل نسخة من نموذجها Llama 4 Maverick خصيصًا لتحسين أدائه في معيار LM Arena. واللافت أن النسخة العادية من النموذج سجلت أداءً أقل بكثير في نفس التقييم.

هذه الحالات تكشف عن مشكلة أعمق: معايير التقييم ليست مثالية أصلًا، واستخدام أدوات مخصصة أو غير قياسية قد يزيد من تعقيد المقارنات بين النماذج الجديدة، مما يجعل عملية تقييم الذكاء الاصطناعي أقل شفافية وأكثر جدلية بمرور الوقت.

 

Google News تابع آخر أخبار اليوم السابع على Google News

Trending Plus

اليوم السابع Trending

الأكثر قراءة

"بزعم تحديث البيانات".. التحقيق مع متهم استولى علي بيانات الدفع الإلكتروني للمواطنين

ترتيب الكرة الذهبية بعد السوبر الأوروبي.. محمد صلاح يطارد ثنائي باريس

الطقس اليوم.. شديد الحرارة ورطوبة مرتفعة والعظمى بالقاهرة 38 وأسوان 49

وزير الخارجية السعودي يبحث مع نظيره الهولندي التطورات بقطاع غزة وتداعياتها الإنسانية

البنك الأهلى يخشى اليوم مفاجآت الظهور الأول لحرس الحدود بالدورى


تعرف على الفرق بين اختصاصات مجلسى النواب والشيوخ وفقا للقانون

أسرع قطارات السكة الحديد.. اعرف مواعيد قطار تالجو اليوم الجمعة 15-8-2025

ولي عهد السعودية يبحث مع رئيس الإمارات تعزيز التعاون والقضايا ذات الاهتمام المشترك

جبل شايب البنات قمة "إفرست" البحر الأحمر.. تشاهد من أعلاها شبه جزيرة سيناء ووادى قنا جنوبًا.. وتعتبر من أبرز الوجهات السياحة لتسلق الجبال.. يعد ثالث أعلى القمم فى مصر والسودان ويصل ارتفاعه إلى 2187 مترا.. صور

أشرف زكى يصدر قرارا بمنع الفنانين الحديث عن أزمة بدرية طلبة بأى وسيلة إعلامية


مواعيد قطارات خط القاهرة الإسكندرية والعكس اليوم الجمعة 15- 8 - 2025

مواعيد مباريات اليوم الجمعة 15-8-2025 في ملاعب العالم والقنوات الناقلة

الزمالك يسدد 120 ألف دولار لـ جوميز على 3 أقساط متفاوتة

الأزهر: المسجد الأقصى لن يكون لقمة سائغة والحق سيعود لأهله والباطل إلى زوال

أخبار 24 ساعة.. التعليم: تطبيق أعمال السنة على طلاب الثالث الإعدادى بدءا من 2028

عبد الرحيم دغموم رجل مباراة المصري وطلائع الجيش بالدوري

المصري يواصل ثلاثيات الدوري بالفوز على الطلائع ويحافظ على الصدارة (فيديو)

كاسيميرو: محمد صلاح الأجدر بالكرة الذهبية 2025

رقم قياسي لـ مصر في حضور الجماهير بمونديال ناشئي اليد رغم وداع البطولة.. صور

الشوط الأول.. تقدم ناشئى اليد على إسبانيا 15-13 فى ربع نهائي بطولة العالم.. صور

لا يفوتك


المزيد من Trending Plus
Youm7 Applcation Icons
اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع هواوى