عندما تصبح بوكيمون معيارًا: جدلية شفافية تقييم نماذج الذكاء الاصطناعى

لعبة بوكيمون
لعبة بوكيمون
كتبت رنا أمين

في مفارقة لافتة، لم تسلم حتى لعبة بوكيمون الشهيرة من الجدل الدائر حول معايير تقييم نماذج الذكاء الاصطناعي، فقد انتشر الأسبوع الماضي منشور على منصة X بشكل واسع، زاعمًا أن نموذج Gemini من تطوير جوجل تفوق على نموذج Claude من شركة Anthropic في التقدم داخل ثلاثية ألعاب بوكيمون الأصلية.

ووفقًا للمنشور، تمكن Gemini من الوصول إلى مدينة “Lavender Town”، بينما ظل Claude عالقًا في “Mount Moon” منذ أواخر فبراير.

لكن، ما لم يُذكر في المنشور هو أن Gemini كان يملك أفضلية تقنية. فقد أشار عدد من مستخدمي Reddit إلى أن المطور المسؤول عن بث Gemini على منصة Twitch قام بتطوير خريطة مصغّرة مخصصة تساعد النموذج في التعرف على العناصر داخل اللعبة، مثل الأشجار القابلة للقطع. هذه الأداة تقلل من الحاجة لتحليل الصور قبل اتخاذ القرارات، مما يمنح Gemini تفوقًا واضحًا.

ورغم أن استخدام لعبة بوكيمون كمعيار أداء للذكاء الاصطناعي يُعد أمرًا شبه هزلي، إلا أنه يسلط الضوء على نقطة جوهرية: كيفية تنفيذ التقييم يمكن أن تؤثر بشكل كبير على النتائج النهائية.

فعلى سبيل المثال، أعلنت شركة Anthropic عن نتيجتين مختلفتين لنموذج Claude 3.7 Sonnet في اختبار SWE-bench Verified، المصمم لتقييم قدرات النماذج على البرمجة. سجل النموذج دقة بلغت 62.3%، بينما ارتفعت إلى 70.3% عند استخدام هيكل مخصص طورته الشركة.

وفي خطوة مشابهة، قامت شركة Meta مؤخرًا بتعديل نسخة من نموذجها Llama 4 Maverick خصيصًا لتحسين أدائه في معيار LM Arena. واللافت أن النسخة العادية من النموذج سجلت أداءً أقل بكثير في نفس التقييم.

هذه الحالات تكشف عن مشكلة أعمق: معايير التقييم ليست مثالية أصلًا، واستخدام أدوات مخصصة أو غير قياسية قد يزيد من تعقيد المقارنات بين النماذج الجديدة، مما يجعل عملية تقييم الذكاء الاصطناعي أقل شفافية وأكثر جدلية بمرور الوقت.

 

Trending Plus

اليوم السابع Trending

الأكثر قراءة

النيابة تستمع لأقوال أحمد السقا فى اتهامه بالتعدى على طليقته مها الصغير

حقن مضادة للشيخوخة ولعب اليوجا.. تعرف على سبب وفاة شيفالي جاريوالا

كايروكي يحيي حفل استاد القاهرة بحضور أكثر من 60 ألفًا ورسائل داعمة لفلسطين

وائل كفوري يطرح أحدث أغانيه بعنوان "بدي غير فيكي العالم"

موعد ظهور نتيجة الدبلومات الفنية 2025.. تعرف على التفاصيل


روبيو يندد بالدعوات الإيرانية لاعتقال وإعدام مدير الوكالة الدولية للطاقة الذرية

الأهلي ينتظر عودة رضا سليم من المغرب لحسم قرار الإعارة

محمد صلاح يتفوق على مبابي ورافينيا فى سباق أفضل لاعبي العالم 2025

أزمة تمويل حرب إيران وغزة تفجر خلافا بين وزارتى الدفاع والمالية فى إسرائيل

الأهلي يستجيب لمحمد شكري ويُنهي إجراءات شرائه من سيراميكا بعد رفض الإعارة


الزمالك يمنح شيكابالا حرية تحديد مصيره.. واللاعب يدرس الاعتزال لهذا السبب

عفو رئاسى عن باقى العقوبة لبعض المحكوم عليهم بمناسبة الاحتفال بثورة 30 يونيو

قصر العينى: أول جهاز تنفس صناعى مصرى بالكامل "EZVent" أثبت كفاءة فى النتائج

بعد أنباء رحيله.. أرقام مصطفى شلبي مع الزمالك

الأهلي يتسلم 8 ملايين دولار من فيفا ويترقب رد الضرائب الأمريكية فى باقي المستحقات

تنسيق الثانوى العام بالقاهرة 2025.. اعرف التوقعات بعد إعلان نتيجة الإعدادية

مواعيد مباريات اليوم.. سان جيرمان أمام إنتر ميامي وفلامينجو ضد البايرن بمونديال الأندية

عيد ميلاد فريدة فهمي.. رحلة "فراشة الاستعراض" التي أبهَرت العالم

الطقس اليوم.. ارتفاع بدرجات الحرارة والعظمى بالقاهرة 37 درجة والإسكندرية 31

ملخص وأهداف مباراة بنفيكا ضد تشيلسي في ثمن نهائي كأس العالم للأندية

لا يفوتك


المزيد من Trending Plus
Youm7 Applcation Icons
اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع اليوم السابع هواوى