بورصة النماذج الذكية.. جيمناي يكتسح وتشات جي بي تي يتراجع 

 

أزعم أني لم أناقش أحدا في برنامج الذكاء الاصطناعي الذي يستخدمه في عمله إلا وكانت الإجابة واحدة: جيمناي التابع لجوجل هو الأول. 

قبل عام واحد فقط لم يكن أغلبنا يعرف سوى تشات جي بي تي التابع لشركة OpenAI  التي كانت قائدة لطفرة الذكاء الاصطناعي التوليدي. 

في سبيل الحديث عن الذكاء الاصطناعي لنشرة قيود استعنت بمنصة LMArena أهم مختبر تقني محايد في العالم، وهي منصة انطلقت بدعم من جامعة كاليفورنيا، بركلي، وأصبحت “بورصة” عالمية تحدد قيم ومكانة النماذج اللغوية الكبيرة. 

الذكاء الاصطناعي يخضع للاختبار البشري 

وتعتمد على آلية تعرف بـ “المبارزة العمياء”، حيث تضع المستخدم في مقعد الحكم، وتطرح عليه سؤالا واحدا على نموذجين مجهولين، ليقارن بين إجاباتهما دون معرفة مسبقة بهوية المطور، لضمان تجريد التقييم من أي انحياز للعلامات التجارية الكبرى مثل OpenAI أو Google. 

تجمع المنصة ملايين التقييمات البشرية، وتوفر جدول ترتيب يحدث باستمرار، ويعتبر اليوم المرجع الأول للمستثمرين والمطورين لمعرفة من يتربع حقاً على عرش الذكاء الاصطناعي في مجالات البرمجة، الكتابة الإبداعية، والمنطق الرياضي. 

تقودنا بيانات منصة حلبة دردشة الذكاء الاصطناعي المحدثة بتاريخ ديسمبر 2025 إلى مشهد جديد، حيث نشهد صراعا محتدما بين العمالقة: جوجل، أنثروبيك، وشركة إكس أي آي المملوكة لإيلون ماسك. 

جيمناي في الصدارة.. لا عجب 

تظهر النتائج تربع نموذج جيمناي 3 برو من جوجل على عرش الترتيب العام، مؤكدا تفوقه في تقديم استجابات دقيقة وشاملة. 

 في المقابل، حققت شركة إكس أي آي قفزة نوعية بنموذجها جروك 4.1، الذي حل في المركز الثالث عالميا، متفوقا في وضعية التفكير العميق على العديد من المنافسين التقليديين. 

وفي التفاصيل جاءت قائمة الخمسة الأوائل في الترتيب العام بناء على التقييم الإجمالي للمنصة، كالتالي: 

  1. جيمناي 3 برو (جوجل). 
  1. جيمناي 3 فلاش (جوجل). 
  1. جروك 4.1 للتفكير (إكس أي آي). 
  1. كلود أوبوس 4.5 (أنثروبيك). 

بينما جاء تشات جي بي تي 5.1 في المركز الثامن 

 

4 معايير يتقاسم صدارتها جيمناي وكلود 

في المعايير تقيس المنصة عدد من المعايير منها الخبرة التي تقيس قدرة النموذج على التعامل مع مواضيع تخصصية دقيقة ومعقدة، وجاء في المركز الأول كلود أوبوس 4.5 يليه جيمناي 3 برو. 

في معيار المهام الصعبة الذي يركز على الأوامر البرمجية أو اللغوية التي تتطلب استدلالا منطقيا طويلا كان الأول جيمناي 3 برو، يليه كلود أوبوس 4.5 . 

أما في معيار البرمجة حيث يتم اختبار دقة الأكواد وقدرة النموذج على اكتشاف الأخطاء فكان الأول كلود أوبوس 4.5 يليه جيمناي 3 برو. 

وجاء شات جي بي تي 5.2 المتقدم من شركة أوبن أي آي في المركز الأول في  معيار الرياضيات الذي يقيس القدرة على حل المسائل الحسابية والهندسية المعقدة، يليه جيمناي 3 برو. 

جيمناي الأول في النصوص والبحث 

أما في مهام النصوص وتطوير الويب، فكانت الصدارة من نصيب جيمناي، بينما تسيطر أنثروبيك على مجال تطوير الويب بنموذج كلود أوبوس 4.5، وفي الوسائط وتوليد الصور اكتسحت نماذج جوجل بإصدارتها المختلفة المراكز الأولى. 

تصدر نموذج شات جي بي تي قائمة تحويل النص إلى صورة، إضافة إلى تحرير الصور، في حين وكما هو متوقع تسيد جيمناي قائمة البحث الذكي نظرا لدمجه مع محرك بحث جوجل، مع بروز جروك في البحث المعتمد على البيانات اللحظية. 

 

ماذا ينتظرنا كبشر ؟ 

خبراء في الذكاء الاصطناعي تحدثوا يؤكدون أن عام 2026 هو عام النماذج التي تفكر قبل الإجابة، مما يقلل الهلوسة الرقمية ويجعلها قادرة على حل مشكلات معقدة كانت مستحيلة سابقا. 

لكن هذا الذكاء لا يخلو من العيوب القاسية علينا كبشر، هو أكثر رأسمالية من آدم سميث نفسه! النموذج الاقتصادي الجديد نراه مثلا بشركة كلارنا للتكنولوجيا المالية التي خفضت عدد موظفيها من 5500 إلى 2900 بينما ارتفعت أرباحها لكل موظف بمقدار 4 أضعاف بفضل الاعتماد الكلي على الذكاء الاصطناعي. 

 مؤسسة جارتنر المتخصصة في تحليل معلومات الأعمال والتقنيات الحديثة توقعت حدوث فوضى وظائف بين عامي 2028 و2029، حيث ستحتاج كل الشركات لإعادة هيكلة شاملة للبقاء. 

وهذا كل شيء!  

Scroll Circle Indicator
0%

أحدث المقالات

أعلى المقالات

كتب بقلم

وسوم ذات صلة

شارك هذا المحتوى

سجل في نشرة قيود البريدية!