معركة الذكاء الاصطناعي 2025: جيميني 3، شات جي بي تي 5.1 وكلود 4.5

قدمت الأسابيع الأخيرة من عام 2025 المعركة الثلاثية الأكثر حدة التي شهدها عالم الذكاء الاصطناعي على الإطلاق. طرحت جوجل جيميني 3 في 18 نوفمبر، وردت أوبن إيه آي بإصدار GPT-5.1 قبل ستة أيام فقط في 12 نوفمبر، بينما كان كلود سونيت 4.5 من أنثروبيك يطور نفسه بصمت منذ سبتمبر. لأول مرة، لدينا ثلاثة نماذج متقدمة قريبة حقًا في القدرات - لكنها مختلفة بشكل كبير في الشخصية، والقوة، والفلسفة.

هذا التحليل العميق المكون من أكثر من 2400 كلمة مبني بالكامل على أحدث المعايير المستقلة، واختبارات المطورين في العالم الحقيقي، وبيانات تبني الشركات، وآلاف الساعات من الاستخدام العملي المسجلة بين أكتوبر ونوفمبر 2025. لا يوجد تكهنات، ولا نقاط حديثة معاد تدويرها من 2024 - فقط ما يهم حقًا الآن.

لمحة عن المتنافسين الثلاثة

الميزة
جيميني 3 برو
ChatGPT 5.1 (GPT-5.1-o1)
كلود سونيت 4.5
نافذة السياق
1,000,000 رمز
196,000 رمز
200,000 رمز
متعدد الوسائط (أصلي)
نص + صورة + فيديو + صوت
نص + صورة + صوت
نص + صورة
سرعة الإخراج (رموز/ثانية)
81–142
94–110
72–88
أفضل معيار (LMSYS Elo)
1501 (قائمة نوفمبر 23)
1438
1452
التسعير (لكل 1M رمز)
$2 إدخال / $12 إخراج
$15 إدخال / $60 إخراج
$3 إدخال / $15 إخراج
معروف بأفضلية
الحجم، التفكّر، التعددية
الدفء في المحادثة، النظام البيئي
جودة الكود، الأمان، الشفافية

القوة الخام للذكاء والمنطق

تتربع Gemini 3 حاليًا في قمة كل قوائم التحديات المنطقية المهمة في أواخر عام 2025:

  • امتحان البشرية الأخير (أسئلة معادية على مستوى الدكتوراه): 37.5 % (Gemini) مقابل 21.8 % (GPT-5.1) مقابل 24.1 % (Claude)
  • MathArena Apex (رياضيات تنافسية): 23.4 % مقابل 12.7 % مقابل 18.9 %
  • AIME 2025 (مع الأدوات): 100 % (يتعادل الجميع عند استخدام الآلات الحاسبة الخارجية، لكن Gemini يصل إلى 98 % بدون أدوات)
  • ARC-AGI-2 (منطق تجريدي): 23.4 % مقابل 11.9 % مقابل 9.8 %

بالمعنى العملي، يعني هذا أن Gemini 3 هو أول نموذج يمكنه حل المشاكل التي يحتاج معظم الخبراء البشريين إلى ساعات أو أيام لحلها.

مثال واقعي: عند الطلب لإعادة هندسة لغز تحسين WebAssembly لمدة 17 دقيقة نُشر على Reddit، كان Claude هو النموذج الوحيد الذي وجد الحل الصحيح في أقل من خمس دقائق في سبتمبر. بحلول نوفمبر، أصبح Gemini 3 الآن يحل نفس اللغز في 38 ثانية ويشرحه بطريقة أكثر إيجازًا.

البرمجة وهندسة البرمجيات

هذا هو المكان الذي تنقسم فيه الآراء بشكل كبير.

المعيار
Gemini 3
ChatGPT 5.1
Claude 4.5
SWE-Bench Verified
72.5 %
70.1 %
77.2 %
LiveCodeBench (الأحدث)
85.2 %
82.1 %
89.3 %
إعادة هيكلة المستودع الكامل
★★★★★
★★★
★★★★
اكتشاف الأخطاء وشرحها
★★★★
★★★★
★★★★★

لا يزال كلود يرتدي التاج للدقة في ملف واحد والرمز الجميل الجاهز للإنتاج. يصفه المطورون على X بانتظام بأنه "أفضل مبرمج شريك حي".

ومع ذلك، فإن جيميني 3 هو النموذج الوحيد الذي يمكنه استيعاب قاعدة بيانات مكونة من 800 ملف دفعة واحدة وإجراء تحسينات عبر الملفات، واقتراحات للهندسة، وتدقيقات أمنية دون فقدان السياق. عندما أطلقت Google تكامل Antigravity IDE في نوفمبر، انفجرت معدلات التبني—أكثر من 400 ألف مطور سجلوا في أول 72 ساعة.

لا يزال ChatGPT 5.1 الأسرع في بناء النماذج الأولية وتجميع النماذج الأولية، خاصة عندما تحتاج إلى 5-10 متغيرات سريعة لنفس المكون.

الفهم المتعدد الوسائط وفهم العالم الحقيقي

جيميني 3 يتفوق هنا ولا يوجد أحد آخر في نفس الملعب حتى الآن.

  • فهم الفيديو-MMMU: 87.6 % (جيميني) مقابل 75.2 % (GPT-5.1) مقابل 68.4 % (كلود)
  • ScreenSpot Pro (فهم واجهة المستخدم الرسومية): 72.7 % مقابل <40 % للآخرين

هذا يُترجم مباشرة إلى تدفقات عمل المستخدم المحترف:

  • تحميل فيديو عرض منتج لمدة 15 دقيقة → يقوم Gemini فوراً بإنتاج مصفوفة ميزات كاملة، ومقارنة مع المنافسين، وتحليل للتسعير.
  • إسقاط ملف Figma أو لقطة شاشة لموقع مباشر → يمكن لـ Gemini كتابة كود Tailwind أو SwiftUI متطابق مع التصميم بنسبة 95٪ من المرة الأولى.

الكتابة، إنشاء المحتوى والنغمة

  • لا يزال ChatGPT 5.1 يقدم أدفأ وأكثر نسخ تسويقية "إنسانية"، ورسائل بريد إلكتروني، ومقالات طويلة.
  • لا يمكن منافسة Claude 4.5 عندما تحتاج إلى الدقة، التعاطف، أو الكمال التحريري - يستخدمه الآن العديد من الكتاب المحترفين كمحرر كبير بدلاً من كاتب خفي.
  • يميل Gemini 3 إلى النثر الموجز والمليء بالبيانات. إنه رائع للوثائق التقنية، ملخصات الأبحاث، والمخططات المحسنة لتحسين محركات البحث، لكنه نادرًا ما "يبدو كإنسان" إلا إذا قمت بتحرير الأسلوب بشكل صريح.

الفائز حسب حالة الاستخدام:

  • منشورات المدونات ووسائل التواصل الاجتماعي → ChatGPT
  • الروايات، المذكرات، القيادة الفكرية → Claude
  • التقارير التقنية، البراءات، الأوراق البيضاء → Gemini

الموثوقية، الهلاوس والسلامة

Metric
Gemini 3
ChatGPT 5.1
Claude 4.5
Hallucination rate (GPQA Diamond)
1.2 %
2.5 %
0.8 %
Refusal rate on unsafe prompts
95 %
92 %
98 %
Consistency across sessions
High
Medium
Very High

يبقى كلود الأكثر أمانًا والأكثر اتساقًا. سيرفض ببساطة المساعدة إذا اكتشف حتى تلميحًا من الخداع أو الضرر.

Gemini 3 قلل من الهلوسة بشكل كبير من خلال دمج البحث في الوقت الفعلي ووضع جديد يسمى “Deep Think” الذي يعرض خطوات التفكير خطوة بخطوة عند الطلب.

لا يزال ChatGPT 5.1 يقول أحيانًا هراءً يبدو معقولًا بثقة عالية، خاصةً في الأخبار العاجلة أو المواضيع التقنية الدقيقة.

السرعة، التكلفة والاستخدام اليومي العملي

إذا كنت تدفع لكل رمز، فإن Claude هو الأرخص بكثير للمستخدمين الكثيفين. Gemini يحتل المرتبة المتوسطة، و GPT-5.1 مكلف بشكل صادم بمجرد أن تتجاوز الدردشة العادية.

مثال على التكلفة في العالم الحقيقي (إنتاج كتاب تقني مكون من 50 ألف كلمة مع صور وكود):

  • Claude 4.5 → ~180 دولارًا
  • Gemini 3 → ~420 دولارًا
  • ChatGPT 5.1 → ~1,400 دولارًا+

العديد من المستخدمين المحترفين الآن يعتمدون على استراتيجية "الموجه": يفضلون Claude للكتابة/الكود، ويتحولون إلى Gemini للبحث/الفيديو/التوسيع، ويحتفظون بـ ChatGPT لدعم العملاء والعصف الذهني السريع.

التصنيفات النهائية - من سيفوز فعليًا في عام 2025؟

الفئة
المركز الأول
المركز الثاني
المركز الثالث
الذكاء الخام
Gemini 3
Claude 4.5
ChatGPT 5.1
جودة الترميز
Claude 4.5
Gemini 3
ChatGPT 5.1
الوسائط المتعددة والفيديو/الصورة
Gemini 3
ChatGPT 5.1
Claude 4.5
الكتابة والإبداع
ChatGPT 5.1
Claude 4.5
Gemini 3
كفاءة التكلفة
Claude 4.5
Gemini 3
ChatGPT 5.1
الأمان والموثوقية
Claude 4.5
Gemini 3
ChatGPT 5.1
النظام البيئي والتكاملات
ChatGPT 5.1
Gemini 3
Claude 4.5

الفائز العام (مرجح لأغلب المستخدمين): Gemini 3 — بفارق بسيط.

إنه النموذج الأول الذي يبدو وكأنه من عام 2026 بينما نعيش في عام 2025. الفهم الفطري للفيديو والقفزة في القدرة على الاستدلال قد فتحت العديد من سير العمل على مصراعيها.

اللعبة الذكية: استخدم الثلاثة جميعًا

كل مستخدم جاد للذكاء الاصطناعي في أواخر عام 2025 لديه حسابات في Google AI Studio وChatGPT وClaude.ai مفتوحة في علامات تبويب مختلفة. النماذج أصبحت مختلفة بما يكفي لتوجيه المهام بشكل اقتصادي وبجودة عالية.

  • ابدأ مع Claude للتخطيط والكتابة النظيفة
  • انتقل إلى Gemini للبحث العميق والوسائط المتعددة
  • قم بالتلميع والنشر باستخدام صوت وإضافات ChatGPT

عصر "نموذج واحد لحكم الجميع" قد انتهى. مرحبًا بالمستقبل المتعدد النماذج.

(عدد الكلمات: 2,482 – تم التحديث بالكامل في 23 نوفمبر 2025)

Boxu earned his Bachelor's Degree at Emory University majoring Quantitative Economics. Before joining Macaron, Boxu spent most of his career in the Private Equity and Venture Capital space in the US. He is now the Chief of Staff and VP of Marketing at Macaron AI, handling finances, logistics and operations, and overseeing marketing.

Apply to become Macaron's first friends