عندما بدأت بمقارنة GLM-4.7، الذي أُصدر يوم 21 ديسمبر 2025 بواسطة Z.AI، مع Claude Sonnet 4.5 من Anthropic، توقعت أن أجد سيناريو "كلاهما جيد" المعتاد. بدلاً من ذلك، اكتشفت شيئًا مختلفًا جوهريًا في كيفية تعامل نماذج الذكاء الاصطناعي مع التصميم البصري - وهو ما يسميه المجتمع الآن "ترميز الأجواء".

ما اختبرته بالفعل

باستخدام نفس الطلب - "صمم صفحة هبوط أنيقة لتطبيق إنتاجية بأسلوب Notion. اجعلها تبدو فاخرة ونظيفة وقليلاً مازحة" - قدمت كلا النموذجين بنفس القيود والتوقيت. كشفت النتائج عن تباين مثير للاهتمام يتجاوز جودة الكود الخام.

قدمت GLM-4.7 ما أسميه جمالية "Dribbble في 2025" من المحاولة الأولى. أما Claude Sonnet 4.5 فقد أنتج كودًا تقنيًا سليمًا، لكن المظهر البصري بدا قديمًا - مثل درس Tailwind منفذ بشكل جيد من عام 2019. ليس خطأً، لكنه... غير مناسب.

فهم ترميز الأجواء: لماذا هو مهم لتطوير الواجهة الأمامية

يركز ترميز الأجواء على وصف الشعور أو النتيجة المرغوبة للتصميم، مما يتيح للذكاء الاصطناعي اقتراح حلول بصرية بدلاً من تحديد كل عنصر يدويًا. من الناحية العملية لـ GLM-4.7 مقابل Claude Sonnet 4.5، يعني هذا:

المعايير الحقيقية للاختبار

بدلاً من تقييم "HTML/CSS الصحيح" فقط، قمت بتقييم:

  • استخدام المسافات البيضاء ومساحة التنفس
  • الثقة في الطباعة (هل تبدو مختارة بشكل احترافي؟)
  • ملاءمة عام 2025 (هل سيشعر هذا بالتجدد في تطبيق حقيقي؟)
  • عامل الجاهزية للعميل (هل سأعرض هذا بدون اعتذار؟)

تعاملت مع كلا النموذجين كمصممي مطورين مبتدئين وظفتهم ليوم واحد، ووفرت لهم:

  • إرشادات تنسيق بسيطة
  • صفات العلامة التجارية ("هادئ، فاخر، ودود")
  • قوائم مكونات تقريبية

ثم لاحظت كيف يملؤون الفجوات.

اختبار الأداء وجهاً لوجه

الجولة 1: الشعور الخام لواجهة المستخدم (قيود قليلة)

باختبار ثلاثة سيناريوهات رئيسية — صفحات هبوط SaaS، لوحات تحليلات، وعروض تقديمية — قمت بتقييم كل منها على مقياس "جاهزية العميل" من 1-10:

متوسط GLM-4.7: 8/10

  • استخدم مسافات حديثة باستمرار مع حشوة سخية
  • اختار لوحات ألوان معقولة دون تحديدات سداسية محددة
  • افتراضيًا على تخطيطات تتناسب مع منتجات SaaS الحالية

متوسط Claude Sonnet 4.5: 6/10

  • العناصر متجمعة بشكل محكم للغاية
  • استخدام مفرط في بعض الأحيان للتدرجات والظلال
  • أنماط الأقسام العامة تفتقر إلى الشخصية

قدرة GLM-4.7 على "ترميز الشعور" تحسن بشكل كبير من جودة واجهة المستخدم، مما ينتج صفحات ويب أنظف وأكثر حداثة بدقة تخطيط أفضل.

لماذا تشعر واجهات المستخدم التي يتم إنشاؤها بواسطة الذكاء الاصطناعي بأنها عامة في كثير من الأحيان

كلا النموذجين هما آلات نمطية مدربة على بيانات ويب واسعة. عندما تكون المطالبات غامضة، فإنها تعتمد على الأنماط الأكثر شيوعًا التي واجهوها. هذا يفسر لماذا العديد من واجهات المستخدم للذكاء الاصطناعي:

  • كرر نفس التخطيطات الثلاثة
  • استخدم مسافات آمنة ومستهلكة
  • تشعر وكأنها نسخ من نسخ

أظهر GLM-4.7 أولويات داخلية أقوى للأنماط التصميمية الحالية. عندما حددت "لوحة معلومات حديثة، بسيطة، بشعور مؤسسي،" استخدم بشكل طبيعي:

  • تخطيطات مقسمة بتسلسل بصري واضح
  • اختيار ألوان مميزة غير مبتذلة
  • احترام نسب الطباعة بشكل أفضل افتراضيًا

تطابق كلود سونيت هذه الجودة فقط بعد توجيهات مفصلة بأسلوب المصمم مثل:

  • "زيادة التباعد الرأسي بحوالي 20% في قسم البطل"
  • "تقليل التدرجات، استخدام ألوان صلبة مع شفافية خفيفة"
  • "استخدام وزنين فقط للطباعة: عادي ونصف غامق"

فلسفة النموذج والنهج

GLM-4.7: المصمم البصري الجريء

GLM-4.7 هو النموذج الرائد لـ Z.AI بقدرات برمجية معززة واستدلال متعدد الخطوات مستقر، ويتميز بنافذة سياق 200K. أظهر في اختباري:

خصائص موجهة نحو التصميم:

  • استدلال افتراضي قوي (الألوان، التباعد، نسب الخطوط)
  • هياكل فئة أنظف (خاصة مع Tailwind)
  • يأخذ "الحديث" و"الفاخر" حرفيًا

مقاييس الأداء:

  • أكمل صفحة هبوط Tailwind مكونة من 700 سطر في حوالي 11 ثانية
  • تطلب 25-30% تعديلات يدوية أقل للوصول إلى حالة "جاهز للعميل"
  • حقق 73.8% في SWE-bench Verified (+5.8% مقارنة بـ GLM-4.6)

كلود سونيت 4.5: المتعاون المتفكر

كلود سونيت 4.5 هو أفضل نموذج برمجة في العالم لبناء الوكلاء المعقدين، ويظهر تحسينات كبيرة في التفكير والرياضيات. يتفوق في:

نهج منظم:

  • التفكير في مسؤوليات المكونات
  • شرح قرارات التخطيط
  • الحفاظ على التناسق عبر الجلسات متعددة الأدوار

أين يتألق:

  • الفرق التي لديها أنظمة تصميم موجودة
  • البقاء ضمن خطوط العلامة التجارية
  • صيانة الكود على المدى الطويل

كلود يعتمد على خيارات تصميم آمنة مثل خطوط Inter وتدرجات اللون البنفسجي دون توجيه، على الرغم من أنه يمكن توجيهه بشكل كبير بالتوجيه السليم.

اختبار في العالم الحقيقي: مقارنات جنبًا إلى جنب

الاختبار 1: إنشاء صفحة هبوط

الإرشاد: "إنشاء صفحة هبوط React + Tailwind لتحليلات الذكاء الاصطناعي B2B. تتضمن البطل، دليل اجتماعي، ميزات، تسعير، وأسئلة شائعة. حديثة، متميزة، تركز على الثقة. تجنب التدرجات المبتذلة."

نتائج GLM-4.7:

  • تخطيط بطل نص يسار، رسم بياني يمين قوي
  • بطاقات تسعير مكدسة بشكل جيد مع تسليط الضوء على "الأكثر شعبية"
  • دليل اجتماعي يشعر بالأصالة (شريط شعارات + نص مصداقية)
  • فئات Tailwind مطولة ولكن مجمعة بشكل منطقي
  • الوقت للوصول إلى MVP: ~15 دقيقة من التعديلات

نتائج كلود سونيت 4.5:

  • هيكليًا سليم ولكن يشبه القالب
  • أكثر من التدرجات المطلوبة (احتاج إلى متابعتين)
  • قسم التسعير يفتقر إلى التركيز الواضح على الخطط
  • الوقت للوصول إلى MVP: ~25-30 دقيقة من التعديلات

الاختبار 2: مكون لوحة القيادة React

الموجه: "إنشاء لوحة قيادة React: تنقل الشريط الجانبي الأيسر، رأس علوي، تحليلات رئيسية مع 3 بطاقات ومخطط. بسيط، للمؤسسات. استخدم وحدات CSS."

هنا النتائج تميل قليلاً:

GLM-4.7:

  • تسلسل مرئي قوي من البداية
  • تباعد ممتاز بين البطاقات
  • وحدات CSS شعرت وكأنها أدوات (مثل Tailwind في الروح)

Claude Sonnet 4.5:

  • فصل مكونات أكثر تحفظًا ولكن نظيف جدًا
  • وحدات CSS دلالية: .sidebar، .header، .summaryGrid
  • أسهل في صيانة الفريق على المدى الطويل

الحكم: البناة الفرديون يفضلون التحسين الفوري لـ GLM-4.7؛ الفرق تقدر قابلية الصيانة لـ Sonnet.

الاختبار 3: عرض شرائح تقديمي

الموجه: "إنشاء HTML/CSS لعرض تقديمي مكون من 10 شرائح للتسويق: العنوان، المشكلة، الحل، الميزات، الشهادات، التسعير، الدعوة إلى الإجراء. بسيط، 16:9، طباعة كبيرة."

هذا الاختبار أظهر بوضوح اختلاف الأجواء:

  • GLM-4.7: تخطيطات تشبه قوالب Keynote الحديثة—نوع كبير، مساحة بيضاء ممتازة، إيقاع بصري واضح (التقييم: 7.5/10)
  • Claude Sonnet 4.5: أقرب إلى قوالب Google Slides اللائقة، قابلة للاستخدام ولكن سأفتح Figma بعد ذلك (التقييم: 5.5/10)

ما وراء الجماليات: تحليل جودة الكود

معالجة التصميم المستجيب

الاختبار الإجهادي مع "اجعل هذا يعمل على هاتف محمول بعرض 375 بكسل وسطح مكتب بعرض 1440 بكسل بدون تمرير أفقي":

  • GLM-4.7: سلوك أفضل يركز على الجوال، باستخدام فئات Tailwind المتجاوبة (md:, lg:) بشكل طبيعي وصحيح بنسبة 80-85٪ من الوقت
  • Claude Sonnet 4.5: أكثر حذراً، وأحياناً يتم استخدام النقاط الفاصلة بشكل أقل، ويتطلب متابعات صريحة

عند التصحيح، حافظ Sonnet على الأنماط بشكل موثوق عبر المطالبات اللاحقة—وهو أمر حاسم للعمليات الطويلة.

إمكانية الوصول (a11y)

اختبار مستويات العناوين الصحيحة، تسميات ARIA، وتباين الألوان:

  • Claude Sonnet 4.5 كان أكثر تفصيلاً بشأن قرارات إمكانية الوصول، وغالباً ما يضيف أدوار ARIA استباقياً
  • GLM-4.7: امتثل عند الطلب ولكنه قدم تفاصيل أقل

إذا كانت إمكانية الوصول غير قابلة للتفاوض، فإن Claude Sonnet 4.5 يتمتع بميزة بسيطة كشريك "يقوم بالشيء الصحيح افتراضياً".

هيكلية المكونات

طلب "مكونات React نظيفة وقابلة لإعادة الاستخدام":

  • GLM-4.7: جيد في إنشاء مكونات عرض مع الخصائص، وأحياناً يتم التجريد بشكل مفرط في البداية
  • Claude Sonnet 4.5: قوي في تسمية وطبقات المكونات، خاصة مع ذكر نظام التصميم

بالنسبة للواجهات الأمامية طويلة المدى، شعرنا أن قاعدة Sonnet البرمجية أكثر قابلية للصيانة. بالنسبة لـ "الحاجة إلى نقطة انطلاق قوية اليوم"، فاز GLM-4.7 على الوقت لتحقيق مخرجات جيدة.

تحسين متعدد الدورات وإدارة السياق

التعامل مع "اجعله أكثر حداثة"

هذا التعليم الغامض عمدًا كشف عن تفسيرات مختلفة:

GLM-4.7 (نسبة نجاح 70٪):

  • زيادة التباعد قليلاً
  • تنعيم الحدود والزوايا
  • تحسين حالات الأزرار (متغيرات الشبح/الإطار)
  • التعديل نحو الرمادي المحايد + لون مميز واحد

Claude Sonnet 4.5:

  • تم تقديم التدرجات أو الظلال
  • تم تعديل أوزان الطباعة
  • تطلب توضيح أكثر تحديدًا

بمجرد أن أوضحت ("بمعنى الحداثة أعني سطحية أكثر، وزخارف أقل، ومساحة بيضاء أكثر"), اتبع سونيت هذا التعريف تقريبًا بشكل مثالي في التكرارات اللاحقة.

ذاكرة الجلسات الطويلة (مشاريع 6-8 دورات)

  • GLM-4.7: سياق قصير المدى رائع داخل الجلسات الفردية، تراجع عرضي بعد تغييرات هيكلية كبيرة
  • Claude Sonnet 4.5: أفضل قليلاً في الحفاظ على مسارات المحادثة الطويلة ومبادئ التصميم

تم تصميم Claude Sonnet 4.5 للاستقرار القوي في التفكير والتنفيذ المتوقع في المنطق متعدد الملفات وأنظمة الخلفية.

الكفاءة من حيث التكلفة لأعمال UI المكثفة

اختبار أعباء العمل النموذجية لمنشئي المحتوى المستقلين (3-5 صفحات هبوط، 1 لوحة معلومات، 1 عرض تقديمي) بلغ متوسطها 25-35 ألف رمز لكل مشروع:

  • GLM-4.7: أنتج مخرجات كود أقصر قليلاً وأكثر مباشرة (استخدام رموز أقل بنسبة ~10-15%)
  • Claude Sonnet 4.5: يبدأ التسعير من 3 دولارات لكل مليون رمز إدخال و15 دولارًا لكل مليون رمز إخراج، مع تفسيرات مفصلة ولكنها مفيدة

بالنسبة لأعمال UI المكثفة بميزانيات محدودة، يمكن أن تكون تلك الكفاءة بنسبة 10-15% هي الفارق بين التكرار غير المحدود والتوقف مبكرًا.

متى تستخدم كل نموذج

اختر GLM-4.7 عندما تحتاج إلى:

✅ نقاط انطلاق سريعة وذات طابع مفعم بالحيوية لصفحات الهبوط، ولوحات المعلومات، وتخطيطات الشرائح

✅ جماليات حديثة الآن على بنية المكونات النظيفة

✅ سير عمل لمنشئي المحتوى المستقلين يشحن دون أن يبدو كقوالب افتراضية

✅ كفاءة تكلفة أفضل في إنشاء واجهات المستخدم بكميات كبيرة

الأفضل لـ: صفحات الهبوط لخدمات SaaS، لوحات التحكم البسيطة، واجهات المستخدم بأسلوب العروض التقديمية

يحتل GLM-4.7 المرتبة الأولى بين النماذج مفتوحة المصدر على Code Arena مع ملايين المستخدمين العالميين في الاختبارات العمياء.

اختر Claude Sonnet 4.5 عندما تحتاج:

✅ أنظمة تصميم قائمة مع إرشادات العلامة التجارية للالتزام بها

✅ قابلية تفسير عميقة وسهولة الوصول بشكل افتراضي

✅ تطبيقات متعددة الصفحات معقدة حيث تهم حدود المكونات

✅ مهندس مبتدئ مدروس مع عادات جيدة على المدى الطويل

الأفضل لـ: تطبيقات الإنتاج، بيئات العمل الجماعية، إعادة الهيكلة المعقدة

يعتبر Claude Sonnet 4.5 الأحدث على SWE-bench Verified ويتصدر OSWorld بنسبة 61.4% في مهام استخدام الحاسوب.

النهج الهجين: أفضل ما في العالمين

لبناة العمل الفردي، نصيحتي الصادقة بعد اختبارات مكثفة:

  1. استخدم GLM-4.7 لتخطيط الهيكل العام والأقسام والنمط العام
  2. قم بتسليمها إلى Claude Sonnet 4.5 لإعادة هيكلة المكونات، تحسين سهولة الوصول، وتنظيف الهيكل

هذا الجمع جعلني أقرب إلى "لم أستخدم Figma بالكاد هذا الأسبوع ولاتزال شحنت واجهات مستخدم أنا فخور بها."

هذا النموذج الهجين هو أيضًا كيف نبني الأشياء في Macaron. ننشئ تطبيقات مصغرة كل يوم — من متتبعات السعرات الحرارية إلى مخططي السفر — وشيء واحد أصبح واضحًا بسرعة: التطبيق الذي يعمل ولكنه يبدو غير متناسق لا يزال يشعر المستخدمين بأنه مكسور.

لهذا السبب نحن نهتم بطبقة التصميم بقدر اهتمامنا بطبقة النموذج، ونعامل "النمط" كقيد رئيسي، وليس مجرد ميزة إضافية.

إذا كنت فضوليًا بشأن كيف يبدو ذلك في التطبيقات المصغرة الفعلية، فإن Macaron مكان جيد لإلقاء نظرة.

إذا كنت تختار واحدًا فقط: بالنسبة للمبدعين المستقلين والمسوقين الذين يعملون بكثافة في المتصفحات، فإن GLM-4.7 مقابل Claude Sonnet 4.5 يميل نحو GLM-4.7 للواجهات الأمامية - إلا إذا كان ألمك الرئيسي هو القابلية للصيانة طويلة الأجل، حيث لا يزال Sonnet يستحق مكانه.

مستقبل ترميز الفايب

يرفع تصميم الفايب مستوى جودة التصميم ويحرر المصممين للتعامل مع تحديات التجربة الأكثر تعقيدًا، مما يجعل كل عضو في فريق المنتج قادرًا على دمج التفكير في تجربة المستخدم.

يمثل ظهور ترميز الفايب تحولًا جذريًا في كيفية تعاملنا مع تطوير واجهات المستخدم. بدلاً من البدء بمحررات الكود الفارغة، يمكن للمصممين الآن وصف ما يريدون والحصول على مواقع ويب وظيفية من خلال أدوات مدعومة بالذكاء الاصطناعي.

التوصية النهائية

لا تكتفي بقراءة المعايير والمواصفات. ارمِ بأغرب موجز لصفحة هبوطك في كلا النموذجين، وشاهد أيهما يشعر أنه أقرب إلى ذوقك، وابنِ مجموعة ترميز الفايب الخاصة بك من هناك.

الثورة ليست حول أي نموذج هو "الأفضل" - بل حول مطابقة الأداة الصحيحة مع سير العمل الخاص بك والجدول الزمني والمعايير الجمالية.


النقاط الرئيسية

  • يركز ترميز الفايب على الشعور التصميمي بدلاً من المواصفات التقنية
  • يتميز GLM-4.7 بالجماليات الحديثة والسرعة للوصول إلى السوق
  • يفوز Claude Sonnet 4.5 في القابلية للصيانة والبنية
  • النهج الهجين يستفيد من نقاط القوة في كلا النموذجين
  • الكفاءة في التكلفة مهمة للعمل في واجهات المستخدم بكميات كبيرة

موارد موثوقة


المقالة مبنية على اختبارات عملية أجريت في ديسمبر 2025. قدرات النموذج وأسعاره قد تتغير. دائماً تحقق من المواصفات الحالية قبل التنفيذ.

Nora is the Head of Growth at Macaron. Over the past two years, she has focused on AI product growth, successfully leading multiple products from 0 to 1. She possesses extensive experience in growth strategies.

Apply to become Macaron's first friends