GLM-4.7 ကို လက်တွေ့အသုံးပြုရာမှာ (မီဒီယာထုတ်ပြန်ချက်တွေနဲ့မဟုတ်ဘဲ) စတင်စဉ်းစားတဲ့အခါ "နောက်ထပ် နယ်စပ်မော်ဒယ် တိုးတက်မှု" ဆိုတာမျိုးကို မျှော်လင့်ခဲ့ပါတယ်။ နည်းနည်းသာ မြင့်မားလာတဲ့ စံပြများ၊ အကြောင်းပြချက်များအကြောင်းအရင့်အပြင့် ပြောဆိုမှုများ၊ အခြားတော့ မျှော်လင့်စရာမရှိပါဘူး။
အဲဒါ… ဖြစ်မလာပါဘူး။
GLM-4.7 ကို ကုဒ်ရေးခြင်း၊ အစီရင်ခံစာရှည်များ အထောက်အထားပြုခြင်းနှင့် အေးဂျင့်ပုံစံ အလုပ်စဉ်များအတွက် တစ်ပတ်ကြာ စမ်းသပ်ပြီးနောက်မှာတော့ ကျွန်တော့်ရဲ့ ပုံမှန်ကိရိယာ အချို့ကို ပြန်စီမံလိုက်ရပါတယ်။ ဒီမော်ဒယ်က အထူးသဖြင့် 200K အကြောင်းအရာ ဝင်းဒိုး၊ လေးနက်သော ကုဒ်ရေးနိုင်စွမ်း၊ 358B ပါရာမီတာများပါဝင်တဲ့ အလေးချိန်ဖွင့်ထားမှုနဲ့ အထူးသီးသန့်နေရာတစ်ခုမှာ ရှိနေပါတယ်၊ ငါ 2025 မှာ ဒီလိုစာကြောင်းရေးမယ်လို့ မထင်ခဲ့ပါဘူး။
GLM-4.7 ဆိုတာဘာလဲ၊ ဘယ်လိုပြုမူတယ်၊ ဖန်တီးသူ/အန္တရာယ်ကင်းစွာ ဖွံ့ဖြိုးသူ အလုပ်စဉ်တစ်ခုထဲမှာ လက်တွေ့ကျစွာ ဘယ်လိုတည်ရှိနိုင်တယ်ဆိုတာကို လမ်းညွှန်ပေးပါဦး။
အကျဉ်းချုပ်: သင့်အနားတွင် အကြီးမားဆုံး အကြောင်းအရာနှင့် ဖွင့်လှစ်ထားသော အလေးချိန် လွယ်ကူမှုရှိသော တိုးတက်သော အကြောင်းအရာ လိုအပ်ပါက, Zhipu AI မှ GLM-4.7 သည် ပေးဆောင်ပါသည်။ ကုဒ်ရေးခြင်း အစီအစဉ်အတွက် $3/လ ဖြစ်သည်, 2025 ဇန္နဝါရီတွင် AI ကိရိယာများအတွက် အကောင်းဆုံး တန်ဖိုးထက် တစ်ခု ဖြစ်ပါသည်။
သင် GLM-4, GLM-4-Air, သို့မဟုတ် GLM-4.6 သုံးဖူးကြပါက, GLM-4.7 သည် Zhipu ၏ "ယခုမှ စတင်ပြီ" ထုတ်ပြန်မှု ဖြစ်ပါသည်။ စဉ်းစားကြည့်ပါ: အဆင့်မြင့် အကြောင်းအရာ + အကြီးမားသော အကြောင်းအရာ + ဖွင့်လှစ်ထားသော အလေးချိန်, ထုတ်လုပ်မှု API များနှင့် စွမ်းအားရှင် အသုံးပြုသူများကို ရည်ရွယ်ထားသည်။
Zhipu quietly rolled GLM-4.7 out in late 2024, then started pushing it harder in early 2025 as their new flagship for coding and reasoning. By the time I got to it for testing, the official documentation already referenced it as the default high-end GLM model.
You'll usually see it exposed as glm-4.7 in the Zhipu API, and as a 358B open-weights release on Hugging Face for self-hosting.
Here's how I'd summarize the GLM-4.7 model positioning after actually using it:
Tier: Frontier-level, general-purpose LLM Focus: Coding, complex reasoning, and long-context tasks Audience: Teams that want strong coding help and long-document workflows, indie devs who like open weights, researchers
In Zhipu's own ecosystem, GLM-4.7 is pitched as their best coding and reasoning model, backed by benchmark wins on SWE-bench (73.8) and HLE (42.8). In the real world, that roughly maps to: this is the one you pick when you care more about quality than raw cost per token.
The biggest "oh wow, they actually did it" moment for me was this: GLM-4.7's 358B-parameter version is available as open weights.
You can:
ကျွန်တော်စမ်းသပ်မှုတွေမှာ၊ အဲဒီဖွင့်လှစ်ထားတဲ့အလေးချိန်ထောင့်က တစ်ဦးချင်းဖန်တီးသူတွေအတွက်တော့ အနည်းငယ်လော့တယ် (သင့်ရဲ့ API ကိုအသုံးပြုနေတာဖြစ်နိုင်ပါတယ်)၊ ဒါပေမယ့် ဒေတာထိန်းချုပ်မှုလိုအပ်တဲ့အဖွဲ့တွေ သို့မဟုတ် အထူးပြုအတွင်းပိုင်းကူညီသူတွေကို တည်ဆောက်ချင်တဲ့အဖွဲ့တွေမှာတော့ အရေးကြီးပါတယ်။
GLM-4.7 နဲ့ GLM-4.6 ဘယ်လိုပြောင်းလဲသွားလဲဆိုတာကို သိချင်တယ်ဆိုရင်၊ နှစ်ခုလုံးကိုရင်ဆိုင်အသုံးပြုကာ ရရှိတဲ့ အကျဉ်းချုပ်ကဒီလိုပါ:
ကျွန်တော့်ရဲ့ စမ်းသပ်မှုအလုံးအစုံ (အခြားမော်ဒယ်တွေမှာ ထပ်ခါထပ်ခါအသုံးပြုပြီးသား အလုပ်အမှု 40 ခုလောက်) မှာ GLM-4.7 က GLM-4.6 ထက် 18-20% ပိုမိုရှုပ်ထွေးတဲ့ ကုဒ်ရေးရာအလုပ်တွေကို ဖြေရှင်းနိုင်ခဲ့တယ်၊ ထပ်မံအမိန့်ပေးဖို့ အလုံးစုံမလိုအပ်ဘူး။
ဒါကြောင့် သင် 4.6 ကို ဘာမှန်မှန်အတွက် အသုံးပြုနေသေးရင်၊ GLM-4.7 က အလှဆင်ပြုပြင်ပေးတဲ့ အဆင့်မြင့်မဟုတ်ဘူး—ဒါဟာ GLM အစဥ်လိုင်းထဲမှာ အသစ်ထွက်လာတဲ့ အခြေခံအဆင့်ပါ။
နည်းပညာသတ်မှတ်ချက်များသည် အပြည့်အစုံကို မပြောပြနိုင်ပေမယ့် GLM-4.7 နှင့်အတူ အချို့က သင့်ရဲ့ နေ့စဉ်အသုံးပြုမှုနဲ့ တိုက်ရိုက်ချိတ်ဆက်နေပါတယ်။
GLM-4.7 သည် 200,000 စကားလုံး အကြောင်းအရာပြဿနာနှင့်အတူ ပို့ဆောင်သည်။ လူတွေ့အရ၊ ဒါဟာ:
ကျွန်ုပ်၏ အမှန်တကယ် စမ်းသပ်မှု: ကျွန်ုပ်သည် 620-စာမျက်နှာ PDF (အကြောင်းအရာ 180K တော်တော်များများ) ကို အသုံးပြု၍ ဖွဲ့စည်းထားသော အကျဉ်းချုပ် + Q&A လမ်းညွှန်ကို မေးမြန်းခဲ့သည်။
ရလဒ်များ:
ဒါက GLM-4.7 ကို ရှည်လျားသောစာရွက်စာတမ်း ကိုင်တွယ်မှု အတွက် 2025 ခုနှစ် ဇန်နဝါရီလတွင် အများဆုံး မော်ဒယ်များထက် ရှေ့ပြေးထားသည်။
အခြားတစ်ပိုင်းကတော့ ထုတ်လွှင့်မှုပါပဲ။ GLM-4.7 သည် 128,000 စကားလုံးထိ ထုတ်လွှင့်မှုကို ပံ့ပိုးပေးသည်။
ကျွန်ုပ်သည် စမ်းသပ်မှုတစ်ခုဖြင့် ကြိုးစားခဲ့သည်: "အတန်းရဲ့ အပြည့်အစုံ အကြောင်းအရာနဲ့ ရှင်းပြချက်များ + ဥပမာများကို (~80K စကားလုံး) ထုတ်လုပ်ပါ" ဟု မေးမြန်းခဲ့သည်။ ဒါဟာ:
ဖန်တီးသူများအတွက်၊ ဒါက သင်ကို အမှန်တကယ်:
မင်းဟာ ၁၀၀,၀၀၀+ output များကို နေ့စဉ်မလုပ်နိုင်လောက်ပေမယ့် အမြင့်ဆုံးထိမှတ်ကို သိခြင်းက GLM-4.7 ကို အလွန်ဆွဲဆောင်မှုရှိစေသည်။ ရှည်လျားသောစာရွက်စာတမ်းများကို ဆောင်ရွက်ခြင်းနှင့် ကြီးမားသော ကုဒ်အခြေခံလုပ်ငန်းများတွင်။
စာရွက်စာတမ်းအရ၊ GLM-4.7 သည် ၃၅၈B-parameter မော်ဒယ်ဖြစ်ပြီး အလွတ်အစာအဆင်ရှိသည်။
ကျွန်ုပ်၏ စမ်းသပ်မှုတွင် အလေ့အကျင့်အဖြစ်၊
မင်းဟာ GLM-4.7 ဘာလဲဆိုတာသာမက ဘာကြောင့် အရေးကြီးလဲဆိုတာကို မေးလျှင်၊ ယင်းသည် အကြီးအကဲများထဲတွင် အလွတ်အစာအဆင်မော်ဒယ်များကို တကယ်တက်ပြီး "အခြား ၃၀B-အနီးအပြား မော်ဒယ်" ဟုပြောနေရန်သာမဟုတ်ဘဲ ဆောင်ရွက်မှုများကို ရှေ့ပြေးစွာ ရှုထောင့်တိုးတက်စေသည်။
ကောင်းပြီ၊ စံနှုန်းများသည် ချစ်စရာကောင်းပေမယ့် ကျွန်ုပ်၏ အလုပ်စဉ်များတွင် ဘာတွေ အပြောင်းအလဲဖြစ်သွားသည်ကို ငါစိုးရိမ်သည်။ ကျွန်ုပ်သည် GLM-4.7 နှင့် GLM-4.6 ကို အသစ်သော မော်ဒယ်များကို စမ်းသပ်ရန် အသုံးပြုသော ကုဒ်ရေးခြင်း၊ အချက်အလက်စဉ်းစားခြင်းနှင့် ကိရိယာအသုံးပြုခြင်းလုပ်ငန်းများမှတဆင့် လွှတ်ထားခဲ့သည်။
တရားဝင်အားဖြင့်၊ GLM-4.7 သည် SWE-bench တွင် 73.8 ကို ထိုးနှက်ခဲ့သည်၊ သည်သည် အမှန်တကယ် GitHub ပြဿနာများကို ဖြေရှင်းရန် အလေးအနက်ရှိသော အမှတ်ဖြစ်သည်။
ကျွန်ုပ်၏ ကိုယ်ပိုင် ကုဒ်ရေးခြင်း စမ်းသပ်မှုများတွင် (~၂၅ လုပ်ငန်းများ):
ဤလုပ်ငန်းများတွင် ပါဝင်သည်များမှာ:
အရေးကြီးသော ကွာခြားချက်မှာ: GLM-4.7 သည် patch ကိုသာမက မအောင်မြင်သော စမ်းသပ်မှု ရလဒ်ကို မှန်ကန်စွာ ရည်ညွှန်းပြီး ဖိုင်များစွာကို တပြိုင်နက်တည်း အဆင်ပြေစေရန် ပြောင်းလဲရေးသားခဲ့သည်။ GLM-4.6 သည် အချက်အလက်မှားကို အချိန်ခဏအတွင်းပြင်ခဲ့သော်လည်း အခြားအရာတစ်ခုခုကို ပျက်စီးစေခဲ့သည်။

Benchmark များတွင် မတွေ့ရသော အရာတစ်ခု: vibe coding—frontend များအတွက် layout, copy, နှင့် micro-interaction အပြုံးမှုများ၏ ပေါင်းစပ်မှု။
GLM-4.7 မှာ အောက်ပါ prompt များကို ထည့်ပေးခဲ့သည်:
"တစ်ခုတည်းသော AI စာရေးကိရိယာအတွက် landing page တစ်ခုကို design လုပ်ပါ။ TailwindCSS + React. သက်သာသောနှင့် ယုံကြည်မှုရှိသော အနေအထားဖြင့် မျက်နှာပြင်ကို ဖန်တီးပါ၊ သေးငယ်သော animation များကို ထည့်ပါ။"
GLM-4.6 နှင့် နှိုင်းယှဉ်သောအခါ GLM-4.7 သည်:
သင့်လုပ်ငန်းစဉ်တွင် frontend ဖန်တီးခြင်း သို့မဟုတ် UI/UX အတွေးအခေါ်များကို ပြုပြင်ခြင်း ပါဝင်လျှင် GLM-4.7 သည် ပိုပြီး သက်သာသော ဖြစ်သည်။ aesthetic hints များကို ပိုမိုနားလည်ပြီး ထိရောက်သော HTML/CSS/JS သို့ ပြောင်းနိုင်သည်။
ကျွန်တော် GLM-4.7 ကို အေးဂျင့်လုပ်ဆောင်ချက်လေးတစ်ခုဖြင့် စမ်းသပ်ကြည့်ပြီးပါပြီ။
ရည်ရွယ်ချက်: ဖွင့်လှစ်ချက်ကို အပ်ဒိတ်လုပ်ပြီး ကုဒ်ကို ပြုပြင်ပြီး ရှာဖွေထားသော အချက်အလက်အပေါ်အခြေခံ၍ ပြောင်းလဲမှုမှတ်တမ်းလေးရေးရန်
၂၀ ကြိမ်ထပ်ပြန်စမ်းသပ်ခြင်း:
ထူးခြားစွာထင်ထင်ရှားရှားတွေ့ရှိရသောအချက်မှာ GLM-4.7 က schema-respecting JSON ကို ကောင်းစွာကိုင်တွယ်နိုင်ခြင်း ဖြစ်သည်။ ထပ်ထပ်ထပ်ထပ်နေတဲ့ အကွက်တွေထည့်မယ့်အစား မထည့်လိုက်တော့တာကြောင့် အလုပ်လုပ်သည့်အခါပိုမိုလွယ်ကူစေသည်။
သီအိုရီအပိုင်းတွင် GLM-4.7 သည် HLE 42.8 ကို ရောက်ရှိခဲ့သည် (Hallucination & Logic Evaluation)၊ အဲဒါကတော့ အမှားတွေမလုပ်ဘဲ သီအိုရီတန်းစွာလိုက်နာနိုင်တာကိုဆိုလိုတာပါ။
အဲဒီစမ်းသပ်မှုရဲ့ ပိုမိုလူသားဆန်တဲ့ ဗားရှင်းကတော့:
GLM-4.7:
သုတေသနမှတ်စုများ၊ မူဝါဒမူကြမ်းများ သို့မဟုတ် စိတ်ကူးဆန်းသီအိုရီ သည် စာလုံးရေထက် ပိုမိုအရေးကြီးသော အရာများတွင် GLM-4.7 သည် ပိုမိုလုံခြုံပြီး ပိုမိုရှင်းလင်းသော မိတ်ဖက်တစ်ယောက်ဖြစ်သည်ဟု ခံစားရသည်။

အခုတော့ လူတိုင်း လျှောက်လှမ်းပြီး ကြည့်ကြတဲ့အပိုင်း: GLM-4.7 ကုန်ကျစရိတ်က ဘယ်လောက်လဲ၊ နဲ့ ဘယ်လို အသုံးပြုကြမလဲ?
Zhipu ရဲ့ public ဈေးနှုန်း GLM-4.7 အတွက်:
အတွေ့အကြုံအရ၊ ဒီကဲ့သို့သော အချိန်ကြာရှည်သည့် စာရွက်စာတမ်း စမ်းသပ်မှုအတွက် ဆိုရင်:
နောက်ဆုံးထွက် မော်ဒယ်များနှင့် နှိုင်းယှဉ်ပါက၊ GLM-4.7 ရဲ့ ဈေးနှုန်း-အရည်အသွေး အချိုးအစားက အတော်လေး ပြိုင်ဆိုင်နိုင်ပါတယ်၊ အထူးသဖြင့် အချိန်ကြာရှည် အသုံးပြုမှုများကို အားကိုးရပါက။
တစ်ကိုယ်တော် ဖန်တီးသူများနှင့် တစ်ယောက်တည်း ဆော့ဖျဝဲရေးသူများအတွက်၊ GLM Coding Plan $3/လ က အနားမလျှောက်စရာ တစ်ခု အထူးစိတ်ဝင်စားဖွယ်ရာ ဖြစ်ပါတယ်။
GLM-4.7-အဆင့် မော်ဒယ်များ၏ coding-အထူးပြု ပတ်ဝန်းကျင်ကို ရရှိနိုင်ပြီး၊ ငါ့အတွေ့အကြုံအရ၊ ဒီက လက်တွေ့ အလားအလာများမှာ:
ကုဒ်နှင့်သက်ဆိုင်သော အရာအားလုံးတွင် အသုံးပြုရန် ကိုယ်ကို ကိုယ် အတင်းအကျပ် အသုံးပြုခဲ့သည့် ၅ ရက်တာတွင် ကြိုးစားခဲ့ရာက ၎င်းသည် boilerplate၊ refactors နှင့် စမ်းသပ်ရေးသားခြင်း အတွက် နေ့စဉ် ၁.၅–၂ နာရီ ခန့်ကို စွမ်းဆောင်နိုင်ခဲ့သည်ဟု ခန့်မှန်းပါသည်။
သုံးဘတ်ပဲ ကျသင့်တယ်ဆိုရင်၊ နည်းပညာနဲက်လုပ်ကိုင်တဲ့သူဆိုရင် စဉ်းစားစရာမလိုပါဘူး။
အပြည့်အစုံ ထိန်းချုပ်လိုပါက၊ Hugging Face မှ GLM-4.7 ရဲ့ open weights ကို ယူပြီး ကိုယ်ပိုင်-ဟော့စ်တင်နိုင်ပါသည်။
သို့သော် အမှန်တရားက:
ဒါပေမယ့် စွမ်းဆောင်နိုင်တဲ့ အဖွဲ့များအတွက် GLM-4.7 ကို နေရာတွင် အလုပ်လုပ်ခြင်းက:
သင်၏ ပထမဆုံးမေးခွန်းသည် "GLM-4.7 ဆိုတာဘာလဲ နှင့် API ကိုဘယ်လိုသွားရောက်မလဲ" ဆိုရင်၊ ဒီအပိုင်းကို မလိုအပ်ပါဘူး။ ဒါပေမယ့် infra-minded ဖြစ်ရင် Hugging Face လမ်းကြောင်းက ဒီထုတ်ကုန်ရဲ့ အားသာချက်အနက် တစ်ခုဖြစ်ပါတယ်။
GLM-4.7 က အမှန်တကယ် အလုပ်လုပ်တဲ့နေရာမှာပါ။
သင့်အလုပ်တွင် ပါဝင်ပါက:
…GLM-4.7 ရဲ့ 200K context နှင့် 128K output ပေါင်းစပ်မှုက အလွန်အသုံးဝင်ပါတယ်။
ငါ့စမ်းသပ်မှုမှ ဥပမာ: အထွေထွေသုတေသန၊ လမ်းပန်းဆက်လမ်းညွှန်မှတ်စုများနှင့် အသုံးပြုသူတုံ့ပြန်မှုများကို 170K-token အထုပ်ကို ထည့်သွင်းခဲ့တယ်။ ရှေးရှုထားသည့် လမ်းပန်းဆက်လမ်းညွှန်၊ အန္တရာယ်ခွဲခြမ်းစိတ်ဖြာမှုနှင့် သတင်းပို့ခြင်းလမ်းညွှန်ကို မေးမြန်းခဲ့တယ်။
Result: It produced a coherent plan in one shot, which I then lightly edited.
Compared to chopping everything into 10–20 chunks with other tools, GLM-4.7 cut the manual overhead by at least 50–60%.
GLM-4.7's stronger tool usage and better JSON discipline make it a great brain for multi-step agent workflows.
For example, I wired it into a small pipeline:
Success rate (meaning: no schema errors, patch applied cleanly, changelog accurate):
If you're playing with agents or building internal copilots, this is where GLM-4.7 quietly shines.
For vibe coding, GLM-4.7 felt like having a junior designer + front-end dev who actually listens.
Use cases that worked well in my tests:
If you're a solo creator or marketer who wants to iterate on UI ideas without opening Figma for every tiny change, GLM-4.7 is a surprisingly capable partner, especially when you anchor it with references like "make it feel like Linear" or "closer to Notion's aesthetic, but warmer."
လူတွေက "GLM-4.7" ဟာ အခြားမော်ဒယ်တွေနဲ့ နှိုင်းယှဉ်လို့ ဘာအတွက်ကောင်းသလဲ" လို့ မေးလာရင်၊ ငါက ဒီလို သုံးပြောတယ်။
ကျွန်တော်ရဲ့ ကိုယ်ပိုင် အကူအညီမှာ အခုလို:
GLM-4.7 သည် 358B-parameter, 200K-context, ကုဒ်ရေး အထူးပြု၊ ဖွင့်လှစ် အလေးချိန် နောက်ဆုံးထွက် မော်ဒယ်ဖြစ်ပြီး ရှည်လျားသော အကြောင်းအရာ + အရည်အသွေးမြင့် အာရုံစူးစိုက်မှုကို စမ်းသပ်ရန် မဟုတ်ဘဲ အသုံးပြုနိုင်သည့် အခြေအနေဖြစ်စေသည်။
မင်း စိတ်ဝင်စားရင် အကြံပြုချက်: တစ်ခုခု လုပ်ငန်းစဉ်ကို ရွေးပါ—ရှည်လျားသော PDF စမ်းသပ်မှု၊ တည်ငြိမ်သော ကုဒ်ရေး ပြဿနာ သို့မဟုတ် သေးငယ်သော အေးဂျင့် လုပ်ငန်းစဉ်—နှင့် GLM-4.7 ကို မင်းရဲ့ အကြိုက်ဆုံးနဲ့ အပြိုင် ပြီးရှင်းပါ။ ကွာခြားချက်ကို ဖတ်ရှုခြင်းထက် ခံစားရဖို့ ပိုမိုလွယ်ကူသည်။
ဒီတစ်ပတ်စမ်းသပ်မှုကငါ့ကိုထပ်မံသေချာစေခဲ့တာက GLM-4.7 ကဲ့သို့သောမော်ဒယ်များသည် ပိုမိုထက်မြက်လာရုံသာမက ကျွန်ုပ်တို့၏ စဉ်းစားမှု၊ အစီအစဉ်ရေးခြင်းနှင့် ဆုံးဖြတ်ချက်များကို အခြေခံသောအခြေခံအဆောက်အအုံဖြစ်လာသည်ကို ပြသခြင်းဖြစ်သည်။
ဒီစိတ်ကူးက ဖြစ်ချင်တော့ Macaron ကိုတည်ဆောက်နေတဲ့အကြောင်းပဲ။ "ပိုကောင်းအောင်လုပ်ပါ" AI တစ်ခုမဟုတ်ဘဲ တိတ်တိတ်ဆိတ်ဆိတ်နဲ့ အလုပ်အတွက် သင့်လျော်တဲ့ မော်ဒယ်ကို ရွေးချယ်ပေးတဲ့ ပုဂ္ဂိုလ်ရေး အေးဂျင့်တစ်ခု ဖြစ်အောင်လုပ်တာ — ကုဒ်ရေးခြင်း၊ စာဖတ်ခြင်း၊ အစီအစဉ်ရေးခြင်း သို့မဟုတ် အကြံဉာဏ်ဖျော်ဖြေရန် — AI ကို ဘဝထဲသို့ ထည့်သွင်းရန်ဖြစ်သည်။
သင်အဖြစ်မှန်တွင် အဲဒီလိုခံစားရမည်ဆိုရင် Macaron ကို အခမဲ့ စမ်းသပ်ကြည့်ပါ.
စမ်းသပ်မှု အရည်အချင်းများ: ကျွန်ုပ်သည် 2023 အတွင်း ကုဒ်ရေးခြင်း, အကြောင်းပြချက်ထုတ်ခြင်း နှင့် ထုတ်လုပ်မှုလုပ်ငန်းစဉ်များအတွင်း 50+ LLM များကို စမ်းသပ်ခဲ့သော AI မော်ဒယ် အကဲဖြတ်သူဖြစ်သည်။ ဒီ GLM-4.7 ချိတ်ဆက်မှုသည် တစ်ပတ်တာ လက်တွေ့စမ်းသပ်မှု (2024 ဒီဇင်ဘာ - 2025 ဇန်နဝါရီ) အပေါ် အခြေခံသည်။
စမ်းသပ်မှု နည်းလမ်းများ:
ပူးပေါင်းသဘောသဘာဝဖျော်ဖြေရန်: ဒီဆောင်းပါးတွင် Macaron သို့ သွားသော ကိုယ်စားလှယ်လင့်ခ်ပါရှိသည်။ ကျွန်ုပ်သည် Zhipu AI ထံမှ ဘာမှ မရရှိဘဲ အများပြည်သူ API နှင့် Coding Plan ကို အသုံးပြု၍ ကိုယ်တိုင် စမ်းသပ်ခဲ့သည်။
စမ်းသပ်ခဲ့သော ဆော့ဖ်ဝဲဗားရှင်းများ:
အရင်းအမြစ်များနှင့် ကိုးကားချက်များ: