ကျွန်တော်က GLM-4.7 နဲ့ GPT-5 ကို အဖြစ်မှန်တွင် လုပ်ငန်းစီမံကိန်းတွေ၊ မျက်နှာချုပ်ထားတဲ့ repos, မပြီးမြောက်သေးတဲ့ အကြမ်းဖျင်းနည်းပညာတွေကို မြှပ်နှံပြီး၊ သူတို့က အဖြစ်မှန်တွင် ဘယ်လို လုပ်ဆောင်ကြလဲဆိုတာ ကြည့်ဖို့ အတော်လေး ရက်အတွင်း ကျွန်တော်ရဲ့ အလုပ်လုပ်သည့်စနစ်ကို တမင်ပြိုကာကြိုးစားခဲ့ပါတယ်။

စာရွက်ပေါ်မှာတော့, နှစ်ခုစလုံး "နောက်မျိုးဆက်", "agentic", "ကွန်ပျူတာအတွက် အားကောင်းသည်" လို့ ခေါ်ဝေါ်ကြပြီး, စကားလုံးတွေဖြစ်ပါတယ်။ လက်တွေ့မှာတော့, bug ပြဿနာများကို ဖြေရှင်းခြင်း၊ များစွာသော ဖိုင်များကို ပြန်လည်ပြုပြင်ခြင်း၊ နည်းပညာအသုံးပြုသော အေးဂျင့်များအား အစမ်းသပ်မှုများတွင် GLM-4.7 နှင့် GPT-5 ကြားက မတူညီမှုများသည် စျေးကွက်ရှာဖွေရေးက ပုံဖော်ထားသည့် အတိုင်း မဟုတ်ပါ။

ကျွန်တော်တို့ စတင်မဝင်ခင် အမြန်အသိပေးချက် - GPT-5 အသေးစိတ်များသည် အဆက်မပြတ် ဖွံ့ဖြိုးနေပြီး ထုတ်လုပ်သူများ၏ အရည်အချင်းအတိုင်း ကောင်းမွန်ပြစ်စေသည်။ ဒီမှာ ကျွန်တော်မျှဝေမယ့် အချက်များသည် ၂၀၂၅ ပြည့်နှစ် ဒီဇင်ဘာလမှာ ကျွန်တော့်ကိုယ်ပိုင် စမ်းသပ်မှုများအပေါ် အခြေခံထားပြီး၊ အနည်းငယ်သာရှိသော်လည်း ပြန်လည်ထုတ်လုပ်နိုင်သော စမ်းသပ်မှုများဖြစ်သည်။ ဒီကို နယ်မြေမှတ်စုများအဖြစ် သဘောထားပြီး, သင်္ချာနှင့်မရောက်ပါနှင့်။

GLM-4.7 နှင့် GPT-5 ကြားက ကိုယ်စားပြု နှင့် ကွန်ပျူတာအတွက် အထူးသဖြင့် ကွာခြားမှုများကို လိုက်ကြည့်ရအောင်။

ဘာကြောင့် ဒီယှဉ်ပြိုင်မှုမှာ အရေးကြီးသလဲ

နှစ်ခုစလုံးက ကိုယ်စားပြုခြင်းနှင့် ကွန်ပျူတာအတွက် အင်အားကို အလေးပေးထားသည်

ကျွန်ုပ်သည် GLM-4.7 vs GPT-5 ကို နက်နက်ရှိုင်းရှိုင်း လေ့လာရန် ကြိုးစားခဲ့တဲ့အကြောင်းရင်းက တစ်ခုတည်းပါပဲ။ ထုတ်လုပ်သူနှစ်ဦးစလုံးက တစ်ခြားတစ်ခုတည်းကို အတူတူ ဟစ်ဟစ်တောနေကြသည်- ပိုမိုကောင်းမွန်သော ကိုယ်စားလှယ်များ၊ ပိုမိုကောင်းမွန်သော ကုဒ်ရေးခြင်း၊ ပိုမိုကောင်းမွန်သော အကြောင်းပြချက်တွေ။

ကျွန်ုပ်၏ စမ်းသပ်မှုများတွင် ဤသည်ကို သုံးပါးသော အထူးကိစ္စများအဖြစ် ပြောင်းလဲခဲ့သည်-

  1. သူတို့သည် ကိရိယာများကို ယုံကြည်စိတ်ချစွာ လည်ပတ်နိုင်ပါသလား?

ကျွန်ုပ်သည် နှစ်ခုစလုံးကို agent framework သို့ ချိတ်ဆက်ခဲ့ပြီး အောက်ပါ အရာများကို အသုံးပြုရန် အခွင့်အရေးရှိသည်-

  • shell (ကန့်သတ်ထားသော sandbox),
  • စီမံကိန်းဖိုင်များကို ဖတ်ရန်/ရေးရန် ဖိုင်စနစ်အလွှာ,
  • စမ်းသပ်မှု လုပ်ဆောင်သူ။
  1. သူတို့သည် အမှန်တကယ် အလုပ်လုပ်သော ကုဒ်ပြောင်းလဲမှုများကို ပို့နိုင်ပါသလား?

ကျွန်ုပ်သည် အသုံးပြုခဲ့သည်-

  • အမှန်တကယ်သော ဖွင့်လှစ်ထားသော Python စီမံကိန်းများမှ ~40 ကိစ္စများပါသော မှှေးဟပ်ထားသော SWE‑bench-ပုံစံစနစ်,
  • ကျွန်ုပ်၏ဖောက်သည်အလုပ်မှ TypeScript/Next.js အလုပ်အကိုင်အနည်းငယ်။
  1. သူတို့သည် ဘတ်ဂျက်အတွင်းနေပါသလား?

“စမတ်” ကိုယ်စားလှယ်တစ်ဦးက တစ်ခုသော bugfix အပေါ် $50 လှီးစား quietly လုပ်နေသည်ဆိုရင် စမတ်မဟုတ်ပါ။

GLM-4.7 နှင့် GPT-5 နှစ်ခုစလုံးသည် ဤအခြေအနေများအတွက် ထိရောက်စွာ အထောက်အကူပြုသည်၊ သို့သော် ယှဉ်ပြိုင်မှုများကွဲပြားသည်-

  • GPT-5 သည် အင်္ဂလိပ်-အလေးထားသော အလုပ်များနှင့် ထုတ်ကုန်-ပုံစံ အကြောင်းပြချက်များတွင် ပိုမို “ယုံကြည်စိတ်ချရသော” ခံစားမှုကို ပေးခဲ့သည်။
  • GLM-4.7 သည် အမူတည်သော ကုဒ်ရေးခြင်းနှင့် ကိရိယာအသုံးပြုမှုတွင် သတ်မှတ်ထားသော စျေးနှုန်းကို ကျော်လွန်ခဲ့သည်၊ အထူးသဖြင့် ကျွန်ုပ်သည် ပိုမိုဖွဲ့စည်းထားသော အရပ်များနှင့် အတူ ထိုးထိုးကြီးမားမား ကိုင်တွယ်ပြောဆိုခဲ့သည်။

မော်ဒယ်ရွေးချယ်မှု ဆုံးဖြတ်ချက်များအပေါ် တကယ့်သက်ရောက်မှု

ဒီကိစ္စဟာ သီအိုရီဆန်တဲ့ GLM-4.7 နဲ့ GPT-5 တိုက်ရိုက်ယှဉ်ပြိုင်မှုမဟုတ်ပါဘူး။ ရွေးချယ်မှုက အရာအားလုံးမှာ ပြည့်စုံနေတယ်။

  • သင့်ရဲ့ အေးဂျင့်တွေကို ၂၄/၇ လည်ပတ်စေချင်ရင်၊ မော်ဒယ်စျေးနှုန်းနဲ့ ကိရိယာခေါ်သုံးမှု ထိရောက်မှုက သင့်ရဲ့ အကြံအစည်က အတည်ပြုနိုင်ခြင်း ရှိမရှိကို အဓိကသတ်မှတ်ပေးတယ်။
  • သင့်အလုပ်ကို ကြီးမားတဲ့ ရီပိုတွေထဲမှာ လုပ်နေတယ်ဆိုရင်၊ context window နဲ့ အထွက်အလေးနဲ့ပတ်သက်ပြီး မော်ဒယ်က အချိန်ပိုသုံးပြီး အကျဉ်းချုပ်ဖို့လိုလားတယ်ဆိုရင်၊ အဲဒါက coding တကယ်လုပ်တာထက်ပိုအရေးကြီးတယ်။
  • သင့်ရဲ့ ထုတ်ကုန်တွေကို အပြင်မှာ သုံးဖို့ သင်ပို့ပေးနေတယ်ဆိုရင်၊ GPT-5 လောကမှာ တည်ငြိမ်မှုနဲ့ ပတ်ဝန်းကျင်က raw benchmark မှတ်ချက်ထက် ပိုအရေးကြီးတတ်တယ်။

ကျွန်တော်က မကြာသေးခင်က ကမ္ဘာ့ဖောက်သည်တစ်ဦးရဲ့ "AI အဖွဲ့အစည်းအကူအညီ" ကို GPT-တစ်ခုတည်းစနစ်ကနေ နောက်ခံ coding လုပ်ငန်းတွေမှာ ကုန်ကျစရိတ်နဲ့ throughput အရေးပါတဲ့ GLM-4.7 သို့ ပြောင်းလိုက်ပြီ။ အရင်နှစ်ကတော့ အဲဒီကွာခြားမှုကို စဉ်းစားဖို့မတတ်နိုင်ဘူး။ အခုတော့ make sense ဖြစ်နေပြီ။

Benchmark Face-Off

ကျွန်တော်က အပြည့်အဝ academic benchmark တွေ မထပ်တူလုပ်ဘူးလို့ မပြောချင်ပါဘူး၊ ဒါပေမယ့် ကျွန်တော် အစီအစဉ်အသေးစားလေး တစ်ခုစီကို လည်ပတ်လိုက်တယ်။

SWE-bench ဆန်းစစ်ပြီး

Python ပြဿနာ ၃၀ ခုနှင့် နမူနာပြုပြင်မှုများအတွက်:

  • GPT-5: လက်တွေ့စမ်းသပ်မှုမလိုဘဲ 21/30 (70%) ဖြေရှင်းနိုင်ခဲ့တယ်။
  • GLM-4.7: 19/30 (63%) ဖြေရှင်းနိုင်ခဲ့တယ်။

အကြောင်းပြန်ပြောတဲ့ အခါဒုတိယအကြိမ်ကို ခွင့်ပြုလိုက်တယ်ဆိုရင် ("စမ်းသပ်မှုတွေ မအောင်မြင်သေးဘူး၊ log နဲ့တင်ပြထားပါတယ်"), ကွာဟချက်က ကျဉ်းလာတယ်:

  • GPT-5: 25/30 (83%)
  • GLM-4.7: 23/30 (77%)

အရေးကြီးတာက ရာခိုင်နှုန်းမဟုတ်ဘဲ၊ သူတို့ ဘယ်လိုပျက်ကွက်သွားခြင်းပါ။

  • GPT-5 ၏ အားနည်းချက်များသည် အထူးသဖြင့် လပ်တဲ့ ကိစ္စတစ်ခုမျှမရှိသော ကိစ္စများဖြစ်သည်။
  • GLM-4.7 သည် အကြောင်းပြချက် မူရင်းကို တခါတရံ မမှန်ကန်စွာ ဖတ်ရှုခဲ့သည်၊ သို့သော် ပိုမိုရှင်းလင်းသော လမ်းညွှန်ချက်များဖြင့် လမ်းညွှန်သောအခါ အံ့သြဖွယ်ကောင်းစွာ ပြန်လည်ပြုပြင်နိုင်ခဲ့သည်။

SWE-bench Multilingual

Pseudo multilingual SWE‑bench ကို အောက်ပါအတိုင်း အလျင်အမြန် တည်ဆောက်ခဲ့သည်:

  • ကုဒ်ကို အင်္ဂလိပ်လို ထားသည်,
  • သို့သော် အမှားအကြောင်းကြားစာများနှင့် မှတ်ချက်များကို တရုတ်+အင်္ဂလိပ် စပ်၍ ရေးသည်။

GLM-4.7 နှင့် GPT-5 အတွက်အခြေအနေပြောင်းလဲသွားသည်:

  • GLM-4.7: ပထမဆုံး ကြိုးစားမှုတွင် 18/25 (72%)
  • GPT-5: 14/25 (56%)

GLM-4.7 သည် တရုတ်ဘာသာမှ အမှားအကြောင်းပြချက်များကို ပိုမိုကောင်းမွန်စွာ ကိုင်တွယ်နိုင်ပြီး docstrings တွင် စပ်ထားသော ဘာသာစကားမှတ်ချက်များမှ မရှုပ်ထွေးခဲ့ပါ။ GPT-5 သည် အကြောင်းပြချက်ကို အင်္ဂလိပ်လို ပြန်ရေးသောအခါ 通常 ပြဿနာကို ဖြေရှင်းနိုင်ခဲ့သည်၊ သို့သော် အရွယ်အစားမှာ ပိုမို အဆင်ပြေမှု မရှိပါ။

Terminal Bench 2.0

terminal-ပုံစံ မဟုတ်သော လုပ်ငန်းများ (deps 설치, စမ်းသပ်မှုများကို run လုပ်ပါ, မှတ်တမ်းများကို စစ်ဆေးပါ, သေးငယ်သော ဖိုင်များကို တည်းဖြတ်ပါ) အတွက် နှစ်ခုလုံးကို အတူတကွ sandbox ထဲတွင် ချိတ်ဆက်ထားသည်။

40 လုပ်ငန်းများအတွင်း အောင်မြင်မှုနှုန်းကို တိုင်းတာခဲ့သည်:

  • GPT-5: 34/40 (85%)
  • GLM-4.7: 33/40 (82.5%)

အဓိက ကွဲပြားချက်:

  • GPT-5 သည် လုပ်ငန်းတစ်ခုနှုန်းတွင် စက်ကိရိယာခေါ်ဆိုမှုကို ပျမ်းမျှ 3.1 ခေါ်ဆိုခဲ့သည်။
  • GLM-4.7 သည် လုပ်ငန်းတစ်ခုနှုန်းတွင် 3.8 ခန့်ခေါ်ဆိုခဲ့သည်။

ထိခိုက်မှုမရှိသော်လည်း သင်၏ ဂျီနီဝန်ဆောင်မှုသည် ခေါ်ဆိုမှုနှုန်းတစ်ခုစီအတွက် ပေးဆောင်ရပါက အရသာကို ခံစားရမည်။

HLE with Tools

အပြင်ပန်းစက်ကိရိယာများဖြင့် အဆင့်မြင့် အကဲဖြတ်မှု (HLE) အတွက် "သုံးသပ်သူ" လုပ်ဖော်ကိုင်ဖက်တစ်ခုကို စမ်းသပ်ခဲ့သည်:

  1. စာရွက်စာတမ်းများကို ရှာပါ (web search tool နှင့်တကွ)
  2. စာမျက်နှာကို ဖတ်ပါ။
  3. ကိန်းဂဏန်းတွက်ချက်စက် သို့မဟုတ် သေးငယ်သော Python sandbox ကို ခေါ်ပါ။
  4. နောက်ဆုံး အကြံပြုချက်ကို ဖော်ပြပါ။

ဒီမှာ GPT-5 က တရားဝင် စွမ်းရည်ပြခဲ့သည်:

  • GPT-5 သည်အစီအစဉ်ရေးဆွဲရာတွင်ပိုမိုထူးချွန်သည်။ ၎င်းသည်လိုအပ်မည့်ကိရိယာများကို 2–3 ချီအဆင့်ဆင့်ကြိုတင်ခန့်မှန်းနိုင်သည်။
  • GLM-4.7 သည်တခါတရံ ဝက်ဘ်ရှာဖွေမှုကိရိယာကို အလွန်အကျွံခေါ်ယူပြီး ထပ်တူမျှမျှ စာမျက်နှာများကို ပြန်လည်ရယူလေ့ရှိသည်။

စုစုပေါင်းအားဖြင့်၊ ဤအသေးစား HLE-with-tools စမ်းသပ်မှုတွင်:

  • GPT-5 သည် ကျွန်ုပ်ပြောလိုက်သည်မှာ ထုတ်လုပ်မှုအသင့်ဖြေကြောင်းကို ~88% အချိန်တွင် ပေးခဲ့သည်။
  • GLM-4.7 သည် ထုတ်လုပ်မှုအသင့်ဖြစ်သည်ဟု ခံစားရသော်လည်း ~78% အချိန်တွင် ကျန်တာကို လူ့အဖွဲ့အစည်းက သန့်ရှင်းရေး လုပ်ဆောင်ရန် လိုအပ်သည်။

သင့်ရဲ့အဓိကအသုံးပြုမှုကိစ္စတွင် ကုဒ်ရေးခြင်း + ကိရိယာများဖြင့်ဖြစ်ပါက၊ နှစ်ခုလုံးမှာခိုင်မာပါတယ်။ သင်၏အသုံးပြုမှုကိစ္စသည် အရည်အချင်းရှိသော လေးစားမှုဖြင့်ဖြစ်ပါက၊ GPT-5 သည် ကျွန်ုပ်၏အတွေ့အကြုံအရ အထက်ဆုံးအဆင့်ကို ပိုမိုသန့်ရှင်းစေပါသေးသည်။

စျေးနှုန်းနှိုင်းယှဉ်မှု

တစ်ဦးချင်းပုဂ္ဂိုလ်ဆောက်လုပ်သူများအတွက်၊ GLM-4.7 vs GPT-5 စျေးနှုန်းသည် သင့်လစဉ်ကို ဆွဲဆောင်ခြင်း သို့မဟုတ် ဖျက်ပြစ်ခြင်းမှတစ်ဆင့် တိတ်တိတ်ဆိတ်ဆိတ် ခံစားရနိုင်သည်။

API ကုန်ကျစရိတ်များ (input, output, cached tokens)

GPT-5 စျေးနှုန်းသည် အတိအကျမူဝါဒမရှိသေးပေမယ့်၊ GPT-4.1/o3 စံနမူနာများကို လိုက်နာပါက၊ ကျွန်ုပ်တို့က:

  • တရုတ်ဒေသမော်ဒယ်များထက် 1M token နှုန်းပိုမိုမြင့်မားသောစျေးနှုန်း
  • cached tokens နှင့် reused context အတွက် လျော့ဈေးများရနိုင်ခြင်း

GLM-4.7 သည် စျေးနှုန်းအပေါ်တွင် တရုတ်ဒေသများတွင် အထူးသဖြင့် တိုက်ရိုက်ပြိုင်ဆိုင်မှုရှိပြီး၊ သင့်ဒေသနှင့် ပံ့ပိုးပေးသူပေါ်မူတည်၍ OpenAI မော်ဒယ်များထက် 30–60% ပိုမိုလျော့ပေါ်သော စျေးနှုန်းဖြင့် ရှိတတ်သည်။

ပုံမှန်ကုဒ်ရေးဆွဲမှုအစည်းအဝေးအတွက် (200K input context, 20–40K output token များအားလုံးတွင်) ကျွန်ုပ်သည် လုပ်ဆောင်မှုတူညီသည့်အခါ:

  • GLM-4.7 ကုန်ကျစရိတ် ≈ $0.40–$0.60
  • GPT-4.1/o3 ကုန်ကျစရိတ် ≈ $0.90–$1.40

GPT-5 သည် အထက်ပိုင်းတွင်ရှိပါက၊ GLM-4.7 သည် "value per solved task" အရ တိုးတက်မှုရှိနေပါသည်။

ပုံမှန်အေးဂျင့်လုပ်ငန်းစဉ်များအတွက် စုစုပေါင်းကုန်ကျစရိတ်

ကျွန်တော်က အောင်မြင်တဲ့ task တစ်ခုစီအတွက် ကျသင့်စရိတ် ကိုလည်း လိုက်လံစစ်ဆေးခဲ့ပါတယ်၊ token တစ်ခုစီမှာသာမကပါဘူး။

ကျွန်တော့်ရဲ့ 30 task SWE-style စမ်းသပ်မှုအတွက်:

  • GLM-4.7: အောင်မြင်တဲ့ ပြုပြင်မှုတစ်ခုစီအတွက် $0.80 ခန့်
  • GPT-style (GPT-4.1/o3-ဟာ GPT-5 အတွက်ကိုယ်စားပြု): အောင်မြင်တဲ့ ပြုပြင်မှုတစ်ခုစီအတွက် $1.30 ခန့်

ဒါကြောင့် GPT‑style မော်ဒယ်တွေက task ပိုများများ ဖြေရှင်းနိုင်ပြီဖြစ်ပေမယ့်၊ GLM ကတော့ အလုပ်လုပ်တဲ့ PR အတွက် ငွေကြေးပိုက်ဆံမှာ အခုလည်း နိုင်ခဲ့ပါတယ်

သင်လုပ်ဆောင်ရင်:

  • ဆက်တိုက် code ပြန်လည်စစ်ဆေးသော agent များ
  • အလိုအလျောက် bug အဆင့်သတ်မှတ်ခြင်း
  • ညအချိန်တစ်ဝက် ပြန်လည်ဖျက်စီးမှုများ

အဲဒီ cost-per-fix နောက်ခံက အလွန်မြန်ဆန်စွာ စုစည်းသွားပါတယ်။

ကိုယ်ပိုင်ဆာဗာပေါ်တွင် အပေါ်တွင်ထည့်သွင်းခြင်း (GLM-4.7 သီးသန့်)

မျိုးစုံက အပေါ်တွင်ထည့်သွင်းခြင်း ကိုယ်ပိုင်ဆာဗာပေါ်တွင် အပေါ်တွင်ထည့်သွင်းခြင်း ဖြစ်ပါတယ်။ GLM-4.7 ကို သင့်ကိုယ်ပိုင် GPU များ သို့မဟုတ် ပုဂ္ဂလိက cloud တွင် တင်နိုင်ပါတယ်။

ဒါဟာ သင့်ကို:

  • မပြောင်းလဲနိုင်တဲ့ API စိုက်ကြွမှုများ မရှိဘဲ တစ်ခုတည်းသော အခြေအနေငွေပေးချေမှုမှတ်ပုံတင်
  • ဥပဒေ/လုံခြုံရေးလိုအပ်ချက်များကြောင့် ကုဒ်သည် US သို့မဟုတ် တတိယပါတီရောင်းချသူကို ထိတွေ့မရခြင်း
  • တစ်ခေါ်ခေါ် ရောင်းချမှုမရှိဘဲ အပြိုင်အဆိုင် အေးဂျင့်အသေးများစွာ တစ်ချိန်တည်းတွင် လည်ပတ်ချင်ခြင်း

물론 무료는 아니죠. 당신은 다음을 거래하고 있습니다:

  • Ops အလွယ်တကူ (စစ်ဆေးခြင်း၊ အရွယ်အစား၊ အဆင့်မြှင့်တင်ခြင်း)
  • စတင် infra ကုန်ကျစရိတ်

...သို့သော် သင့် အသုံးပြုမှုသည် တစ်ချိန်တည်းတွင် (ကျွန်တော်အတွက် 15–20M tokens/နေ့ စွဲစွဲမြဲမြဲရှိခဲ့ခြင်း ဖြစ်ပါသည်) GLM-4.7 ကိုယ်ပိုင်ဆာဗာပေါ်တွင် အပေါ်တွင်ထည့်သွင်းခြင်းက GPT-5 API စီမံကိန်းကို ကောင်းမွန်သောအရာဖြစ်လာသည်။

ကိန်းဂဏန်းဖွင့်လှစ်မှုကိန်းဂဏန်းများ

အကြောင်းအရာဝင်းဒိုး (200K vs ?)

GLM-4.7 အတွက် ကျွန်တော်သည် အမြဲတမ်း ~200K token အကြောင်းအရာနဲ့ ဆော့ကစားနိုင်ခဲ့ပါတယ်။ အဲဒါကအတွက် လုံလောက်ပါတယ်:

  • အလယ်အလတ်အရွယ်အစား repo အပိုင်းတစ်ခု၊
  • အပေါင်းအသင်းအချို့ကိုဖွင့်ထားခြင်း၊
  • အပြင် log နဲ့ အညွှန်းများကိုပါ။

GPT-5 ရဲ့ အတိအကျ အကြောင်းအရာ ကန့်သတ်ချက်တွေက အဆင့်/ဗားရှင်းအပေါ် မူတည်ပြီး လုပ်ငန်းပိုင်ရှင်က အမြဲပြောင်းလဲနေပါတယ်။ လက်တွေ့ကျကျ အနေဖြင့် ငါ့အနေနဲ့ 128K–200K အတန်းမော်ဒယ်တစ်ခုလို သတ်မှတ်ပြီး နေ့စဉ်ကုဒ်ရေးရာတာဝန်တွေမှာ မကြုံဘူးလောက်ပါဘူးဟာ့ဒ်ကွန်တက်စ်တ်ကန့်သတ်ချက်တွေကို ရင်ဆိုင်ရတာ။

အဓိကကွာခြားချက်က ကိန်းဂဏန်းအတိအကျမဟုတ်ဘဲ သူတို့က ဘယ်လိုအသုံးပြုခဲ့တယ်ဆိုတာပါ:

  • GPT-5 က အလျင်အမြန် အကြမ်းဖျင်းချုပ်ဆိုမှုကို ပိုကောင်းစေပြီး ငါ့အနေနဲ့ အကြောင်းအရာကို အလွန်ပြည့်စုံစွာထည့်သွင်းတဲ့အခါမှာတောင် အာရုံမလျော့ဘူး။
  • GLM-4.7 က အလွန်ရှည်လျားတဲ့ အကြောင်းအရာတွေမှာ အစိတ်အပိုင်းတွေကို ရှေ့နောက် မဖျက်ဘဲ မျဉ်းတန်းထုတ်ဖို့ ငါ အထူးသဖြင့် အပိုင်းအစတွေကို ဖွဲ့စည်းမထားရင် "မေ့" ထားတတ်တယ်။

ထုတ်ကုန်အလေးချိန် (128K vs ?)

GLM-4.7 က အပြည့်အစုံသော ပက်ချ်များ သို့မဟုတ် စမ်းသပ်မှု အစုအဝေးတို့ကို တောင်းဆိုတဲ့အခါမှာ ရှည်လျားတဲ့ ထုတ်ကုန်တွေကို ရင်ဆိုင်ဖို့ အေးဆေးဖြစ်ခဲ့တယ်၊ ထောင်ပေါင်းများစွာသော တိုကင်များကို ယိုလျောင်းခြင်းမရှိဘဲ ထုတ်ပေးခဲ့တယ်။

GPT-5 ကလည်း ကြီးမားတဲ့ ထုတ်ကုန်တွေကို ကိုင်တွယ်နိုင်ပါတယ်၊ ဒါပေမယ့် ငါ့အထောက်အထားအရ ပိုပြီးစောင့်ဆိုင်းပြီး "အခြားအပိုင်းတွေလိုချင်လား" ဆိုပြီး ပြောတာကို မြင်တွေ့ရပါတယ်၊ အထူးသဖြင့် စကားပြောစနစ်မှာ။

ကြီးမားတဲ့ ကွာခြားချက်တွေအတွက်:

  • GLM-4.7 က ကုဒ်အပိုင်းအစအကြီးကြီးတွေကို တစ်ကြိမ်ထဲမှာ ပစ်ထားတာ ပိုအဆင်ပြေတယ်။
  • GPT-5 က ပိုပြီး အဆင့်လိုက် ပုံစံ ("ဒါက အပိုင်း 1... အခုတော့ အပိုင်း 2...") ကို သဘောကျတယ်၊ ငယ်ရွယ်သူတွေအတွက် ပိုကောင်းပေမယ့် အလိုအလျောက်ပိုက်လိုင်းတွေမှာ နည်းနည်းအနှောင့်အယှက်ဖြစ်တယ်။

စဉ်းစားမှုမုဒ်နှင့် အတွေးအခေါ်အနက်အမြက်

မော်ဒယ်နှစ်မျိုးစလုံးက "နက်ရှိုင်းတဲ့အတွေးအခေါ်" သို့မဟုတ် အတွေးအခေါ်မုဒ်တစ်မျိုးကို စျေးကွက်ထဲမှာ ထုတ်ဖော်ပြောဆိုပါတယ်။

ငါ့ စမ်းသပ်မှုတွေမှာ:

  • Turning on reasoning mode for GPT-5 (where available) improved complex bug‑fix success rate by ~10–15 percentage points, but also:
    • increased latency ~1.5–2×,
    • and raised token usage similarly.
  • GLM-4.7's "slow / deep" style prompting (explicitly telling it to think in steps, check hypotheses, and re‑read code) also helped, but the gains were smaller: maybe 5–8 percentage points improvement on the trickiest tasks.

If you care about maximum reasoning for product decisions or multi‑step planning, GPT-5's top tier still feels ahead. If you care about good-enough reasoning at sane cost, GLM-4.7 holds its own.

Real-World Coding Performance

Here's where the GLM-4.7 vs GPT-5 for coding comparison gets concrete.

Multi-file refactoring

I gave both models the same scenario:

  • A small TypeScript monorepo (~60 files).
  • Goal: extract a shared analytics helper and remove duplicate logic in 4 services.

Results:

  • GPT-5:
    • Correctly identified all 4 target areas.
    • Proposed a very clean API design.
    • But its patch missed 2 imports and one subtle type mismatch.
  • GLM-4.7:
    • Found 3/4 duplication spots on its own.
    • Needed a nudge to catch the last one.
    • Outputted patches that compiled on the first try more often.

Time to "green tests" after 2–3 back‑and‑forth iterations:

  • GPT-5: ~22 minutes average (including install + tests).
  • GLM-4.7: ~24 minutes.

တကယ်လား? အဲဒါက မျှမစ်ပါတယ်။ နှစ်ခုစလုံးကို refactor ကူညီသူအဖြစ် အသုံးပြုနိုင်ပါတယ်။ GPT-5 က ဒီဇိုင်းအရသာကောင်းတဲ့ အကြီးတန်း developer လိုခံစားရပြီး GLM-4.7 က မြန်ဆန်ပြီး အထူးဂရုစိုက်တဲ့ အလယ်အလတ် developer လိုခံစားရပါတယ်၊ အမျိုးအစားတွေကို နှစ်ခါစစ်တဲ့သူ။

Bug-fixing loops

သေးငယ်တဲ့ SWE-ပုံစံ bug အလုပ်တွေအပေါ်မှာ၊ loop လုပ်တဲ့ အကြိမ်တွေမှာ မော်ဒယ်တစ်ခုချင်းစီ ဘယ်လိုပြုမူမှုရှိကြောင်း ကြည့်ရှုခဲ့တယ်:

  1. ဖြေရှင်းနည်း တစ်ခုတင်ပြပါ။
  2. စမ်းသပ်မှုတွေ ဆောင်ရွက်ပါ။
  3. အမှားဖြစ်မှုများကိုဖတ်ပါ။
  4. နောက်တစ်ခါ ကြိုးစားပါ။

မြင်ရတဲ့ပုံစံများ:

  • GPT-5:
    • Python traceback အရှည်ရှည်တွေကို အကောင်းဆုံး ဖျော်ဖြေရန်။
    • နောက်ထပ် မလွဲမှားသော ပတ်ချ်တစ်ခုတည်းကို ထပ်တလဲလဲ မလုပ်တော့။
    • အများအားဖြင့် 2–3 loops အတွင်း ပေါင်းစပ်ခဲ့သည်။
  • GLM-4.7:
    • တစ်ခါတစ်ရံ မှားယွင်းနေသော ယူဆချက်တစ်ခုကို ထပ်တလဲလဲ လုပ်သည်။
    • ဒါပေမယ့် ကျွန်တော် "ယခင် အတွေးအခေါ်မှားနေတယ်လို့ ယူဆပါ၊ အခြားနည်းလမ်း တစ်ခုကို တင်ပြပါ" လို့ ပြောလိုက်တော့ အဲဒါထဲက လွတ်သွားတယ်။
    • အခက်အခဲအမြင့်ဆုံး bugs များအတွက် ပျမ်းမျှအားဖြင့် 3–4 loops လိုအပ်သည်။

စမ်းသပ်မှုဖန်တီးမှု အရည်အသွေး

bug တစ်ခုကို ပြင်ဆင်မည်မီ စမ်းသပ်မှုများ ဖန်တီးပေးရန် နှစ်ခုစလုံးကို မေးမြန်းခဲ့သည် (အံ့ဖွယ်အောင်မြင်သော လှည့်ကွက်တစ်ခု):

  • Python + pytest အတွက်:
    • GPT-5 သည် စမ်းသပ်မှုများကို ပိုမိုဖော်ပြချက်အပြည့်အဝဖြင့် ပြုလုပ်ပြီး ကိန်းဂဏန်းဖြင့် ကိန်းသတ်မှတ်မှုများကို ပိုမိုကောင်းမွန်စွာ ပြုလုပ်သည်။
    • GLM-4.7 သည် စမ်းသပ်မှုများကို အနည်းငယ် ရိုးရှင်းစေသော်လည်း စာလုံးပေါင်းမှားချက်များကို နည်းပါးစေသည်။
  • TypeScript + Jest အတွက်:
    • နှစ်ခုစလုံး အဆင်ပြေသော်လည်း GPT-5 သည် သင်ပေးသော နမူနာအနည်းငယ်ဖြင့် စီမံခန့်ခွဲမှုအလေ့အကျင့်များ (အမည်ပေးခြင်း၊ ဖိုင်တွဲဖွဲ့စည်းမှု) ကိုပိုမိုကောင်းမွန်စွာ အတုယူနိုင်သည်။

သင့်အတွက် GLM-4.7 နှင့် GPT-5 ကို ကိုးကားရေးသားရန် အဓိကသုံးသော အထူးသဖြင့်:

  • GPT-5: အမြင့်ဆုံးစွမ်းရည်ရှိပြီး အစီအစဉ်ရေးခြင်းအားဖြင့် ပိုမိုကောင်းမွန်ပြီး "အလွန်မိုက်သော ထပ်ခါထပ်ခါလုပ်" ချိုးကို နည်းပါးစေသည်။
  • GLM-4.7: ထုတ်ကုန်နှင့် ကုန်ကျစရိတ်များကို သင့်လျော်စွာ အစီအစဉ်ရေးရာများနှင့် ဂဏန်းစိစစ်မှုများအတွက် အလွန်ကောင်းမွန်သည်။

GLM-4.7 ကိုရွေးချယ်ရန်အခါ

ကုန်ကျစရိတ်ကို အနိမ့်ထားရန်လိုအပ်သည့် အမှုအခင်းများ

သင်သည် လွတ်လပ်သူ အခွန်ရှင်းရေး၊ အေးဂျင်စီသေးသေးလေး သို့မဟုတ် ဘေးကစား စီမံကိန်းလုပ်နေသော အခါတွင် GLM-4.7 နှင့် GPT-5 အနက် အဓိကပြောရင် ကျယ်ကျယ်လောလောအတိုင်း: တစ်အလုပ်စီကို ဖြေရှင်းရန် ဒေါ်လာများ။

ကျွန်ုပ်၏မှတ်တမ်းများမှ:

  • ကိုးကားရေးသားရန် GLM-4.7 သည် GPT-5 ၏ 40–60% ဖိုးတွင် 80–90% အရည်အသွေးဖြစ်သည်။

ဤအမြတ်အစွန်း သင့်လျော်သည်:

  • နောက်ခံကုဒ်ပြုပြင်ထိန်းသိမ်းမှု,
  • အစုလိုက်ပြုပြင်ပြောင်းလဲခြင်း,
  • စာရွက်စာတမ်းများ ဖန်တီးခြင်း,
  • စမ်းသပ်မှုများ အစုလိုက်ဖန်တီးခြင်း။

ကိုယ်ပိုင်ဆာဗာတွင် လုပ်ဆောင်မှုလိုအပ်ပါက

သင့်အဖွဲ့သို့မဟုတ် ဖောက်သည်များသည်:

  • ကုဒ်ကို တတိယပါတီ cloud များသို့ မပို့နိုင်ပါက၊ သို့မဟုတ်
  • အရာအားလုံးကို ကိုယ်ပိုင် ဖွံ့ဖြိုးမှုတွင် လည်ပတ်လိုပါက၊

ထို့နောက် GLM-4.7 ၏ ကိုယ်ပိုင်စတင်ရေးနိုင်ခြင်းဇာတ်ကြောင်းသည် ဆုံးဖြတ်ချက်ကို သတ်မှတ်ပေးသော အချက်ဖြစ်သည်။

အလုပ်လုပ်ရန် ပိုမိုခက်ခဲပါသလား။ ဟုတ်ကဲ့။ သင်သည် GPUများ၊ ခန့်မှန်းရေး serverများ၊ စောင့်ကြည့်မှုနှင့် အရွယ်အစားချဲ့ခြင်းတို့နှင့် ရင်ဆိုင်ရမည်ဖြစ်သည်။ သို့သော် သင်၏ token အရွယ်အစားသည် လုံလောက်ပြီး လုံခြုံရေး/ကိုယ်ရေးအချက်အလက်များသည် မတိုင်မီဖြစ်ပါက ၎င်းသည် အလွန် လိုက်ဖက်သော ရွေးချယ်မှုဖြစ်သည်။

တရုတ်ဘာသာစုပေါင်းများသော ကုဒ်အခြေခံများ

သင်၏ ကုဒ်အခြေခံက:

  • မှတ်ချက်များ၊ အပြောင်းအလဲအမည်များ သို့မဟုတ် ကွန်မစ်မက်ဆေ့ခ်ျများကို တရုတ်ဘာသာဖြင့် ရှိပြီး၊ သို့မဟုတ်
  • သင့်အသင်းက တရုတ်ဘာသာဖြင့် အစဉ်အလာရှိသော အကြောင်းကြောင်းများကို အင်္ဂလိပ်ဘာသာဖြင့် ပထမဆုံး အစီရင်ခံပါက၊

GLM-4.7 သည် လက်ရှိတွင် အနေအထားအားဖြင့် ထိုးဖောက်မှုရှိသည်။

ကျွန်ုပ်၏ တရုတ်–အင်္ဂလိပ်စုပေါင်း repo စမ်းသပ်မှုများတွင်:

  • ၎င်းသည် တရုတ်ဘာသာဖြင့် အမှားအစီရင်ခံချက်များကို အနီးကပ် နားလည်နိုင်ခဲ့သည်။
  • GPT-5 သည် အားလုံးကို ဘာသာပြန်ပြီးနောက် ဖမ်းဆီးနိုင်ခဲ့သော်လည်း ၎င်းမှာ အပိုလုပ်ငန်းဖြစ်သည်။

ထို့ကြောင့် သင်သည် တရုတ်ဘာသာဖြင့် အရေးပါသော သို့မဟုတ် နှစ်မျိုးလုံးသော ပတ်ဝန်းကျင်တွင် လည်ပတ်နေပါက GLM-4.7 သည် နေ့စဉ် dev အသက်တာတွင် ပိုမို သဘာဝကျစွာ ထိတွေ့ပါသည်။

GPT-5 ကို ဘယ်အခါရွေးချယ်ရမည်

အဆင့်မြင့်အဖွဲ့အစည်း

GLM-4.7 နှင့် GPT-5 အကြား အဓိကမဟုတ်သော နည်းပညာဆိုင်ရာ အကြောင်းအရာမှာ အဖွဲ့အစည်းဖြစ်သည်။

GPT-5 သည် လက်ရှိတွင် အနိုင်ရသည်။

  • တတိယပါတီ အထောက်အပံ့များ၏ အနက်ရှိုင်းမှု၊
  • ၎င်း၏ API အတွက် အသုံးပြုရန် အသင့်အထိန်းအကူများနှင့် စက်ရုံကိရိယာများ၊
  • အသိုင်းအဝိုင်းနမူနာများ၊ အထောက်အထားများနှင့် အမှားပြုပြင်ရေး လမ်းညွှန်ချက်များ။

နည်းပညာရပ်များ၊ ပလပ်ဂင်များ သို့မဟုတ် အဘယ်သူမျှ မသိသော ပလက်ဖောင်းများနှင့် တွဲဖက်အသုံးပြုရန် လိုအပ်သော အရာများကို တည်ဆောက်နေပါက GPT-5 သည် အလွယ်ဆုံးသော လမ်းဖြစ်သည်။

အင်္ဂလိပ်ဘာသာကို ဦးစားပေးသော လုပ်ငန်းစဉ်များ

အင်္ဂလိပ်ဘာသာကို ဦးစားပေးသော:

  • ထုတ်ကုန် သတ်မှတ်ချက်များ၊
  • UX မက္ခရာ၊
  • မဟာဗျူဟာစာရွက်စာတမ်းများ၊
  • ရုပ်ရှင်အားဖြင့် တွေးခေါ်မှုလုပ်ငန်းများ၊

GPT-5 သည် ပိုမို ပြီးပြည့်စုံမှုရှိသည်။

ကျွန်ုပ်၏ စမ်းသပ်မှုများတွင် ၎င်း၏:

  • အထူးပြုရေးသားမှု၊
  • အကြောင်းပြချက်ခွဲခြမ်းစိတ်ဖြာခြင်း၊
  • နဲ့ ရှင်းပြချက်အရည်အသွေး

အပြင်ဆင်မှုမရှိဘဲလျှောက်လှမ်းနိုင်သောအရာများဖြစ်ခဲ့သည်။ GLM-4.7 သည်လည်း ဒီအရာကို လုပ်နိုင်ပါတယ်၊ ဒါပေမယ့် တိုန်းနှင့်ဖွဲ့စည်းမှုကို မကြာခဏ ပြင်ဆင်နေခဲ့သည်။

အများဆုံး တည်ငြိမ်မှုလိုအပ်ချက်များ

သင့်ဦးစားပေးချက်များမှာ:

  • အလွန်သာမန်သော အချိန်နှင့်တပြေးညီဖြစ်မှု၊
  • ပညာပညာရှင်အထွေထွေကို အလွန်နည်းသောမြင်ဆန်းခြင်းလက်ခံနိုင်မှု၊
  • နဲ့ vendor SLA များအားကောင်းစွာထိန်းသိမ်းခြင်းဖြစ်ပါက၊

GPT-5 သည်လက်ရှိအချိန်အတွက် ပိုမိုလုံခြုံသောရွေးချယ်မှုဖြစ်သည်။

ရှည်လျားသော အေးဂျင့်များမှာ တစ်ခုတည်းသောထူးခြားသောမြင်ဆန်းမှုကြောင့် အဖြစ်အပျက်အတောင့်အယှက်ဖြစ်နိုင်သောနေရာများတွင် (အဆောက်အအုံများကိုမှားယွင်းစွာပြုပြင်ခြင်းကဲ့သို့) GPT-5 ၏ ကာကွယ်မှုများနှင့်စောင့်ကြည့်မှုစနစ်သည် ပိုမိုရင့်ကျက်သောဟန်ရှိသည်။ GLM-4.7 သည် ကျွန်ုပ်၏စမ်းသပ်မှုများတွင်ကောင်းမွန်စွာပြုမူခဲ့သော်လည်း ပတ်ဝန်းကျင်စနစ် (အကဲဖြတ်ခြင်းများ၊ ကာကွယ်မှုများ၊ အထုပ်တွင်ရှိသောကိရိယာများ) သည် ယခုချိန်တွင် အများပြည်သူကသုံးစွဲထားသောအထိ ကြိုးစားမှုမရှိသေးပါ။

ပိုကြီးမားသောရုပ်ပုံ: မော်ဒယ်များသည် ကုန်ပစ္စည်းဖြစ်လာသည်

အကွာအဝေးမှကြည့်လိုက်ရင်၊ GLM-4.7 နှင့် GPT-5 ၏ အထူးစိတ်ဝင်စားစရာအပိုင်းမဟုတ်ပါ။ ဒါဟာ နေ့စဉ်အလုပ်များအတွက် သူတို့နှစ်ယောက်လုံးက လုံလောက်သောအရာဖြစ်ကြောင်းဖြစ်ပါတယ်။

အခုမှာ အရေးကြီးတာက:

  • ဖြေရှင်းလိုက်သောပြဿနာတစ်ခုနှုန်းစျေးနှုန်း (မဟုတ်ပါက token တစ်ခုနှုန်း)။
  • မော်ဒယ်နှင့် ပတ်ဝန်းကျင်၊ ကိရိယာများ၊ မှတ်တမ်းများ၊ ပြန်ကြိုးစားမှုများ၊ လွှမ်းခြုံမှုပုံစံများ။
  • သင့်ဘာသာစကား+ဌာနအတွက် ကိုက်ညီမှု (အင်္ဂလိပ်-ပထမ SaaS နှင့် နှစ်ဘာသာကုဒ်အခြေပြုထားသော vs အတွင်းပိုင်းကိရိယာများ)။

ဒီစမ်းသပ်မှုများပြီးနောက် ကျွန်ုပ်၏ ပုံမှန်အယူအဆမှာ:

  • အများဆုံးဆင်ခြင်မှု အရည်အသွေး၊ ပြုပြင်ထားသော အင်္ဂလိပ်ထုတ်ကုန်နှင့် ပိုမိုချောမွေ့သော ပတ်ဝန်းကျင်ကူညီမှုလိုအပ်ပါက GPT-5 ကိုသုံးပါ။
  • ထွက်ကုန်နှုန်းနှင့်ကုန်ကျစရိတ်ကို ပိုမိုဂရုစိုက်ပါက သို့မဟုတ် သင်အိမ်တွင်းသုံးရန်နှင့် အကောင်းဆုံးတရုတ်စွမ်းဆောင်ရည်လိုအပ်ပါက GLM-4.7 ကိုသုံးပါ။

တကယ်ပြောရရင်? သင့်အတွက် အမျိုးမျိုးရောစပ်ရန် မကြောက်ပါနဲ့။

အခုအခါ ကျွန်ုပ်ကိုယ်တိုင်အသုံးပြုနေတဲ့ stack:

  • Specs, product ဆုံးဖြတ်ချက်များနှင့် ဖောက်သည်မျက်နှာပုံစံရေးသားခြင်း → GPT-5။
  • စုစုပေါင်းကုဒ်ရေးသားမှု အေးဂျင့်များ၊ စမ်းသပ်မှုထုတ်လုပ်ခြင်းနှင့် ပြုပြင်ထိန်းသိမ်းမှုလုပ်ငန်းများ → GLM-4.7။

သင်စတင်နေတဲ့အချိန်မှာ ဒီအတိုင်းလုပ်ဖို့ အကြံပြုပါရစေ:

  1. "ကျွန်ုပ်၏ repo တွင် အေးဂျင့်ဖြင့် မအောင်မြင်သော စမ်းသပ်မှုကိုပြင်ဆင်ပါ" ဆိုတဲ့ workflow တစ်ခုကို ရွေးပါ။
  2. GLM-4.7 နှင့် GPT-5 ကို တူညီသော prompts နှင့် ကိရိယာများဖြင့် ၁၀ ကြိမ်စီ လုပ်ဆောင်ပါ။
  3. အောင်မြင်မှုနှုန်း, စုစုပေါင်း tokens, ကုန်ကျစရိတ်, နှင့် ရလဒ်များကိုဖတ်ရင်း ဘယ်လောက်စိတ်ပျက်ရသလဲဆိုတာကို မှတ်သားပါ။

ဒီသေးငယ်တဲ့ စမ်းသပ်မှုက သင့်ဘဝအတွက် GLM-4.7 နှင့် GPT-5 အကြောင်းကို မည်သည့် စျေးကွက်စာမျက်နှာ၊ ဘလော့ဂ်ပို့စ်မဆို ထက်ပိုသိစေပါလိမ့်မယ်။

ထို့နောက် အလုပ်ကို တကယ်ပို့သောအရာကို ကိုင်ထားပါ၊ အလှဆင်ထားသော စံချိန်ဇယားနဲ့မဟုတ်ပါဘူး။

သင်အတွက် အကောင်းဆုံးမော်ဒယ်က သင့် workflow ပေါ်မှာ မူတည်ပါတယ်၊ leaderboard ပေါ်မှာ မဟုတ်ပါဘူး။

ဒီစမ်းသပ်မှုအားလုံးပြီးပါက မနှစ်မြို့ဖွယ်ရာ အပြစ်ကတော့ ဒီလိုပါ: ပုဂ္ဂလိကနှင့် အထင်ကရ workflows များအတွက် မော်ဒယ်ကိုယ်တိုင်ထက် အေးဂျင့်ဒီဇိုင်းက ပိုအရေးပါပါတယ်။

ဒါဟာ ကျွန်ုပ်တို့ Macaron မှာ တည်ဆောက်နေတဲ့အရာပါ။ ကျွန်ုပ်တို့က တစ်ခုထဲသော “အကောင်းဆုံး” မော်ဒယ်ကို မထီမဲ့ပါဘူး။ ကျွန်ုပ်တို့က သင်ဘယ်လိုလုပ်ကိုင်တာ, သင်ဘာကို ဂရုစိုက်တာ, သင်ဘယ်လိုဖြတ်သန်းတာနဲ့ ဘာတွေ ပျက်ကျလေ့ရှိတာကို တကယ်လေ့လာတဲ့ မှတ်ဉာဏ်စနစ်နဲ့ အင်အားအရှိဆုံးလက်ရှိမော်ဒယ်များကို ပေါင်းစပ်ထားပါတယ်။

အပြုသဘောဆောင်တဲ့ အရာကို အတွေ့အကြုံရချင်ရင်၊ ကိုယ်တိုင်စမ်းသပ်ကြည့်နိုင်ပါတယ်။ [Macaron အခမဲ့စမ်းသပ်ရန် →]

Nora is the Head of Growth at Macaron. Over the past two years, she has focused on AI product growth, successfully leading multiple products from 0 to 1. She possesses extensive experience in growth strategies.

Related articles

GLM-4.7 ဆိုတာဘာလဲ။ အင်္ဂါရပ်များ၊ အခြေအနေ ဝင်းဒိုး၊ အကောင်းဆုံး အသုံးပြုမှုနည်းလမ်းများ (၂၀၂၆ လမ်းညွှန်)
GLM-4.7 ဆိုတာဘာလဲ။ အင်္ဂါရပ်များ၊ အခြေအနေ ဝင်းဒိုး၊ အကောင်းဆုံး အသုံးပြုမှုနည်းလမ်းများ (၂၀၂၆ လမ်းညွှန်)

2025-12-25

အတိမ်အထားမဲ့မော်ဒယ်များမှ အလျင်အမြန်တုန့်ပြန်မှုရှိသော ကိုယ်စားလှယ်များသို့: Tinker နှင့် Mind Lab တွင် ဆန်းသစ်တီထွင်မှုများ
အတိမ်အထားမဲ့မော်ဒယ်များမှ အလျင်အမြန်တုန့်ပြန်မှုရှိသော ကိုယ်စားလှယ်များသို့: Tinker နှင့် Mind Lab တွင် ဆန်းသစ်တီထွင်မှုများ

2025-12-12

GPT‑5.2: အဓိကတိုးတက်မှုများ၊ Gemini 3 နှင့်သုံးသပ်ချက်များနှင့် ဆက်စပ်မှုများ
GPT‑5.2: အဓိကတိုးတက်မှုများ၊ Gemini 3 နှင့်သုံးသပ်ချက်များနှင့် ဆက်စပ်မှုများ

2025-12-11

Mistral ရဲ့ Devstral 2: လွတ်လပ်သော AI ကုဒ်ရေးခြင်းအတွက် စွယ်စုံ AI ကမ္ဘာကြီး
Mistral ရဲ့ Devstral 2: လွတ်လပ်သော AI ကုဒ်ရေးခြင်းအတွက် စွယ်စုံ AI ကမ္ဘာကြီး

2025-12-10

Anthropic ၏ IPO ဂန္ထဝင်နှင့် အနာဂတ်ရှုခင်းများ
Anthropic ၏ IPO ဂန္ထဝင်နှင့် အနာဂတ်ရှုခင်းများ

2025-12-04

OpenAI နှင့် Thrive ရဲ့ မိတ်ဖက်ဆက်ဆံရေးနဲ့ တရုတ် LLM များက စီးပွားရေးလုပ်ငန်း AI ပေါင်းစည်းမှုကို ဘယ်လိုပြောင်းလဲနေသည်
OpenAI နှင့် Thrive ရဲ့ မိတ်ဖက်ဆက်ဆံရေးနဲ့ တရုတ် LLM များက စီးပွားရေးလုပ်ငန်း AI ပေါင်းစည်းမှုကို ဘယ်လိုပြောင်းလဲနေသည်

2025-12-03

အတိုင်းအတာဖြင့် အတွေ့အကြုံမှ အာရုံကြောဆိုင်ရာ ဉာဏ်ပညာသို့: အီလီယာ ဆူစကီဗားရ်၏ ရှုထောင့်နှင့် မက်ကာရွန်၏ လမ်းကြောင်း
အတိုင်းအတာဖြင့် အတွေ့အကြုံမှ အာရုံကြောဆိုင်ရာ ဉာဏ်ပညာသို့: အီလီယာ ဆူစကီဗားရ်၏ ရှုထောင့်နှင့် မက်ကာရွန်၏ လမ်းကြောင်း

2025-12-03

ChatGPT's 3 နှစ်ပတ်လည် အထိမ်းအမှတ် လက်ဆောင် – DeepSeek V3.2 စီးရီး GPT-5 နှင့် Gemini ကို စိန်ခေါ်
ChatGPT's 3 နှစ်ပတ်လည် အထိမ်းအမှတ် လက်ဆောင် – DeepSeek V3.2 စီးရီး GPT-5 နှင့် Gemini ကို စိန်ခေါ်

2025-12-01

Kimi K2: Open-Source LLM သည် ChatGPT-5.1 နှင့် Claude 4.5 နှင့် အတွေးအခေါ်တွင် ပြိုင်ဆိုင်
Kimi K2: Open-Source LLM သည် ChatGPT-5.1 နှင့် Claude 4.5 နှင့် အတွေးအခေါ်တွင် ပြိုင်ဆိုင်

2025-11-28

Apply to become Macaron's first friends