
ရေးသားသူ- Boxu Li
ခေတ်သစ်အခြေခံမော်ဒယ်များမှာ အထွေထွေဗဟုသုတနှင့် ယူဆခြင်းစွမ်းရည်များကို ထူးခြားစွာ ပြသပါသည်။ သို့သော်လည်း၊ ဤအခြေခံမော်ဒယ်များသည် အသုံးပြုသူတစ်ဦးချင်းစီအတွက် တိုက်ရိုက်အသုံးပြုရန် မဆင်သင့်ပါ။ ၎င်းများသည် သင်နှင့် ပတ်သက်သော အခြေအနေများကို မပါဝင်သောကြောင့် နိုင်ငံခြားအခြေအနေများတွင် တကယ့်ဖန်တီးမှုဖြေရှင်းမှုတွင် ပြဿနာရှိသည်။ ဥပမာ၊ သုတေသနပညာရှင်များက ရှာဖွေတွေ့ရှိခဲ့သည်မှာ အဆင့်မြင့်ဘာသာစကားမော်ဒယ်များသည် ဖန်တီးမှုဖြေရှင်းရန် လိုအပ်သောလုပ်ငန်းများတွင် မရောမောဖြစ်ကြောင်း – အကောင်းဆုံးထက် ဆယ်ဆပိုပြီးအဆင့်များ လိုအပ်ပြီး လူ့စွမ်းဆောင်ရည်ထက် အလွန်နိမ့်ပါသည်၊ အကြောင်းပြချက်မှာ ယုံကြည်စိတ်ချမှုရှိသော စဉ်းစားမှုကို မလိုက်နာခြင်း ဖြစ်သည်။ ပျမ်းမျှအားဖြင့် ယနေ့အခါ LMs များသည် ဖန်တီးမှုခေါင်းဆောင်မှုစံချိန်တွင် အကူအညီမပါဘဲ ၁၅% ခန့်သာ ရရှိခဲ့ပြီး၊ ၎င်းတို့၏ ဖန်တီးနိုင်စွမ်းကို ကန့်သတ်ထားကြောင်း အထောက်အထားပြခဲ့သည်။ ဤဖန်တီးမှုလမ်းကြောင်းသည် ထူးခြားသောဖြစ်သည်၊ အကြောင်းမှာ ဖန်တီးမှုအတတ်ပညာ - သတ်မှတ်ထားသည့်ပုံစံများထက် ကျော်လွန်ပြီး ပြောင်းလဲနိုင်မှုနှင့် ဖန်တီးနိုင်မှုသည် ဉာဏ်ရည်၏ အရေးကြီးသော အစိတ်အပိုင်းဟု အသိအမှတ်ပြုထားသော်လည်း၊ အများစုသော AI စံချိန်များမှ အများအားဖြင့် မဖြည့်ဆည်းနိုင်သေးပါ။
ဤကန့်သတ်ချက်များကို ကျော်လွှားရန်အတွက် AI သုတေသန အသိုင်းအဝိုင်းသည် မော်ဒယ်များကို လူ့စွမ်းရည်နှင့် ပိုမိုတူညီစွာ စဉ်းစားလုပ်ဆောင်ရန် နည်းလမ်းများကို စူးစမ်းလျက်ရှိသည်။ တစ်ခုသော ရှေ့တိုးမှုမှာ 2022 ခုနှစ်တွင် Shunyu Yao စသည်တို့မှ စတင်မိတ်ဆက်ခဲ့သော ReAct ပုံစံဖြစ်သည်။ ReAct သည် 「Reason+Act」 ဆိုသည်မှာ မော်ဒယ်၏ အတွင်းစဉ်းစားမှု လုပ်ငန်းစဉ်နှင့် ပြင်ပလုပ်ဆောင်မှုများကို အလှည့်ကျပြုလုပ်ခြင်းဖြစ်သည်။ အဖြေကို တည်ငြိမ်သော မှတ်ဉာဏ်မှသာ ရှာဖွေခြင်း သို့မဟုတ် လုပ်ဆောင်မှုများကို လက်လွှတ်မျက်ကန်းသလို ပြုလုပ်ခြင်းသာမက၊ ReAct ကိုယ်စားလှယ်သည် နှစ်ခုလုံးကို ပြုလုပ်သည် - ပြဿနာတစ်ခုကို စဉ်းစားပြီး ကိရိယာများ သို့မဟုတ် ပတ်ဝန်းကျင်များနှင့် လှည့်ပတ်လုပ်ဆောင်သည်။ ဤပူးတွဲနည်းလမ်းသည် AI ကို အချက်အလက်အသစ်များကို စုဆောင်းခြင်းနှင့် ၎င်း၏ စီမံချက်ကို ချက်ချင်း ပြင်ဆင်ရန် ခွင့်ပြုသည်။ Yao နှင့် သူ၏ အဖွဲ့ဝင်များက ReAct နည်းလမ်းသည် စဉ်းစားမှု သို့မဟုတ် လုပ်ဆောင်မှု တစ်ခုတည်းကို မှီခိုသည့် နည်းလမ်းများထက် အစဉ်မပြတ် အထူးထူးခြားတယ်ဆိုတာ ပြထားသည်။ စဉ်းစားမှုနှင့် လုပ်ဆောင်မှုကို ခိုင်မာစွာ ပေါင်းစပ်ခြင်းဖြင့်၊ မော်ဒယ်သည် လူသားများနှင့် ပိုမိုတူညီသော တာဝန်ဆောင်ရွက်မှု လမ်းကြောင်းများကို ထုတ်ပေးပြီး ၎င်း၏ အဓိပ္ပာယ်ဖွင့်ဆိုမှုနှင့် ထိရောက်မှုကို တိုးတက်စေသည်။
Macaron ၏ ပလက်ဖောင်းကို အကောင်းဆုံးအခြေခံမော်ဒယ်များပေါ်တွင် တည်ဆောက်ထားသည့် ကိုယ်ပိုင်ထူးထူးခြားခြားပြုလုပ်ခြင်းအလွှာအဖြစ် တွေးခေါ်နိုင်သည်။ အစကတည်းက ကြီးမားသော AI တစ်ခုတည်းကို တည်ဆောက်ခြင်းမဟုတ်ဘဲ၊ Macaron သည် ရှိပြီးသားကြီးမားသောမော်ဒယ်များ၏ ဉာဏ်ပညာနှင့် ဘာသာစကားကျွမ်းကျင်မှုကို အသုံးပြုပြီး ကိုယ်ပိုင်သုံးစွဲမှုအတွက် ကိုယ်တိုင်သင့်လျော်အောင် ချိန်ညှိသည်။ စနစ်သည် ပေးထားသော တာဝန်တစ်ခုအတွက် အကောင်းဆုံးဖြစ်သော မော်ဒယ် သို့မဟုတ် မော်ဒယ်များပေါင်းစပ်မှုကို အသုံးပြုပြီး၊ သင့်ကိုယ်ပိုင်သုံးစွဲမှု ပုံစံအရ ၎င်း၏ အပြုအမူကို ထပ်မံချိန်ညှိသည်။
အမှန်တကယ်မှာတော့ Macaron က ဉာဏ်ရည်ရှိတဲ့ စီမံခန့်ခွဲမှု အလွှာတစ်ခုအနေနဲ့ လုပ်ဆောင်ပါတယ်။ အဲဒါက မင်းရဲ့ အပြုအမူတွေ နဲ့ အလိုဆန္ဒတွေကနေ ဆက်လက်လေ့လာပြီး မင်းကို ပိုမိုကောင်းမွန်အောင် ဝန်ဆောင်မှုပေးဖို့ ကိုယ့်ကိုယ်ကို အမြဲပြင်ဆင်နေပါတယ်။ ဒီဟာကို မင်းရဲ့စတိုင်ကို ဖြည်းဖြည်းချင်း လေ့လာသွားမယ့် မင်းရဲ့ ကိုယ်ပိုင် GPT ဗားရှင်း တစ်ခုလို ဖြစ်နိုင်ပါတယ်။ Macaron က အမိမြေ reinforcement learning ပလက်ဖောင်းကို အသုံးပြုပြီး အထူးပြင်ဆင်မှုတွေကို အရွယ်အစားအလိုက် ရရှိအောင် လုပ်ဆောင်ပါတယ်။ reinforcement learning အထူးသဖြင့် ပုံမှန် သင်ကြားမှု ရှုပ်ထွေးမှုမှာ Macaron ရဲ့ AI က တကယ့်လူသုံးမှုတုံ့ပြန်မှု နဲ့ ဒေတာတွေကို အသုံးပြုပြီး လေ့လာပါတယ်။ အထူးသဖြင့် အတွေ့အကြုံကနေ လေ့လာခြင်းဖြင့် Macaron ရဲ့ AI က နေ့စဉ်အသုံးပြုမှုနဲ့အတူ တိုးတက်လာပြီး အချိန်တိုင်းမှာ အသုံးပြုသူတစ်ဦးချင်းစီရဲ့ လိုအပ်ချက်များကို ပိုမိုနားလည်လာပါတယ်။
Macaron ၏ခံယူချက်များထဲမှ တစ်ခုမှာ နက်ရှိုင်းသောမှတ်ဉာဏ်နှင့် စိတ်ခံစားမှုဗဟုသုတကို အာရုံစိုက်ခြင်းဖြစ်သည်။ အကြောင်းအရာကို မေ့လျော့သွားသော သို့မဟုတ် အသံထွက်ကို ဖမ်းမိခြင်းမရှိသော ထုံးစံနာမည်ကြီး chatbot များနှင့် မတူဘဲ Macaron သည် မင်းကို ယုံကြည်ရသော သူငယ်ချင်းတစ်ဦးကဲ့သို့ နူးညံ့သော ရေရှည်နားလည်မှုတစ်ခု ဖွံ့ဖြိုးရန် အတွက် ဖန်တီးထားသည်။ အထူးပြု ဦးတည်မှုနှင့် အဆက်မပြတ်လေ့လာမှုများမှတဆင့် ၎င်းသည် မင်း၏ ကြိုက်နှစ်သက်မှုများ၊ အလေ့အထများ၊ နှင့် စိတ်ခံစားမှု အရိပ်အမြွက်များကို နက်ရှိုင်းသော မှတ်ဉာဏ်တစ်ခု ဖန်တီးပေးသည်။ ၎င်းက Macaron ကို စိတ်ခံစားမှုဗဟုသုတရှိသော၊ အကြောင်းအရာကို နားလည်သော အပြောအဆိုများကို ပုဂ္ဂိုလ်ရေးအဆင့်အတန်းတွင် အသုံးပြုသူများနှင့် ကိုက်ညီစေသည်။
ဥပမာအားဖြင့် မင်းစိတ်ဖိစီးနေချိန်မှာ အစာချက်နည်းများကို မကြာခဏမေးလေ့ရှိရင်၊ Macaron က နူးညံ့စွာအကြံပေးတဲ့အပြင် အစားအစာချက်နည်းကိုပါ ပေးနိုင်ပါတယ်။ မင်းဟာ သက်သတ်လွတ်အစားအစာကို ကြိုက်ကြောင်း သို့မဟုတ် အခြားအစားအစာမတည့်မှုရှိကြောင်း ပြောဖူးတာကိုလည်း Macaron မှတ်သားထားနိုင်ပါတယ်။ ဒီလိုကိုယ်ပိုင်နားလည်မှုတွေက မင်းမေးတဲ့အရာကိုသာမက မင်းဘာကြောင့်မေးတာကိုပါ သိရှိနိုင်တာကြောင့် ပိုမိုလူသားဆန်ပြီး ထောက်ခံမှုရှိတဲ့ အတွေ့အကြုံကို ပေးစွမ်းနိုင်ပါတယ်။ အများအပြား AI ပလက်ဖောင်းတွေ ဒီနေရာမှာ အခက်အခဲတွေ့ကြပါတယ်။ Macaron က မုဒိမ်းအနေဖြင့် မျက်နှာချင်းဆိုင်နဲ့ နားလည်မှုကို ဦးစားပေးပြီး ချစ်စရာ AI အဖော်လို ဖြစ်လာစေရန် fine-tuning လုပ်ငန်းစဉ်ကို ဦးစားပေးကာ တုံ့ပြန်နေပါတယ်။

ကိုယ်ပိုင် Fine-Tuning အလွှာက တစ်ဦးချင်းစီ၏ ကြိုက်နှစ်သက်မှုများနှင့် ကိုက်ညီအောင် လိုက်လျောပြောင်းလဲပေးသည်။
Macaron ၏အထူးပြောရမည့်ဆန်းသစ်သောအင်္ဂါရပ်များထဲမှတစ်ခုဖြစ်ပြီး၊ ၎င်း၏ပုဂ္ဂိုလ်ရေးချိန်ညှိမှုလုပ်ငန်းစဉ်၏အဓိကရလဒ်တစ်ခုမှာ မင်းရဲ့ပြဿနာများကိုဖြေရှင်းရန်လိုအပ်သောအခါ 「mini-apps」 များကိုတောင်းဆိုချက်အရတီထွင်နိုင်စွမ်းဖြစ်ပါတယ်။ Macaron ကိုတစ်ခုခုလိုအပ်ချက်အတွက်ကူညီပါလို့ပဲမေးလိုက်ပါ၊ ၎င်းက မင်းဟာလက်ထဲမှာလုံးဝအလုပ်မလုပ်ပဲနည်းလမ်းတစ်ခုကိုထူးခြားစွာတီထွင်ပေးပါလိမ့်မယ်။ ဥပမာ၊ 「ငါ့စာသင်အချိန်ဇယားကိုစီစဉ်ဖို့အကူအညီလိုတယ်」 လို့မင်းပြောခဲ့ရင် Macaron က မင်းရဲ့သင်ရိုးညွှန်းတမ်းကိုက်ညီတဲ့ သင်တန်းအကူအညီ mini-app ကိုတီထွင်နိုင်ပါတယ်။ မင်းအစားအစာစာရင်းကိုလိုက်နာချင်တယ်လို့မင်းပြောရင်လည်း ပေါ့ပါးတဲ့ချက်ပြုတ်မှတ်တမ်း app ကိုဖန်တီးနိုင်ပါတယ်။ ဒီအားလုံးဟာအလျင်အမြန်ဖြစ်ပျက်ပါလိမ့်မယ် - ရှည်လျားတဲ့ဖွံ့ဖြိုးတိုးတက်မှုလည်ပတ်မှု သို့မဟုတ် လက်စွဲချက်အင်ဂျင်နီယာလုပ်ရခြင်းလိုအပ်မည်မဟုတ်ပါ။
Macaron ၏ဖန်တီးမှု၊ အခြေအနေနှင့် အခြေခံမော်ဒယ်များ၏ ကျယ်ပြန့်သော ဗဟုသုတတို့ပေါင်းစပ်မှုက ဒီအရာကိုဖြစ်လာစေသည်။ ရိုးရာ AI ဝန်ဆောင်မှုများ သို့မဟုတ် ဖွံ့ဖြိုးရေးပလက်ဖောင်းများသည် စံနမူနာတစ်ခုကို ရှာဖွေရန် သို့မဟုတ် အစီအစဉ်ရေးသားသူတစ်ဦးကို ငှားရန် လိုအပ်နိုင်သည်။ ထိုနည်းတူ မဟုတ်ဘဲ Macaron သည် သင့်ရည်ရွယ်ချက်ကို နက်ရှိုင်းစွာ နားလည်မှုကြောင့် လိုအပ်သလို ထိုလုပ်ဆောင်မှုကို ထုတ်လုပ်နိုင်သည်။ ဒီကစိတ်ကူးမှ အကောင်အထည်ဖော်ခြင်းအထိ လိုအပ်သောအချိန်နှင့် ကြိုးပမ်းမှုကို အလွန်လျှော့ချပေးသည်။
EscapeBench ကဲ့သို့သော သုတေသနများက AI အတွက် တီထွင်ဖန်တီးမှု ပြဿနာများကို ဖြေရှင်းရာတွင် ဘယ်လောက်ခက်ခဲနိုင်သည်ကို ပြသခဲ့ပါတယ်။ EscapeBench သည် အထူးပြုထားသော အခန်းထဲမှ ထွက်ပြေးရန် ကစားရင်း AI ကို ရိုးရိုးရှင်းရှင်းအတိုင်း မစဉ်းစားဘဲ ဆန်းသစ်တဲ့ နည်းလမ်းများကို စဉ်းစားရန် ညွှန်ကြားသော စံပြဖြစ်ပါတယ်။ ဒီလို စံပြတွေမှာ အသုံးပြုနေသော ဘာသာစကား မော်ဒယ်တွေက ပုံမှန်နည်းလမ်းတွေနဲ့ပဲ ကိရိယာတွေကို အသုံးပြုတဲ့အခါမှာ ပိတ်မိသွားပြီး ဆန်းသစ်တဲ့ ဖြေရှင်းမှုတွေကို လွတ်ကျော်သွားတတ်ပါတယ်။ ဒါကတော့ Macaron ရဲ့ ဒီဇိုင်း အားသာချက်ပါပဲ။ EscapeBench စံပြတွေကို ဖြေရှင်းဖို့ EscapeAgent နည်းလမ်းတွေကို လိုက်နာကာ အမြင်ရှေ့ပြိုင်မှု နဲ့ ပြန်လည်စဉ်းစားမှု နည်းလမ်းတွေကို ထည့်သွင်းခြင်းအားဖြင့် Macaron ရဲ့ AI ကို ရှုပ်ထွေးတဲ့ တာဝန်တွေကို ရင်ဆိုင်ရာမှာ ဆန်းသစ်တဲ့ အကြံပေးချက်တွေကို ဖန်တီးနိုင်ပြီး မဖြေရှင်းရသေးတဲ့ ရည်မှန်းချက်တွေကို လတ်ဆတ်စွာ သိမ်းဆည်းထားနိုင်ပါတယ်။
၎င်းရဲ့ reinforcement learning-enhanced fine-tuning ကြောင့် Macaron ကလည်း ပြောင်းလဲမှုတိုင်းကနေ ကြိုးစားမှုတစ်ခုချင်းစီကနေ လေ့လာခြင်းဖြင့် ၎င်းရဲ့ ဖန်တီးမှုကို အဆက်မပြတ် တိုးတက်လာနိုင်တယ်။ အထူးသဖြင့် ဖြေရှင်းမှုလမ်းကြောင်းတစ်ခု မအောင်မြင်ပါက Macaron ရဲ့ အေးဂျင့်ဟာ လူတွေလို ပြန်လည်တွေးတောပြီး ညှိနှိုင်းနိုင်တယ်။ အချိန်ကြာလာရင် နဲ့ အသုံးပြုသူများထောင်ပေါင်းများစွာနဲ့အတူ၊ ဒါဟာ ဒါဟာ post-deployment မှာ ဘာမှ မသင်ရှိတဲ့ AI ထက် အရင်းအမြစ်ပိုပြီး Resourceful နဲ့ ပိုပြီး တိမ်မြှုပ်နိုင်မှုရှိတဲ့ AI ပေါ်လာစေတယ်။

Macaron ဟာ ဘယ်လို AI အေးဂျင့်ထက်မဆို မင်းကို ပိုပြီး ဂရုစိုက်တယ်
ယနေ့ AI ရုပ်မြင်သာမှုဟာ ဖွင့်ထားသော မော်ဒယ်အချက်စာအုပ်မှစပြီး chatbot အက်ပ်များအထိ အရာအားလုံးကို ပေးထားပေမယ့် Macaron ၏ ထူးခြားသော အသုံးပြုသူ-အလေးပေးထားသော fine-tuning က ၎င်းကို ကွဲပြားစေသည်။
AI စနစ်တွေမှာ တိုးတက်လာတာနဲ့အတူ နောက်ထပ် အစွန်းရောက်နယ်မြေက သူတို့ကို တကယ့်ကို ကိုယ်ပိုင်ဖြစ်ပြီး နက်ရှိုင်းစွာ လိုက်လျောညီထွေဖြစ်အောင် လုပ်ဆောင်ခြင်းဖြစ်ပါတယ်။ Macaron က ကိုယ်ပိုင် AI အေးဂျင့်တွေ ဘာကြောင့် အနာဂတ်ဖြစ်လာနိုင်မယ်ဆိုတာ ပြသပေးတယ်။ အထွေထွေမော်ဒယ်ကြီးတွေထက် အသုံးပြုသူကို ပိုမိုလေးစားပြီး အပြောင်းအလဲမရှိတဲ့ စကားဝိုင်းဘော့တွေထက် အလွန်ပိုမို ရွေ့လျားနိုင်စွမ်းရှိတာကြောင့် ထိပ်တန်း AI မော်ဒယ်တွေ၏ အားသာချက်နဲ့ ကိုယ်ပိုင် အကူအညီပေးသူ၏ လိုက်လျောညီထွေမှုကို ပေါင်းစည်းပေးပါတယ်။
ဖန်တီးမှုစမ်းသပ်မှုတွေမှာ အခြားသူတွေကို ကျော်လွန်ပြီး သင့်အချိန်ကို စက္ကန့်အနည်းငယ်အတွင်း mini-apps တွေကို ဖန်တီးပေးခြင်းဖြင့် ပြည့်စုံစွာ ပြသနိုင်ပါတယ်။ Macaron က AI သည် တစ်ဦးချင်းစီကို အာရုံစိုက်သည်နှင့် ဖွင့်လှစ်နိုင်သော အခွင့်အလမ်းများသည် အဆုံးမရှိပါ။ ဒီဟာက သင့်အတွက် AI ကို တိုက်ရိုက်အသုံးပြုနိုင်မယ့် အပြောင်းအလဲဖြစ်ပြီး Macaron က တကယ့်ကို ကိုယ်ပိုင် AI အေးဂျင့်များ၏ ယခင်ခေတ်သို့ ခေါင်းဆောင်နေသည်။