
ရေးသားသူ: Boxu Li
Dwarkesh Patel နှင့် အခုတလော စကားပြောခြင်းတစ်ခုတွင် Ilya Sutskever – OpenAI ၏ နှစ်ဖက်လက်မှတ်တစ်ဦးဖြစ်ပြီး ယခု Safe Superintelligence (SSI) စတင်တည်ထောင်သူ အကြီးအကဲ – မှ AI ၏ အခြေအနေနှင့် အဘယ်သို့ ရောက်ရှိနေသလဲဆိုသည်ကို ဆန်းစစ်ခဲ့သည်။ Sutskever က AI စက်မှုလက်မှုလုပ်ငန်းသည် “အရွယ်အစားကို ကြီးမားစေပါ” ဆိုသော အခါကာလမှ ကျော်လွန်ပြီး အခြေခံသုတေသန၏ အခါကာလသို့ ပြန်လည်ရောက်ရှိနေသည်ဟု ဆိုကြသည်။ 2012–2020 ခန့်အတွင်း သုတေသနအသစ်များမှ နက်ရှိုင်းသောသင်ယူမှုတိုးတက်မှုကို လှုံ့ဆော်ခဲ့ပြီး၊ 2020–2025 အတွင်း ဒေတာနှင့် ပရမီတာများကို ကြီးမားစေသော အာရုံစိုက်မှုသည် (အရွယ်အစားကြီးမားမှု၏ အခါကာလ) ဖြစ်ခဲ့သည်။ သို့သော် ယခုအခါတွင် မော်ဒယ်အရွယ်အစား သို့မဟုတ် ဒေတာအရွယ်အစားကို တိုးမြှင့်ခြင်းဖြင့် အကျိုးရလဒ်များသည် နည်းလာနေပြီဖြစ်သည်။ Sutskever က အတိုချုံးပြောကြသည်မှာ “သင် 100× အရွယ်အစားကိုသာ တိုးမြှင့်ပါက၊ [မဟုတ်] အားလုံးကို ပြောင်းလဲနိုင်မှာမဟုတ်ပါဘူး... အခုတော့ ကြီးမားသောကွန်ပျူတာတွေနဲ့ အတူ သုတေသန၏ အခါကာလကို ပြန်ရောက်နေပြီ” ဟု ဆိုကြသည်။ အခြားစကားနဲ့ပြောရရင်၊ အနာဂတ်တွင် ထူးခြားမှုများသည် ကြီးမားသောအရွယ်အစားမှ မရောက်ရ၊ သင်ကြားမှု နည်းချက်အသစ်များ နှင့် ပိုမိုထက်မြက်သော အယ်လဂိုရစ်သမ်များမှ ရရှိလာမည်ဖြစ်သည်။
ဒီပြောင်းလဲမှုကို အားပေးတဲ့ အခြေခံပြဿနာက Sutskever က "အထွေထွေပြန်ဖျက်ခြင်း ကွာဟမှု" လို့ခေါ်တဲ့အရာပါ။ ယနေ့ခေတ် ရှိသော အကြီးစားမော်ဒယ်များသည် စမ်းသပ်မှုအမှတ်များကို ထိပ်ဆုံးရနိုင်သော်လည်း လက်တွေ့အလုပ်များတွင် မအောင်မြင်နိုင်ဖြစ်နေပြီး - ဒါဟာ ပိုမိုရှင်းလင်းလာတဲ့ အပြောင်းအလဲတစ်ခုဖြစ်လာပါတယ်။ "ဒီမော်ဒယ်တွေဟာ လူတွေထက် အထွေထွေပြန်ဖျက်ခြင်းကို အလွန်အမင်းပိုဆိုးရပါတယ်။ ဒါဟာ အရမ်းရှင်းလင်းပါတယ်။ ဒါဟာ အခြေခံအရာတစ်ခုလိုဖြစ်နေပါတယ်" လို့ Sutskever က ပြောကြားပါတယ်။ ကုဒ်ပြိုင်ပွဲများ သို့မဟုတ် ဘာသာစကားစမ်းသပ်မှုများတွင် ထိပ်ဆုံးအမှတ်ရသော မော်ဒယ်များသည် - တူညီသော အမှားပြင်ဆင်မှုကို ထပ်ခါထပ်ခါလုပ်ခြင်း သို့မဟုတ် လွယ်ကူသော သာမန်အကြောင်းအရာဆိုင်ရာဆုံးဖြတ်ချက်များတွင် မအောင်မြင်ခြင်း - အတည်ပြုခွင့်မရှိသော လူသားတစ်ယောက်က လုပ်မယ့်အရာတွေနဲ့ တူနေပါတယ်။ ဤအရာသည် အားနည်းချက်တစ်ခုကို ဖော်ပြသည်: နယူးရယ် နက်ဝက်များသည် လူသားများလို အားလုံးကို နားမလည်နိုင်ပေ၊ သို့သော် ၎င်းတို့၏ နယ်ပယ်ကျဉ်းကျဉ်းသားကျားသော ကျွမ်းကျင်မှုများသည် စိတ်တိုင်းမကျရှိသည်။ Sutskever ၏ ထပ်တိုးပြောကြားမှု၏ အကျဉ်းချုပ်တစ်ခုက ဖော်ပြသည်မှာ၊ စမ်းသပ်မှုများတွင် ကောင်းစွာ အောင်မြင်သော မော်ဒယ်များကို ဆောက်လုပ်ခဲ့သော်လည်း၊ ၎င်းတို့၏ အမှန်တကယ် အကျိုးရှိမှုသည် "စမ်းသပ်မှုများတွင် အမြင့်မှတ်ပေးခြင်းနှင့် လက်တွေ့ကြုံတွေ့ရသော အမှားများကြားရှိ အားနည်းချက်" အဖြစ် သက်သေပြသည်။
ဘာကြောင့်လက်ရှိမော်ဒယ်များသည်အထွေထွေပြန်လည်လေ့လာမှုတွင်မပြည့်စုံသနည်း။ Sutskever က၎င်းသည်ကျွန်ုပ်တို့၏လေ့ကျင့်မှုဆိုင်ရာစံနမူနာမှဖြစ်သည်ဟု အချို့မြင်သည်။ ကြီးမားသောအရွယ်အစား ကြိုတင်လေ့ကျင့်ခြင်း ခေတ်တွင် ကျွန်တော်တို့သည်မော်ဒယ်ကို အရာအားလုံး (အင်တာနက်အရွယ်အစားစာသား) ပြီးတော့ဒေတာအကျယ်ကြီးမှ တိကျစွာကြိုးစားသည်ဟုမျော်လင့်ရုံဖြစ်သည်။ ၎င်းသည်တစ်စိတ်တစ်ပိုင်းအထိ ဖြစ်ခဲ့ပါသည်။ ဒါပေမယ့်ကြိုတင်လေ့ကျင့်မှုပြီးနောက် ကုမ္ပဏီများသည် reinforcement learning (RL) ဖြင့်အထူးပြုစိစစ်မှုများ သို့မဟုတ်အသုံးပြုသူညွှန်ကြားချက်များပေါ်တွင်မော်ဒယ်များကိုထပ်မံညှိဆင်သည်။ Sutskever သည်ဤ RL အဆင့်သည်မော်ဒယ်များကိုစမ်းသပ်မှုတွင် အထူးပြုလုပ်ရန်ဖြစ်လေ့ရှိပြီး ၎င်းတို့၏နားလည်မှုကိုတကယ်တမ်းတိုးတက်စေခြင်းမရှိကြောင်း များစွာမျှော်လင့်သည်။ ၎င်း၏ပြောဆိုချက်တွင် ၎င်းသည်တစ်ခုခြင်းလျှင်သက်ရောက်သော မျက်နှာဖုံးကိုပေးသည်။ 'ကျောင်းသား' တစ်ယောက် (AI မော်ဒယ်နှင့်ဒုတိယ) သည် ၁၀,၀၀၀ နာရီကြာပြိုင်ဆိုင်မှုခေါင်းစဉ်များကိုလေ့ကျင့်ပြီး ကုဒ်ပြိုင်ပွဲတွင်အထူးပြုဖြစ်လာပြီး ဒုတိယကျောင်းသားသည်လည်း ပျမ်းမျှလေ့ကျင့်ခြင်းနှင့် ကွန်ပျူတာသိပ္ပံအထွေထွေအထောက်အထားများကိုပေါ်လွင်အောင်လုပ်သည်။ ပထမကားပြိုင်ပွဲများကိုအနိုင်ရနိုင်သော်လည်း ဒုတိယသည် အပြင်လောကတွင် အထွေထွေစွမ်းရည်ရှိသော အင်ဂျင်နီယာဖြစ်လာသည်။ ယနေ့အခါမော်ဒယ်များသည် လွန်အောင်ပြင်ဆင်ထားသော အထူးပြုလုပ်သမားများကဲ့သို့ဖြစ်ကြပြီး ၎င်းတို့ကိုညှိနှိုင်းထားသော ကန့်သတ်ချက်များအောက်တွင် ထူးခြားစွာထင်ရှားကြသော်လည်း အလုပ်မှုပုံစံအသစ်များကိုအရည်အသွေးရှိစွမ်းရည်ပြောင်းလဲနိုင်မှုမရှိကြပါ။ အတိုချုံးအားဖြင့် ကျွန်ုပ်တို့၏ AI များသည် လူသားများကအတွေ့အကြုံတစ်ခုတည်းမှတစ်ခုတည်းဖြင့်ရရှိသော ခိုင်မာပြီးချောမွေ့သောအထွေထွေပြန်လည်လေ့လာမှုကိုမရရှိသေးပါ။
Sutskever ၏ ဆွေးနွေးချက်တွင် အဓိကအကြောင်းအရာတစ်ခုမှာ လူ့ပညာသင်ယူမှု၏ နမူနာထိရောက်မှု ဖြစ်သည်။ လူတွေဟာ ရှုပ်ထွေးတဲ့ တာဝန်များကို သင်ယူဖို့ အံ့သြဖွယ်နည်းပါးတဲ့ ဒေတာသာ လိုအပ်သည်။ ဥပမာအားဖြင့် Yann LeCun က တက်ကြွသော လူငယ်တစ်ယောက်သည် ကားမောင်းတတ်ရန် 10 နာရီ ခန့်သာ လေ့ကျင့်ရန် လိုအပ်သည်ဟု ပြောကြားခဲ့သည် – AI စံချိန်များအရ အလွန်နည်းပါးသော ဒေတာစုစည်းမှုဖြစ်သည်[12]။ ပျော်ရွှင်သော ကလေးများသည် ရိုးရှင်းသော နေ့စဉ်ဘဝထဲမှ ကားများ (နှင့် အခြား အမြောက်အမြားသော အယူအဆများ) ကို အသိအမှတ်ပြုသင်ယူသည်[12]။ တစ်ဖက်တွင် လက်ရှိ AI မော်ဒယ်များသည် အလွန်အမင်းသော လေ့ကျင့်လုပ်ငန်းများလိုအပ်ပြီး လူ့တိမ်မြူမှုကို မရောက်ရှိနိုင်တော့ပါ။ Sutskever က ဥာဏ်ရည်တည်ဆောက်မှုများကို ရှည်လျားစွာထုတ်လုပ်ထားသည်ဟု မှတ်ချက်ပြုသည် – ဥပမာအားဖြင့် အမြင်နှင့် လှုပ်ရှားမှုများသည် ကျွန်ုပ်တို့၏ ဦးနှောက်များကို တည်ဆောက်ပေးထားသော သန်းကျော်နှစ်များ – သို့သော် အဲဒါတစ်ခုထဲထက် ပိုမိုအပြည့်အဝမဖြစ်ကြောင်း[13][12]။ သင်ယူမှုများသည် အီဗိုလူရှင်ဖြင့် မကြီးမားသော နယ်ပယ်များ (စာဖတ်ခြင်း၊ သင်္ချာသင်ယူခြင်း၊ သင်ခန်းစာများ) တွင် အလွန်မြန်ဆန်စွာ သင်ယူနိုင်သည်[14][15]။ အဲဒါက “လူတွေကို သင်ယူရတာကောင်းတဲ့ အရာမည်သည်” ဆိုတာကို သက်သေပြသည် – ကျွန်ုပ်တို့မှာ အဓိကအားဖြင့် ထိရောက်သော သင်ယူမှု အာလဂိုရစ်သမ် ရှိသည်[14][15]။
algorithm အဲဒါဘာဖြစ်နိုင်မလဲ။ သတင်းအချက်အလက်တစ်ခုကတော့ လူသားတွေဟာ မိမိတို့ကိုပညာသင်ယူခြင်းကို အဆက်မပြတ်လုပ်ဆောင်ပြီး အပြန်အလှန်လုပ်ဆောင်ကြပါတယ်၊ တစ်ကြိမ်၊ တစ်ခါတည်းလုပ်မထားကြပါဘူး။ ကျနော်တို့ဟာ terabytes အသိပညာကို စုပုံပြီး စိတ်ကို ချုပ်တည်းထားတာမဟုတ်ပါဘူး။ အစားမှာ ကျနော်တို့ဟာ ရရှိနေတဲ့အတွေ့အကြုံ ကနေ သင်ယူပြီး အမြဲသိမြင်မှုကို အဆက်မပြတ် အပ်ဒိတ်လုပ်ပါတယ်။ သူက "အသက် 15 နှစ်ရှိတဲ့ လူသားတစ်ယောက်ဟာ အကြီးမားဆုံးသော language model ရဲ့ corpus ထက် အချက်အလက်အထိမ်းအမှတ်နည်းနည်းပါပေမယ့်၊ 15 နှစ်ရှိချိန်မှာ ကောင်းမွန်တဲ့ နားလည်မှုရရှိပြီး အမှားအယွင်းနည်းနည်းဖြစ်ပါတယ်"ဆိုပြီး အရေးကြီးသောအချက်ကို ပြောပြပါတယ်။ မတူညီတဲ့အချက်က လူသားတွေဟာ ဘဝတစ်လျှောက်လုံး သင်ယူနေတုန်းပါ၊ ကျနော်တို့ဟာ "သင်ယူမှုအဆင့်"ဟာ လူငယ်အရွယ်မှာပြီးဆုံးသွားတယ်လို့ မယူဆကြပါဘူး။ "လူသားဟာ AGI မဟုတ်ပါဘူး… အစားမှာ ကျနော်တို့ဟာ *အဆက်မပြတ်သင်ယူမှုကို အခြေခံနေပါတယ်"*ဟု Sutskever က ပြောပါတယ်၊ သီအိုရီပညာရှင် AI တစ်ခုကို အံ့ဘွယ်ထက် အစွမ်းထက်တဲ့ 15 နှစ်အရွယ် နာမည်ကြီးသူလိုမျိုး တင်နိုင်ရင် ပိုကောင်းမယ်လို့ ပြောပါတယ်။ ထိုမျိုးသော AI က အခြေခံအားကောင်းသော်လည်း "အသိပညာအများကြီးမှားနေခဲ့ပါတယ်" အလုပ်မှာပင်လယ်ထဲကို သင်ယူနိုင်မယ့် အရာ၊ အလားတူ လူငယ်တစ်ယောက်က ဒောက်တာတစ်ယောက် ဒါမှမဟုတ် အင်ဂျင်နီယာတစ်ယောက်အဖြစ် သင်ယူရင်းထွက်သွားပြီး အလုပ်လုပ်နိုင်မယ့် အရာဖြစ်ပါတယ်။ တကယ်တော့၊ Sutskever ရဲ့ အန္တရာယ်ကင်းတဲ့ ပညာရှင် AI မှတ်ယူမှုဟာ "အလုပ်တစ်ခုကို ဘယ်လိုလုပ်ရမယ်ဆိုတာကို မသိတဲ့" တည်ငြိမ်တဲ့ အမျိုးအစားမဟုတ်ပါဘူး၊ အစားမှာ "အလုပ်တစ်ခုစီကို သင်ယူနိုင်ပြီး အမြဲကောင်းမွန်လာနိုင်တဲ့" စနစ်တစ်ခုဖြစ်ပါတယ်။ ဒါဆိုရင်လည်း တကယ့် AI အောင်မြင်မှုက သင်ယူမှုကို ကျွမ်းကျင်တဲ့ အရာကို ဖန်တီးရမယ်၊ ဘာမှတ်ယူမှုကို ကျွမ်းကျင်တဲ့ အရာမဟုတ်ဘူး။
လူသားလေ့လာမှု၏အခြားဖက်တစ်ဖက်မှာ ကျွန်တော်တို့မှာပါဝင်ပြီးသား တုံ့ပြန်မှုကိရိယာများ ဖြစ်ပါတယ်။ လူသားတွေမှာ စိတ်ခံစားမှုနဲ့ ရှေ့မြင်မှုတွေရှိပြီး စွမ်းရည်အသစ်တွေကို လေ့လာရင် အတွင်းပိုင်းဆုချမှတ်အဖြစ် လမ်းပြနေပါတယ်။ Sutskever က ထူးခြားတဲ့ဖြစ်ရပ်တစ်ခုကို ပြောပြခဲ့ပါတယ်။ ခေါင်းကျိုးသွားလို့ စိတ်ခံစားမှုကို မခံစားနိုင်တော့တဲ့လူတစ်ယောက်ဟာ ဆုံးဖြတ်ချက်ချရာမှာ ဆိုးရွားလှတဲ့ အခက်အခဲတွေကို ကြုံတွေ့ပြီးတော့ ဘယ်အဝတ်စလုံးကို ဝတ်ရမလဲဆိုတာကိုတောင် ရွေးချယ်ဖို့ ပူပန်ခဲ့ပါတယ်။ စိတ်ခံစားမှုအချက်ပြမှုမရှိရင် ဘာအရေးကြီးသလဲဆိုတာ အသိမရှိတော့ပါဘူး။ ဒါက ကျွန်တော်တို့ရဲ့ ဦးနှောက်တွေဟာ တန်ဖိုးအလုပ်လုပ်မှု အမျိုးအစားတစ်ခုကို အားကိုးပြီး အထူးသဖြင့် ထောက်လှမ်းမှုများမှ ထိရောက်စွာ လေ့လာနိုင်ဖို့နှင့် ဆုံးဖြတ်ချက်ချဖို့လမ်းပြနေပါတယ်။ အားနည်းချက်များမရှိတဲ့ လေ့လာမှုစနစ်တွင် ကျွန်တော်တို့အတွေ့အကြုံရဲ့ နောက်ဆုံးအဆင့်မှာ ဆုချီးမြှင့်ခံရမယ်လို့ စောင့်ဆိုင်းမနေကြပါဘူး။ အတွင်းပိုင်းဆုချီးမြှင့်မှုများအားဖြင့် (ပျော်ရွှင်မှု၊ စိတ်ညစ်မှု၊ စူးစမ်းမှု စသည်ဖြင့်) လေ့လာမှုကို အလွန်မြန်မြန်ဆန်ဆန် မြန်ဆန်သွားပါမယ်။ Sutskever က ယနေ့ရဲ့ RL အယ်လဂိုရီသမ်တွေမှာ ဒီစုံလင်မှုမရှိဘူးလို့ ဆိုပါတယ်။ ဒါကြောင့် အနီးကပ်ပြေးချင်တဲ့ အလုပ်တွေမှာ အလွန်ထိရောက်မှုမရှိဘူးလို့ ဆိုပါတယ်။ “အချိန်ကြာမြင့်တဲ့ အလုပ်တစ်ခုလုပ်တဲ့အခါ… အဆုံးအထိ မလေ့လာရပါဘူး၊” လို့ သူက naive RL ကို ဖွင့်ဆိုပါတယ်။ AI ကို အခြေအနေတစ်ခု အထိရောက်စေဖို့ တန်ဖိုးအလုပ်လုပ်မှု ပေးရင် အတွင်းပိုင်းတုံ့ပြန်မှုကို ထည့်သွင်းရင် လေ့ကျင့်မှုကို အလွန်ထိရောက်အောင် လုပ်နိုင်ပါတယ်။ Sutskever က စိတ်ခံစားမှုတွေဟာ လူသားတွေအတွက် ဘယ်လိုလုပ်ဆောင်သလဲနဲ့ တူတာကို ရှုမြင်ပြီး “သင့်ရဲ့ ကွန်ပျူတာကို တိုးတက်စွာ အသုံးပြုဖို့” လမ်းကြောင်းကောင်းတစ်ခုဆိုပြီး ရည်ညွှန်းပါတယ်။ အချို့သော ဆက်လက်လေ့လာမှု နဲ့ ပိုပြီးစုံလင်တဲ့ ကိုယ့်ကိုယ်ကိုကြီးကြပ်မှု (တန်ဖိုးအချက်ပြမှု) တွေဟာ အထွေထွေသိမြင်မှုခွာဟကို ဖြည့်ဆည်းဖို့သော သော့ချက်ဖြစ်နိုင်ပါတယ်။
အဓိကသိသင့်သောအချက်: လက်ရှိ AI မော်ဒယ်များသည် လူသားများထက် အချက်အလက်များကို များစွာလိုအပ်ပြီး အပြောင်းအလဲပြုလုပ်နိုင်မှုမှာ မရှိသေးပါ။ လူသားများသည် အတွေ့အကြုံများကို အဆက်မပြတ် စုဆောင်းခြင်းဖြင့် ထိရောက်စွာလေ့လာပြီး အတွင်းပိုင်းမှတုံ့ပြန်ချက်များ (ကျွန်ုပ်တို့၏ “စိတ်ခံစားမှု” တန်ဖိုး လုပ်ဆောင်ချက်) ကို အသုံးပြု၍ လေ့လာသင်ယူမှုကို လမ်းညွှန်ပေးပါသည်။ ထိုနည်းတူ အပြန်အလှန်ဆက်သွယ်၍ အပိုင်းလိုက်လေ့လာသင်ယူသည့် နည်းလမ်းဖြင့် လေ့လာသင်ယူပြီး သင်ယူမှုတိုးတက်မှုကို ကိုယ်တိုင်ဖြတ်တောက်နိုင်သည့် AI ကို တည်ဆောက်ခြင်းသည် အထွေထွေသိမြင်နိုင်မှုကို အလွန်တိုးတက်လာစေပါမည်။[32][4].
၎င်းတို့၏အမြင်များသည် Macaron AI ၏အပေါ်ယံအတွေးအခေါ်နှင့်အနက်ရှိုင်းစွာသက်ရောက်မှုရှိသည်။ ကျွန်ုပ်တို့သည် အဓိကအားဖြင့် အကြောင်းအရာကို တစ်ကြောင်းထဲတွင် ရှင်းလင်းသည်။ စစ်မှန်သောထောက်ခံချက်သည် အတွေ့အကြုံမှ သင်ယူသည်။ မော်ဒယ်များကို ကြီးမားစေခြင်းသို့မဟုတ် အော့ဖ်လိုင်းဒေတာများကို ကြီးမားစေခြင်းကိုသာ မေ့ပြီး၊ Macaron ၏ သုတေသနသည် အတွေ့အကြုံမှ သင်ယူခြင်း အပေါ် အာရုံစိုက်သည်။ လူ့ဘဝတွင် အတူတူ အတတ်ပညာများကို အချိန်ယူ၍ သင်ယူသကဲ့သို့ AI ကို သင်ကြားခြင်းဖြင့် အပြန်အလှန် အပြန်အလှန်သင်ယူခြင်း၊ တုံ့ပြန်မှုများနှင့် ရေရှည်မှတ်ဉာဏ်တို့ဖြင့် သင်ကြားခြင်းဖြစ်သည်။ ဤနည်းလမ်းကို အတွေ့အကြုံထောက်ခံမှု ဟု ကျွန်ုပ်တို့ ခေါ်သည်။ ၎င်းသည် သင်ယူသည့် အတွေ့အကြုံများ၏ အရည်အသွေးနှင့် အမျိုးမျိုးခြင်း မှာ မော်ဒယ်များ၏ စွမ်းရည်များကို တိုးတက်စေခြင်းဖြစ်ပြီး၊ သင်ယူသည့်ဒေတာများ၏ ပမာဏကိုသာမက တိုးတက်စေခြင်းဖြစ်သည်။ ၎င်းသည် မျက်ကွယ်ထားသော အတိုင်းအတာအပြောင်းအလဲဖြစ်ပြီး၊ Sutskever ၏ အာရုံစူးစိုက်ချက်အတိုင်း၊ ဒေတာများ သို့မဟုတ် ပုံစံများကို များစွာပေါင်းထည့်ခြင်းသည် အကျိုးရှိမှုကို လျော့နည်းစေသည် [2]; နောက်ထပ် ကျော်လွှားမှုသည် နည်းနည်းအထဲမှ ပိုမိုသင်ယူနိုင်သော အရည်အသွေးရှိသောအတွေ့အကြုံများကို အသုံးပြုခြင်းဖြင့် ပေါ်လာမည်ဖြစ်သည်။
တိကျစွာပြောရရင် Macaron ရဲ့ Mind Lab သုတေသနဌာနက ကြီးမားတဲ့မော်ဒယ်တွေမှာ ဆက်တိုက်တုံ့ပြန်မှုအခြေပြု သင်ယူမှု ကိုစတင်ဖန်တီးနေပါတယ်။ ငါတို့မူလမော်ဒယ်ကို ဖျက်သိမ်းပြီး အဆင့်မြှင့်တင်မှုတစ်ခုစီအတွက် အသစ်တစ်ခုကို မူလကနေ ပြန်လည်သင်ကြားခြင်းကို မလုပ်ပါဘူး။ အစား အခြေခံမော်ဒယ်တွေကို နောက်ဆက်တွဲသင်ကြားမှုနဲ့ အဆင့်မြှင့်တင်တာဖြစ်ပါတယ် - အကောင်အထည်ဖော်မှု အစစ်အမှန်တွင် reinforcement learning, လူသား-အပြန်အလှန်တုံ့ပြန်မှုနဲ့ ရေရှည်မှတ်ဉာဏ်အဝင်အထွက်ကို အသုံးပြုခြင်းဖြစ်ပါတယ်။ ဥပမာ- ကျွန်တော်တို့အသင်းက မကြာသေးခင်က ကမ္ဘာပေါ်မှာ ပထမဆုံးအဖြစ် 1-ထရီလီယံ-ပါရာမီတာ အရင်းအမြစ်ဖွင့်လှစ်မော်ဒယ်တစ်ခုကို parameter-efficient LoRA အကူအညီနဲ့ အမြင့်ဆုံးစွမ်းဆောင်ရည်ရှိတဲ့ RL fine-tuning ကို အသုံးပြုခဲ့ပါတယ် - GPU ဘတ်ဂျက်ရဲ့ ~10% သာအသုံးပြုခဲ့ပါတယ်။ ဒါက ကြီးမားတဲ့ နောက်ဆက်တွဲသင်ကြားမှု ကို အဆင်ပြေစေဖို့ အရေးကြီးတဲ့ဖြစ်ရပ်တစ်ခုဖြစ်ပါတယ်။ အဓိကအားဖြင့် ကြီးမားတဲ့မော်ဒယ်ကို အတွေ့အကြုံအသစ်တွေ (နဲ့ အဲဒါတွေကနေသင်ယူကြောင်း) ပေးခြင်းကို အထူးထူးဆန်းဆန်းပြောရမယ့်နည်းလမ်းတွေထက် မျိုးစုံအကျိုးရှိစွာ ပြုလုပ်နိုင်ကြောင်း ပြသခဲ့ပါတယ်။ ရလဒ်က? တိကျတဲ့ဒေတာပေါ်မှာ အနည်းငယ်ပဲ ထူထပ်မှုကို ဖြတ်ပြီး မော်ဒယ်ကို interaction မှတစ်ဆင့် ကျွမ်းကျင်မှုအသစ်တွေကို သင်ပေးခဲ့ပြီး လုပ်ဆောင်နိုင်တဲ့နည်းလမ်းနဲ့ ကုန်ကျစရိတ်သက်သာစွာ ပြုလုပ်ခဲ့ပါတယ်။ (အထူးသဖြင့် ဒီနည်းပညာတွေကို အရင်းအမြစ်ဖွင့်လှစ်ထားပြီး NVIDIA ရဲ့ Megatron နဲ့ ByteDance ရဲ့ VEGA လို လူကြီးမင်းတို့အနက်ထည့်ထားတဲ့ နာမည်ကြီးသော သင်ကြားရေးစနစ်တွေကို ပံ့ပိုးပေးရင် ပိုမိုတိုးတက်စေရန် ပေါင်းစပ်ခဲ့ပါတယ်။)
Macaron ၏နည်းလမ်းတစ်ခုမှာ မှတ်ဥာဏ် ဖြစ်ပါတယ်။ ဒါဟာ စကားပြောသမားရောင်းကိုယ်စားပြုမှတ်တမ်းအဖြစ် မဟုတ်ဘဲ အချိန်အတော်ကြာပြီးမှ သိမြင်မှုကို စုဆောင်းပြီး သွားလာစေတဲ့ မော်ဒယ်တစ်ခုဖြစ်ပါတယ်။ လူတွေဟာ အချက်အလက်တိုင်းကို တန်းတူမသိပါဘူး။ ကျွန်တော်တို့ အရေးကြီးတဲ့ဖြစ်ရပ်တွေကို မှတ်သားပါတယ်။ အခြားအရာတွေကို မြန်မြန်မေ့လွယ်ပါတယ်။ ဒီလို အမြင်ကျွန်တော်တို့ အရေးကြီးတဲ့အရာတွေကို အလေးထားဖို့ အရေးကြီးပါတယ်။ ဒါကြောင့် အချိန်ကြာလာတဲ့အခါမှာ အလွန်အကျွံမဖြစ်စေဖို့ အရေးကြီးပါတယ်။ ဒီအကြောင်းကြောင့် ကျွန်တော်တို့ရဲ့သုတေသနပညာရှင်တွေဟာ Memory Diffusion လို့ခေါ်တဲ့ မှတ်ဥာဏ်စနစ်အသစ်တစ်ခုကို ဖန်တီးခဲ့ပါတယ်။ ဒါဟာ ကိန်းဂဏန်းကို အလွန်အကျွံသိမ်းဆည်းခြင်းမဟုတ်ဘဲ၊ ဒါကို သင်ကြားတဲ့အခါမှာ အရေးကြီးတဲ့အချက်လေးတွေကို ထောက်ပံ့ပေးဖို့၊ မျက်နှာဖုံးပြောင်းပေးဖို့ သင်ကြားပေးပါတယ်။ ဒီနည်းလမ်းဟာ ထုံးစံအတိုင်းအဖြစ် (အပြောင်းအလဲရှိတဲ့အခြေအနေသို့မဟုတ် အထောက်အထားကို ပြန်ယူခြင်း) သုံးစွဲမှုတွေထက် ပိုမိုထိရောက်ပါတယ်။ အဓိကအားဖြင့် အဓိကတွေက အဓိကအချက်တွေကို ထောက်ပံ့ပေးတဲ့ အလုပ်လုပ်တဲ့ မှတ်ဥာဏ် တစ်ခုကို ပေးပါတယ်။ လူ့ဥာဏ်ရဲ့ အဓိကအချက်တွေကို အလေးပေးတာ နဲ့ အလားတူပါပဲ။ ဒါကြောင့် အရေးကြီးတဲ့အရာတွေကို မှတ်သားပြီး အခြားအရာတွေကို မေ့ရတာကို သင်ကြားပေးပါတယ်။ ဒီလိုနည်းလမ်းက တစ်ခုချင်းစီကနေ အရာတွေကို ဆက်လက်သင်ကြားနိုင်အောင် အရေးကြီးတဲ့အရာတွေကို ဆက်လက်သင်ကြားနိုင်တဲ့ စနစ်ကို ဖန်တီးပေးပါတယ်။
အဓိကအားဖြင့် Macaron ၏ သုတေသနသည် ကျွန်ုပ်တို့၏ ထုတ်ကုန်မှ ချိတ်ဆက်ခြင်းမရှိဘဲ မဖြစ်နိုင်ပါ။ ကျွန်ုပ်တို့သည် သုတေသန↔ထုတ်ကုန် လုပ်ဆောင်မှုအကွက် ကို ယုံကြည်ပါသည်။ ဓာတ်ခွဲခန်းတွင် တိုးတက်မှုများသည် အသုံးပြုသူအတွေ့အကြုံဖြင့် တိုက်ရိုက်အတည်ပြုပြီး ထုတ်ကုန်မှ အမြင်အာရုံများသည် သုတေသနအသစ်များကို သတင်းပို့ပါသည်။ ဥပမာအားဖြင့် Macaron ၏ ပုဂ္ဂိုလ်ရေး AI အက်ပ်သည် AI ၏ ဖြေကြားမှုများ အကျုံးမဝင်သောနေရာများ သို့မဟုတ် အသုံးပြုသူများ မကျေနပ်သော အခါများတွင် မည်သည့်နေရာတွင် မကျေနပ်မှုရှိသည်ကို အမည်မဖော်ထားသော တုံ့ပြန်ချက်များကို လုပ်ဆောင်ပါသည်။ ဤအချက်ပြများသည် အားထုတ်မှုသင်ယူမှု လေ့ကျင့်ခြင်းတွင် ထပ်ဆင့်ဆုလာဘ်အချက်ပြအဖြစ် ထည့်သွင်းပါသည်။ အမှန်တကယ် အသုံးပြုသူ တုံ့ပြန်ချက်များဖြင့် လေ့ကျင့်ခြင်းက ဦးတည်ချက်မရှိသော အင်တာနက်စာသားများကို ကြိုတင်လေ့ကျင့်ခြင်းထက် စွမ်းရည်ပြင်းထန်မှုကို ပိုမိုရရှိနိုင်ကြောင်း တွေ့ရှိခဲ့သည်။ ၎င်းသည် Sutskever ၏ အမြင်ဖြစ်သော သင် လေ့ကျင့်နေသော အရာသည် အရေအတွက်ထက် ပို၍ အရေးကြီးနိုင်သည်၊ အနည်းငယ်သော ဦးတည်ချက်ရှိသော အတွေ့အကြုံသည် ဘီလျံနှင့်ချီသော အတည်ပြုထားသော အချက်ပြများသည် မလေ့ကျင့်နိုင်သော အရာကို မော်ဒယ်တစ်ခုကို သင်ကြားနိုင်သည်။ ထုတ်လုပ်ခြင်းနှင့် သုတေသနအကြား အကွက်ကို ပိတ်ခြင်းအားဖြင့် ကျွန်ုပ်တို့၏ AI သည် လူများ အာရုံစိုက်ရာ လုပ်ဆောင်မှုများတွင် တကယ်တိုးတက်လာကြောင်း သေချာစေပါသည်။ Sutskever ၏ အမြင်တွင် ကျွန်ုပ်တို့သည် ကမ္ဘာကို ရင်ဆိုင်မှုမှ ရရှိသော “သိပ္ပံသဘော” ကို မော်ဒယ်များကို ပေးနေပါသည်။
AI အကြီးအကဲများအနက် ဆက်လက်လေ့လာခြင်း သည် အနာဂတ်အတွက် အရေးကြီးသောလမ်းကြောင်းဖြစ်ကြောင်း သဘောတူညီမှုများ တိုးတက်လာသည်ကို တွေ့ရသည်မှာ အားပေးဖွယ်ကောင်းသည်။ လူ့ကိုယ်ပိုင်လေ့လာမှုပုံစံအတိုင်း - အမြဲတမ်းနဲ့ လိုက်လျောညီထွေရှိစွာ သင်ယူသော စူပါထက်မြက်တစ်ခု၏ Sutskever ၏ အမြင်သည် Macaron ရဲ့ လိုက်နာခဲ့သော လမ်းကြောင်းဖြစ်သည်။ ဤပြောင်းလဲမှုတွင် ကျွန်ုပ်တို့ တစ်ဦးတည်းမဟုတ်ပါ။ ဥပမာအားဖြင့် Google ၏ Pathways မဟာဗျူဟာသည် တစ်ခုထက်ပိုသော အလုပ်များနှင့် ပုံစံများကို သင်ယူနိုင်ရန် တစ်ခုတည်းသော မော်ဒယ်ကို လေ့ကျင့်ရန် လှုံ့ဆော်သည်။ ၎င်းသည် တစ်ခါသုံး မော်ဒယ်များအပြင် အခြားအကျိုးကျေးဇူးများကို လေ့လာသင်ယူနိုင်ရန် ဖြစ်သည်။ Jason Wei နှင့် Jeff Dean ကဲ့သို့သော သုတေသနပညာရှင်များကလည်း သိမြင်မှုများကို တဖြည်းဖြည်း ဖွံ့ဖြိုးဖွယ်ရှိသော ဗိသုကာများ၏ လိုအပ်ချက်ကို ဆွေးနွေးခဲ့ကြသည်။ ဤသည်မှာ ယနေ့မော်ဒယ်ဗဟိုအခြေပြု AI နှင့် ပြိုင်ဘက်ဖြစ်သော “လေ့လာမှုဗဟိုအခြေပြု AI” သို့ ဘက်လှည့်မှုကို ကိုယ်စားပြုသည်။ ဤသစ်လွင်သော စံပြသဘောတရားတွင် AI တစ်ခုသည် အသစ်တစ်ခုကို မည်မျှမြန်မြန် သင်ယူနိုင်သလဲ၊ သို့မဟုတ် အခြေအနေအသစ်ကို မည်မျှမြန်မြန် လိုက်လျောနိုင်သလဲ ဆိုသည်မှာ အဓိကဖြစ်လာသည်။ လူသားများမှာ မျှော်လင့်ချက်ကို လက်ရှိထိမ်းထားနေသော်လည်း အကွာအဝေးက ပိတ်ကွယ်နေသည်။
Macaron AI တွင် ကျွန်ုပ်တို့၏ကာစီမှာ အတွေ့အကြုံပညာရပ် - လက်တွေ့အတွေ့အကြုံမှ သင်ယူနိုင်သော AI သည် အဆင့်မြင့်စွမ်းဆောင်ရည်နှင့် ယုံကြည်စိတ်ချရမှု၏ နောက်လှိုင်းကို ဖွင့်လှစ်ပေးမည်ဟု ကျွန်ုပ်တို့ ယုံကြည်ပါသည်။ ကျွန်ုပ်တို့သည် အထောက်အထားများကို ရရှိနေပြီဖြစ်သည် - reinforcement learning နှင့် လူ့အကြံပြုချက်များဖြင့် လေ့ကျင့်ထားသော ကျွန်ုပ်တို့၏ မော်ဒယ်များသည် သာမက စံပြများပေါ်တွင် ပိုမိုကောင်းမွန်စွာ လုပ်ဆောင်နေကြသည်၊ အရေးကြီးတာကတော့ လက်တွေ့လုပ်ဆောင်ရာတွင် အသုံးပြုပြီးတော့ အသုံးပြုသူများ၏ လိုအပ်ချက်များနှင့် ပိုမိုတွဲဖက်ထားသည်ဟု ခံစားရသည်။ ၎င်းတို့သည် အကြောင်းအရာမရှိသော အမှားများကို နည်းနည်းလုပ်ပြီး အမှားများမှ လွယ်ကူစွာ ပြန်လည်ထွက်နိုင်သည်၊ အကြောင်းမှာ ၎င်းတို့၏ လေ့ကျင့်မှုက အမှားများကို သတိပြု၍ ပြင်ဆင်ရန် သင်ကြားပေးထားသောကြောင့် ဖြစ်သည် (လူ့အတိုင်းပင်)။ ကျွန်ုပ်တို့၏ မှတ်ဉာဏ်စနစ်များသည် သီးသန့် transformer များမှာ မရှိသော ဆက်စပ်မှုကို ထိုကဲ့သို့ပင် ပေးသည်၊ စကားဝိုင်းတစ်ခု သို့မဟုတ် အလုပ်တစ်ခုကို လများကြာပြီးမပြောင်းလဲဘဲ ဆက်လက်လုပ်ဆောင်နိုင်သည်။ ထိုအားလုံး၏ အားသာချက်များသည် ပညာရပ်ကို အတည်အမြဲမဟုတ်ဘဲ ဖြစ်စဉ် အဖြစ် သတ်မှတ်ခြင်းမှ ရရှိသည်။ Sutskever က "လေ့ကျင့်မှု အမှားပြင်ဆင်ကာလ" ကို တည်ဆောက်မှုအတွင်း ကျော်ဖြတ်နိုင်သည့် AI တစ်ခုအဖြစ် သတ်မှတ်ထားသည် - ဤသည်မှာ ထိန်းချုပ်ထားပြီး အညီအမျှပြုလုပ်ပါက ဖျက်ပစ်လိုက်သော အရာမဟုတ်ဘဲ အားသာချက်တစ်ခုဖြစ်သည်။
AI သင်ယူမှုအတွက် ဆောင်ရွက်မှု က များစွာ အရေးကြီးသည်။ စိတ်ဝင်စားစရာကောင်းသည်မှာ Sutskever က AI သည် အချိန်ဖြစ်လျှင် သင်ယူခြင်းနှင့် နားလည်ခြင်းကို တကယ်လုပ်နိုင်သည်ဟု အကြံပြုခဲ့သည် - သဘာဝလောကနှင့် အခြားသူများကို စိတ်ကြီးမြတ်၍ မော်ဒယ်ဖျော်ဖြေရန် စွမ်းရည်ရှိသော AI ကို တည်ဆောက်ရန် ပိုမိုလွယ်ကူနိုင်သည်ဟုဆိုသည်။ လူသားများနှင့် အပြန်အလှန် ဆက်ဆံမှုရှိသော AI တစ်ခုသည် အတိုးအကျယ်ဖြင့် လူသားတန်ဖိုးများကို သင်ကြားနိုင်ရန် အခွင့်အရေးရရှိနိုင်သည်။ ၎င်းသည် ကျွန်ုပ်တို့၏ အမြင်နှင့် ကွဲပြားခြားနားမှုကို ထပ်တလဲလဲ ပြန်လည် အကြံပြုသည်။ Macaron ၏ ဂျီအိုကိန်းကို အသုံးပြု၍ အသုံးပြုသူများနှင့်တိုက်ရိုက် ပူးပေါင်းဆောင်ရွက်ခြင်းဖြင့် ဤ incremental နည်းလမ်းအတွက် သဘာဝပတ်ဝန်းကျင်ကို ပေးဆောင်သည်။ ကျနော်တို့သည် အဆင့်ဆင့် အသစ်သော သင်ယူမှုစွမ်းရည်များကို ဦးတည်၍ အပြုအမူကို ကြည့်ရှုခြင်းနှင့် တုံ့ပြန်ချက်များကို စုပေါင်းခြင်းတို့အတွက် ကြီးကြပ်လေ့လာခြင်းကို ပြုလုပ်သည်။ အကျဉ်းချုပ်အားဖြင့် အတွေ့အကြုံမှ သင်ယူခြင်းသည် AI ကို ပို၍ စမတ်ဖြစ်စေမည်သာမက - AI ကို ပို၍ လုံခြုံစေပြီး လူသားနှင့် သင့်လျော်စေသည်။
Ilya Sutskever ၏ ရှေ့လျှောက်ကြည့်မြင်မှုနှင့် Macaron ၏ ဖွံ့ဖြိုးတိုးတက်မှု ခရီးလမ်းသည် အတူတူသော ပြဿနာအဖြေကို ညွှန်ပြနေသည်။ နောက်ထပ် AI ဖွံ့ဖြိုးတိုးတက်မှုသည် အကြီးမားသော မှတ်ဉာဏ်ရည်သာမက ပညာရှင် AI တစ်ခု ဖြစ်မည်။ အတွေ့အကြုံမှ သင်ယူသည်၊ တုံ့ပြန်ချက်များကို အတွင်းစိတ်ထဲတွင် သိရှိသည်၊ နှစ်ရှည်လျားအတွင်းမှတ်မိ၍ လိုက်လျောညီထွေဖြစ်သည် - အထူးသဖြင့် ကြီးထွား နိုင်သည့် AI တစ်ခုသည် အပြည့်အဝကမ္ဘာကြီး၏ အရှုပ်အထွေးများကို အထွက်ပြုနိုင်သည်။ ၎င်းက အစောပိုင်းနှစ်များမှ စိတ်နေစိတ်ထားကို အနက်ရှိုင်းစွာပြောင်းလဲခြင်းကို ကိုယ်စားပြုသည် - မော်ဒယ်တွင် စတင်ထားရှိသည့် သိမြင်မှုရုံသာမက၊ အသစ်သော အသိပညာကို အကျိုးရှိရှိရရှိနိုင်ခြင်းကို မည်ကာမည်မျှ လုပ်ဆောင်နိုင်သည်ကိုပါ။ Sutskever ၏ စိတ်ကူးထားသော “အလွန်ထူးချွန်သော အသက် ၁၅ နှစ်” သည် ဤအယူအဆကို အကျဉ်းချုပ်ပြသည်။ Macaron တွင် ကျွန်ုပ်တို့သည် အသုံးပြုသူ အသိုင်းအဝိုင်းနှင့်အတူ လောလောဆယ်သင်ယူနိုင်သော AI အမျိုးအစားကို တည်ဆောက်ရန် ကြိုးစားနေပါသည်။
အတွေ့အကြုံပေါ်အခြေခံပြီး ဆက်တိုက်လေ့လာသင်ယူသော AI ၏ အကျိုးသက်ရောက်မှုများမှာ ကျယ်ပြန့်လှပါသည်။ နည်းပညာပိုင်းတွင်၊ ၎င်းသည် နမူနာထုတ်ယူမှု အကျိုးရှိမှု မြင့်မားခြင်း – နည်းသုံး၍ ပိုမိုလုပ်ဆောင်ခြင်း – နှင့် မည်သည့် နယ်ပယ်သို့မဟုတ် သဘောတရားနှင့်မဆို လျင်မြန်စွာလိုက်လျောညီထွေဖြစ်နိုင်သော မော်ဒယ်များကို ဆိုလိုသည်။ စီးပွားရေးပိုင်းတွင်၊ AI အလုပ်သမားများကို ချက်ချင်းပြန်လည်လေ့ကျင့်နိုင်ခြင်းအားဖြင့် တီထွင်မှုနှင့် ထုတ်လုပ်မှုကို အမြန်အဆင့်မြှင့်တင်ရန်ကတိပေးသည် (Sutskever က အမျိုးမျိုးသော AI များ ပျံ့နှံ့လာပါက အသင့်အင်အားမြင့်မားစွာ တိုးတက်မှုဖြစ်နိုင်ကြောင်း ခန့်မှန်းဆိုသည်။[34][35])။ လူ့အဖွဲ့အစည်းအတွက်၊ ၎င်းသည် AI စနစ်များကို ပိုမိုနားလည်ရလွယ်ကူစေပြီး၊ ၎င်းတို့သည် ဘယ်လိုလေ့လာသင်ယူသည်ကို မြင်နိုင်ခြင်း၊ ပြုစုပျိုးထောင်ပုံကို စွဲဆောင်နိုင်ခြင်းကြောင့် ဖြစ်သည်။
ဒီအရာကို စွမ်းဆောင်ရမှာ အလွန်ခက်ခဲပါလိမ့်မယ်။ ၎င်းအတွက် အယ်လဂိုရစ်သစ်များ၊ စနစ်များနှင့် သင်ယူမှုသဘောတရားများကို နက်ရှိုင်းစွာ နားလည်မှုလိုအပ်ပါတယ်။ သို့သော် အစိတ်အပိုင်းများ ပေါင်းစည်းလာနေပါပြီ- တန်ဖိုးဖွင့်ဆိုမှုများနှင့် ကြီးမားသော RL ကနေ အကျိုးရှိသော မှတ်ဉာဏ်စနစ်များက စတင်ပြီး လူသားနှင့်အတူ လေ့ကျင့်ခြင်းအထိပါ။ ဤအစိတ်အပိုင်းများကို ပေါင်းစည်းလိုက်တဲ့အခါ၊ စိတ်ကူးအတိုင်း အပြေးသင်ယူတတ်သော AI အတွက် နီးကပ်လာသည်။ ၎င်းသည် Macaron ၏ သုတေသနကို လွှမ်းမိုးနေသော အခြေခံသဘောတရားဖြစ်ပြီး Sutskever ကဲ့သို့သော ခေါင်းဆောင်များက ဖျော်ဖြေရန် ကြိုးပမ်းနေသော ရည်မှန်းချက်နှင့် မျှဝေသည်။ အတိုင်းအတာ တိုးချဲ့ခြင်းခေတ်က ကျွန်ုပ်တို့ကို အလွန်များစွာ သင်ကြားပေးခဲ့သော်လည်း၊ အတွေ့အကြုံအရည်ချင်းရှိမှု၏ ခေတ်သစ်ကယခု အလင်းပြနေပါသည်။ ဤခေတ်သစ်တွင် ဒေါ်မော်ဒယ်တိုးချဲ့ခြင်းမက ပို၍ ကျွမ်းကျင်ပြီး မြင်သာလွယ်ကူသော လူသားကဲ့သို့ သင်ယူနိုင်သည့်အရာဖြစ်ပါသည်။ ဤသည်ကို ကျွန်ုပ်တို့ တည်ဆောက်ရန် ကြိုးပမ်းနေသည်။
အရင်းအမြစ်များ:
· Ilya Sutskever နှင့် Dwarkesh Patel (နိုဝင်ဘာ 2025) – Dwarkesh Podcast: “အရွယ်အစားကြီးထွားမှုကာလမှ သုတေသနကာလသို့ ရွေ့လျားခြင်း” ကိုက်ညီချက်များကို Dwarkesh ၏ ဘလော့ဂ်တွင် ဖတ်ရှုနိုင်ပါသည်[1][4][18][19].
· Sutskever ၏ အဓိကအချက်များကို Best of AI စာစောင်မှ အကျဉ်းချုပ်[36].
· လူ့မော်တော်ယာဉ်မောင်းနှင်မှု ထိရောက်မှုအပေါ် LeCun ၏ စောင့်ကြည့်ချက် (Sutskever မှ ရည်ညွှန်းထားသော)[12].
· Macaron AI စိတ်ဓာတ် လေ့လာရေးဌာန – အတွေ့အကြုံအလိုက် ဉာဏ်ပညာ နှင့် မှတ်ဉာဏ် (၂၀၂၅) အပေါ် အတွင်းပိုင်း သုတေသန အကျဉ်းချုပ်များ။
· Macaron AI အဆိုပြုမှုများကို အခမဲ့ အရင်းအမြစ်အဖြစ် မဟာဗျူဟာကြီးပြင်းမှု သင်ကြားရေး (Megatron-Bridge နှင့် VEGA ပေါင်းစည်းခြင်း, ၂၀၂၅) တွင် ပါဝင်မှုများ။
အီလျာ ဆူတ်စ်ကီဗာ – ကျနော်တို့ အရွယ်အစားကြီးထွားသွားတဲ့ခေတ္တထက် သုတေသနအရွယ်အဆက်သို့ ရွှေ့ပြောင်းနေပါပြီ
https://www.dwarkesh.com/p/ilya-sutskever-2
[6] [31] [33] [36] AI ၏အရေးပါမှုများ: 2025 နှင့်အထက်အကြီးအကျယ်တိုးချဲ့ခြင်း (Jason Wei, OpenAI) အကောင်းဆုံး AI စာရွက်များကိုရှင်းပြသည်