
लेखक: बॉक्सू ली
आधुनिक फाउंडेशन मॉडल्स में प्रभावशाली सामान्य ज्ञान और तर्क क्षमताएं होती हैं। हालांकि, ये आधार मॉडल्स व्यक्तिगत उपयोगकर्ताओं के लिए तैयार नहीं होते। ये अक्सर आपके बारे में संदर्भ की कमी रखते हैं और अपरिचित परिदृश्यों में वास्तव में रचनात्मक समस्या-समाधान में संघर्ष करते हैं। उदाहरण के लिए, शोधकर्ताओं ने पाया कि यहां तक कि अत्याधुनिक भाषा मॉडल्स भी ऐसे कार्यों में असफल होते हैं जिनमें आविष्कारशील समाधान की आवश्यकता होती है – जिन्हें आदर्श से दस गुना अधिक चरणों की आवश्यकता होती है और फिर भी मानवीय प्रदर्शन से काफी पीछे रह जाते हैं, क्योंकि वे पारंपरिक सोच पर टिके रहते हैं। औसतन, वर्तमान एलएमएस ने बिना संकेत के एक रचनात्मक पहेली बेंचमार्क पर केवल लगभग 15% प्रगति प्राप्त की, जो उनकी रचनात्मकता की सीमाओं को उजागर करता है। यह रचनात्मकता अंतर महत्वपूर्ण है क्योंकि रचनात्मक बुद्धिमत्ता – पूर्वनिर्धारित पैटर्न से परे अनुकूलन और नवाचार की क्षमता – को बुद्धिमत्ता का एक महत्वपूर्ण घटक माना जाता है, फिर भी अधिकांश एआई बेंचमार्क द्वारा इसे कम ही संबोधित किया गया है।
इन सीमाओं से परे जाने के लिए, AI अनुसंधान समुदाय मॉडल्स को अधिक मानव जैसा सोचने और कार्य करने के तरीके खोज रहा है। एक महत्वपूर्ण प्रगति है ReAct परिप्रेक्ष्य, जिसे Shunyu Yao और साथियों ने 2022 में पेश किया। ReAct का मतलब है "Reason+Act," एक ढांचा जो मॉडल के आंतरिक तर्क प्रक्रिया को बाहरी कार्यों के साथ जोड़ता है। केवल स्थिर स्मृति से उत्तर उत्पन्न करने या केवल अंधाधुंध कार्य करने के बजाय, एक ReAct एजेंट दोनों करता है - यह समस्या के माध्यम से तर्क करता है और उपकरणों या परिवेशों के साथ एक लूप में इंटरैक्ट करता है। यह समन्वयपूर्ण दृष्टिकोण AI को नई जानकारी एकत्र करने और अपनी योजना को तात्कालिक रूप से समायोजित करने की अनुमति देता है। याओ और उनके सहयोगियों ने दिखाया कि ReAct दृष्टिकोण व्यवस्थित रूप से उन तरीकों को मात देता है जो केवल विचार श्रृंखला तर्क या केवल कार्य निष्पादन पर निर्भर करते हैं। विचार और कार्य को कसकर जोड़कर, मॉडल अधिक मानव जैसे कार्य-समाधान प्रक्षेपवक्र उत्पन्न करता है, जो इसकी व्याख्या क्षमता और प्रभावशीलता में सुधार करता है।
Macaron का प्लेटफ़ॉर्म सबसे अच्छे फाउंडेशन मॉडल्स के ऊपर निर्मित एक व्यक्तिगत फाइन-ट्यूनिंग लेयर के रूप में सोचा जा सकता है। एक बड़ा AI खरोंच से बनाने की बजाय, Macaron मौजूदा बड़े मॉडल्स के ज्ञान और भाषाई क्षमता का लाभ उठाता है और उन्हें आपके लिए व्यक्तिगत रूप से अनुकूलित करता है। यह प्रणाली किसी दिए गए कार्य के लिए जो भी मॉडल या मॉडल्स का संयोजन सबसे उपयुक्त होता है, उसका उपयोग करती है, फिर आपके व्यक्तिगत उपयोग पैटर्न के आधार पर उसके व्यवहार को फाइन-ट्यून करती है।
व्यवहार में, Macaron एक स्मार्ट ऑर्केस्ट्रेशन लेयर के रूप में कार्य करता है: यह आपके इंटरैक्शन और प्राथमिकताओं से लगातार सीखता है, जिससे यह बेहतर सेवा देने के लिए अपनी प्रतिक्रियाओं को अपडेट करता है। इसे आपके अपने कस्टम वर्शन के GPT के रूप में देखा जा सकता है जो धीरे-धीरे आपके स्टाइल को सीखता है, बजाय इसके कि एक ही आकार का मॉडल सबके लिए हो। अंदर की तकनीक में, Macaron एक इन-हाउस रिइनफोर्समेंट लर्निंग प्लेटफ़ॉर्म का उपयोग करता है ताकि इस अनुकूलनशील फाइन-ट्यूनिंग को बड़े पैमाने पर हासिल किया जा सके। रिइनफोर्समेंट लर्निंग के माध्यम से, विशेषकर मॉडल के प्रारंभिक प्री-ट्रेनिंग के बाद, Macaron का AI वास्तविक उपयोगकर्ता फीडबैक और डेटा पर पोस्ट-ट्रेन होता है – मूल रूप से अनुभव से सुरक्षित, नियंत्रित तरीके से सीखता है। परिणामस्वरूप, AI दैनिक उपयोग के साथ विकसित होता है, समय के साथ प्रत्येक उपयोगकर्ता की आवश्यकताओं के प्रति अधिक संवेदनशील हो जाता है।
Macaron के दृष्टिकोण का एक और स्तंभ उसकी गहरी स्मृति और भावनात्मक बुद्धिमत्ता पर ध्यान केंद्रित करना है। सामान्य चैटबॉट्स के विपरीत जो संदर्भ भूल जाते हैं या भाव को नहीं पकड़ पाते, Macaron को एक विश्वसनीय मित्र की तरह आपका गहन, दीर्घकालिक समझ विकसित करने के लिए डिज़ाइन किया गया है। व्यक्तिगत अनुकूलन और निरंतर सीखने के माध्यम से, यह आपकी प्राथमिकताओं, आदतों और यहां तक कि भावनात्मक संकेतों की गहरी स्मृति बनाता है। इससे Macaron को भावनात्मक रूप से बुद्धिमान, संदर्भ-संवेदनशील इंटरैक्शन प्रदान करने की क्षमता मिलती है जो व्यक्तिगत स्तर पर उपयोगकर्ताओं के साथ सामंजस्य स्थापित करता है।
उदाहरण के लिए, अगर आप अक्सर तनाव में होने पर व्यंजनों के लिए पूछते हैं, तो Macaron को यह सीख सकता है कि व्यंजन सुझाव के साथ सौम्य प्रोत्साहन कैसे देना है। यह याद रख सकता है कि आपको शाकाहारी व्यंजन पसंद हैं या आपने कभी एलर्जी का उल्लेख किया था। ये व्यक्तिगत स्पर्श - न केवल आप क्या पूछते हैं बल्कि क्यों पूछते हैं इसे समझना - अनुभव को अधिक मानवीय और सहायक बनाते हैं। कई AI प्लेटफॉर्म्स यहां संघर्ष करते हैं। Macaron इसे सीधे संबोधित करता है, सहानुभूति और संदर्भ को अपनी फाइन-ट्यूनिंग प्रक्रिया में प्राथमिकता देकर, एक प्यारा AI साथी बनने का लक्ष्य रखता है न कि एक ठंडा सॉफ्टवेयर टूल।

व्यक्तिगत फाइन-ट्यूनिंग लेयर प्रत्येक उपयोगकर्ता की पसंद के अनुसार अनुकूलित होती है।
Macaron की सबसे नवीन विशेषताओं में से एक - और इसके व्यक्तिगत फाइन-ट्यूनिंग प्रक्रिया का एक प्रमुख परिणाम - मांग पर "मिनी-ऐप्स" बनाने की क्षमता है जो आपकी समस्याओं को हल करती है। बस मैकरॉन से किसी वास्तविक जीवन की आवश्यकता के लिए मदद मांगें, और यह बिना आपकी उंगली उठाए ही एक समाधान को गतिशील रूप से असेंबल करेगा। उदाहरण के लिए, अगर आप कहते हैं, "मुझे अपने अध्ययन शेड्यूल को व्यवस्थित करने में मदद चाहिए," तो मैकरॉन आपके पाठ्यक्रम के अनुसार एक कोर्स हेल्पर मिनी-ऐप बना सकता है। यदि आप अपने भोजन को ट्रैक करना चाहते हैं, तो यह एक हल्का कुकिंग जर्नल ऐप बना सकता है। यह सब तुरंत होता है - कोई लंबी विकास चक्र या मैन्युअल प्रॉम्प्ट इंजीनियरिंग की आवश्यकता नहीं होती।
Macaron की रचनात्मकता, संदर्भ, और आधार मॉडल के विशाल ज्ञान के संयोजन से यह संभव होता है। पारंपरिक AI सेवाएं या डेवलपर प्लेटफॉर्म आपको एक टेम्पलेट खोजने या एक प्रोग्रामर को काम पर रखने की आवश्यकता कर सकते हैं ताकि एक कस्टम ऐप बनाया जा सके। इसके विपरीत, Macaron आपकी मंशा की गहन समझ के कारण आवश्यकतानुसार उस कार्यक्षमता को उत्पन्न कर सकता है। इससे विचार से निष्पादन तक के समय और प्रयास में काफी कमी आती है।
EscapeBench जैसे अनुसंधान ने दिखाया है कि रचनात्मक समस्या-समाधान AI के लिए कितना चुनौतीपूर्ण हो सकता है। EscapeBench टेक्स्ट-आधारित एस्केप रूम खेलों का एक बेंचमार्क है जो AI एजेंट को बॉक्स के बाहर सोचने के लिए मजबूर करता है - उदाहरण के लिए, वस्तुओं का अनोखे तरीकों से पुनः उपयोग करना। ऐसे बेंचमार्क पर, साधारण भाषा मॉडल संघर्ष करते हैं: वे अक्सर औज़ारों का सिर्फ स्पष्ट तरीकों से उपयोग करते हैं और अभिनव समाधान चूक जाते हैं। यहीं पर मैकरॉन का डिज़ाइन दमदार है। दूरदर्शिता और चिंतन की रणनीतियों को शामिल करके (जिस तरह EscapeAgent दृष्टिकोण को EscapeBench चुनौतियों से निपटने के लिए पेश किया गया था), मैकरॉन का एजेंट जटिल कार्यों का सामना करते समय अभिनव सिद्धांत उत्पन्न कर सकता है और अनसुलझे लक्ष्यों का ट्रैक रख सकता है।
इसके reinforcement learning-संवर्धित फाइन-ट्यूनिंग के कारण, Macaron प्रत्येक प्रयास से सीख कर अपनी रचनात्मकता को निरंतर सुधार सकता है। यदि कोई विशेष समाधान मार्ग विफल हो जाता है, तो Macaron का एजेंट मानव की तरह प्रतिबिंबित और समायोजित कर सकता है। समय के साथ और हजारों उपयोगकर्ताओं के साथ, यह एक एआई की ओर ले जाता है जो पोस्ट-तैनाती के बाद कभी नहीं सीखने वाले की तुलना में कहीं अधिक संसाधनपूर्ण और अनुकूलनीय है।

Macaron किसी भी अन्य एआई एजेंट की तुलना में आपके बारे में अधिक परवाह करता है
आज का एआई परिदृश्य सब कुछ प्रदान करता है, खुला मॉडल हब से लेकर चैटबोट ऐप्स तक, लेकिन Macaron का अद्वितीय उपयोगकर्ता-केंद्रित फाइन-ट्यूनिंग इसे अलग बनाता है:
जैसे-जैसे एआई सिस्टम अधिक सक्षम होते जा रहे हैं, अगला कदम उन्हें वास्तव में व्यक्तिगत और गहराई से अनुकूलनीय बनाना है। Macaron यह दिखाता है कि व्यक्तिगत एआई एजेंट क्यों भविष्य होने वाले हैं। बड़े सामान्य मॉडल की तुलना में अधिक उपयोगकर्ता-केंद्रित और स्थिर चैटबॉट्स की तुलना में कहीं अधिक गतिशील होने से, यह दोनों दुनिया का सबसे अच्छा प्रदान करता है: शीर्ष श्रेणी के एआई मॉडल की ताकत और व्यक्तिगत सहायक की अनुकूलनशीलता।
चाहे वह रचनात्मक मानदंडों पर दूसरों से बेहतर प्रदर्शन कर रहा हो या बस आपके लिए समय बचा रहा हो मिनी-ऐप्स कुछ ही सेकंड में बनाकर, Macaron दिखाता है कि जब एआई व्यक्तिगत पर ध्यान देता है, तो संभावनाएं अनंत होती हैं। यह एआई को आपके अनुसार ढालने की दिशा में एक दृष्टिकोण परिवर्तन है – और Macaron व्यक्तिगत एआई एजेंटों के युग में अग्रणी है।