लेखक: बॉक्सू ली
जब Macaron AI को अगस्त 2025 में पेश किया गया था, तो यह खुद को एक और एंटरप्राइज़ असिस्टेंट के रूप में नहीं बल्कि एक व्यक्तिगत साथी के रूप में स्थापित कर रहा था, जो रोज़मर्रा की ज़िंदगी को समृद्ध करने के लिए डिज़ाइन किया गया है। इसका मिशन मूल रूप से अंतरराष्ट्रीय है: शुरू से ही प्लेटफ़ॉर्म ने अंग्रेज़ी, चीनी, जापानी, कोरियाई और स्पेनिश का समर्थन किया, जो भाषाई और सांस्कृतिक सीमाओं के पार संचालित करने की महत्वाकांक्षा को दर्शाता है। जापान और दक्षिण कोरिया के उपयोगकर्ताओं के लिए - दो देशों के जीवंत लेकिन अलग डिजिटल इकोसिस्टम के साथ - यह बहुभाषी वादा केवल एक मार्केटिंग नारा नहीं है। यह तकनीकी सवाल उठाता है: Macaron क्रॉस-लिंगुअल बातचीत को कैसे संभालता है? इसकी मेमोरी प्रणाली विविध स्क्रिप्ट्स, शब्दावली और सांस्कृतिक संदर्भों से कैसे निपटती है? कौन से डिज़ाइन विकल्प एकल एजेंट को एक पल में हिरागाना में "सोचने" और अगले में हंगुल में "सोचने" की अनुमति देते हैं? यह ब्लॉग Macaron AI की क्रॉस-लिंगुअल आर्किटेक्चर की जांच करता है और उन तंत्रों को समझाता है जो जापानी और कोरियाई उपयोगकर्ताओं के लिए अनुभवों को व्यक्तिगत बनाने की अनुमति देते हैं, जबकि एक सुसंगत पहचान बनाए रखते हैं।
व्यक्तिगतकरण को बड़े पैमाने पर करना केवल अनुवाद से अधिक की मांग करता है। मैकरॉन का उद्देश्य दैनिक बातचीत के माध्यम से यह मॉडल बनाना है कि आप कौन हैं, न केवल तथ्यों को याद रखना बल्कि आहार संबंधी लक्ष्यों और भावनात्मक ऊंचाईयों जैसे सूक्ष्मताओं को भी। कई भाषाओं के लिए इसे हासिल करने के लिए डेटा संरचनाएं और एल्गोरिदम की आवश्यकता होती है जो लेखन प्रणालियों के पार अर्थ को पकड़ सकें, कोड-स्विचिंग को संभाल सकें, और सांस्कृतिक मानदंडों का सम्मान कर सकें। यह पोस्ट अंतर्निहित तकनीकों को तोड़कर समझाएगा: बहुभाषी टोकनाइजेशन, सुदृढीकरण-निर्देशित स्मृति पुनःप्राप्ति, वितरित पहचान प्रबंधन, और सांस्कृतिक अनुकूलन। हम पूर्वाग्रह, गोपनीयता और क्रॉस-क्षेत्रीय अनुपालन जैसी चुनौतियों पर भी चर्चा करेंगे और क्रॉस-भाषाई व्यक्तिगत एजेंटों के लिए अनुसंधान दिशाओं की रूपरेखा प्रस्तुत करेंगे।
बड़े भाषा मॉडल कच्चे पाठ को ऐसे इकाइयों में तोड़ने के लिए टोकनाइज़र पर निर्भर करते हैं जिन्हें मॉडल संसाधित कर सकता है। अंग्रेजी और स्पेनिश जैसी भाषाओं के लिए, उपशब्द टोकनाइज़ेशन (बाइट-पेयर एन्कोडिंग या सेंटेंसपीस) शब्द संरचना को उचित रूप से पकड़ सकता है। हालांकि, जापानी और कोरियाई विशेष चुनौतियाँ पेश करते हैं। जापानी में तीन लिपियाँ (कांजी, हिरागाना और काताकाना) मिश्रित होती हैं और स्थानों का अभाव होता है, जबकि कोरियाई का हंगुल एक विशेष वर्णमाला है जो अक्षर ब्लॉकों में संयोजित होती है। मैकरॉन के इंजीनियर इसलिए एक बहुभाषी शब्दावली बनाते हैं जिसमें लिपि-समझदार उपशब्द इकाइयाँ होती हैं। प्रत्येक टोकन न केवल अक्षरों को बल्कि एक भाषा पहचानकर्ता को भी एन्कोड करता है, जिससे मॉडल को समरूप शब्दों (जैसे, "हा" एक कोरियाई ध्वनि हो सकता है या जापानी कण "は") के बीच अंतर करने में मदद मिलती है। शब्दावली में सामान्य कांजी यौगिकों, मूल तत्वों और हंगुल जामो के लिए टोकन शामिल होते हैं, जो मॉडल को शब्द संरचना इकाइयों का प्रभावी ढंग से प्रतिनिधित्व करने और दुर्लभ शब्दों को अर्थपूर्ण टुकड़ों में तोड़ने की अनुमति देते हैं।
भाषाओं के बीच सबवर्ड यूनिट्स को साझा करके, मैकरॉन क्रॉस-लिंगुअल ट्रांसफर का लाभ उठाता है। उदाहरण के लिए, "अध्ययन" की अवधारणा जापानी में 勉強 (बेनक्यो) और कोरियाई में 공부 (गोंगबु) के रूप में दिखाई देती है। जबकि अक्षर और ध्वनियाँ भिन्न हैं, एजेंट भाषा के बीच सीखे गए सेमांटिक एम्बेडिंग का उपयोग करके इन टोकनों को एक समान वेक्टर स्पेस में मैप करता है। इस एकीकृत प्रतिनिधित्व से मैकरॉन को जापानी उपयोगकर्ता की "भाषा अध्ययन" में रुचि को समझने और बाद में उस ज्ञान को लागू करने में मदद मिलती है जब एक कोरियाई मित्र "공부 계획" (अध्ययन कार्यक्रम) के बारे में पूछता है। बिना एकीकृत शब्दावली के, मॉडल इनको असंबंधित अवधारणाओं के रूप में देखेगा।
Macaron का 671‑अरब-पैरामीटर मॉडल बड़े बहुभाषी कॉर्पस पर प्रशिक्षित है, लेकिन वार्तालापों की लंबी श्रृंखला की आवश्यकता के कारण एक कुशल संदर्भ विंडो आवश्यक है। जापानी और कोरियाई वाक्य अंग्रेजी से लंबे हो सकते हैं क्योंकि उनमें क्रिया और अंतर्निहित कण होते हैं। लंबी बातचीत को समर्थन देने के लिए, Macaron एक पदानुक्रमित ध्यान तंत्र का उपयोग करता है: मॉडल स्थानीय विंडो (वाक्य या पैराग्राफ) को संसाधित करता है और फिर संक्षिप्त प्रतिनिधित्वों को एक वैश्विक परत तक पहुँचाता है। यह तरीका स्मृति के बोझ को कम करता है और एजेंट को विस्तारित वार्तालापों में संदर्भ बनाए रखने की अनुमति देता है। यह क्रॉस‑लिप्यंतरण संरेखण का भी समर्थन करता है, जहां मॉडल जापानी और कोरियाई में खंडों के बीच समकक्षताओं को सीखता है, प्रशिक्षण के दौरान उनके प्रतिनिधित्व के बीच की दूरी को न्यूनतम करके (यह तकनीक क्रॉस‑भाषिक प्राकृतिक भाषा प्रसंस्करण से उधार ली गई है)।
जापानी और कोरियाई उपयोगकर्ता अक्सर बातचीत में अंग्रेजी या चीनी शब्दों का उपयोग करते हैं, खासकर तकनीकी क्षेत्रों या पॉप संस्कृति में। मैकरॉन की इंफेरेंस पाइपलाइन में एक रनटाइम भाषा डिटेक्टर शामिल है जो प्रत्येक आने वाले वाक्य को समर्थित भाषाओं के लिए संभावना स्कोर के साथ टैग करता है। जब एक वाक्य में कई भाषाओं से लिए गए शब्द या वाक्यांश शामिल होते हैं, तो एजेंट इनपुट को खंडों में विभाजित करता है और प्रत्येक को उपयुक्त भाषा संदर्भ के साथ संसाधित करता है। यह आवाज आउटपुट में सही उच्चारण और मुहावरों के उचित प्रबंधन को सुनिश्चित करता है। मेमोरी सबसिस्टम पुनःप्राप्त प्रविष्टियों के लिए भाषा टैग संलग्न करता है, जिससे मैकरॉन को प्रासंगिक अनुभव प्राप्त करने की अनुमति मिलती है, भले ही क्वेरी भाषा संग्रहीत भाषा से भिन्न हो।

Macaron की खास इनोवेशन उसका मेमोरी टोकन है, जो एक डायनामिक पॉइंटर है जो एजेंट को यह तय करने में मदद करता है कि क्या याद रखना है, कब मेमोरी अपडेट करनी है, और कैसे उन यादों को वर्तमान कार्यों में लागू करना है। टोकन एक पदानुक्रमित मेमोरी बैंक के साथ इंटरैक्ट करता है: अल्पकालिक संदर्भ, मध्यम अवधि की एपिसोडिक मेमोरी और दीर्घकालिक ज्ञान। सुदृढीकरण सीखना (RL) एजेंट को टोकन को उपयोगकर्ता संतुष्टि और कार्य सफलता जैसी प्रतिक्रिया के आधार पर समायोजित करने के लिए प्रशिक्षित करता है। यदि कोई जापानी उपयोगकर्ता बार-बार एक ही ट्रेन शेड्यूल के बारे में पूछता है, तो RL नीति उन विवरणों को मेमोरी में प्रोमोट करना सीखती है। यदि कोई कोरियाई उपयोगकर्ता असुविधा व्यक्त करता है जब पिछले टिप्पणियां फिर से सामने आती हैं, तो नीति तेजी से संदर्भों को समाप्त करना सीखती है।
मैकैरॉन टीम एक मोनोलिथिक उपयोगकर्ता प्रोफ़ाइल की धारणा को खारिज करती है; इसके बजाय, पहचान को छोटे इंटरैक्शनों से निर्मित एक उभरती हुई कथा के रूप में माना जाता है। यादें डोमेन सीमाओं (जैसे, काम, शौक, परिवार) द्वारा संगठित की जाती हैं, जिसमें एक प्रासंगिकता संघ तंत्र होता है जो क्रॉस-डोमेन पुनः प्राप्ति की अनुमति देता है। जापानी और कोरियाई उपयोगकर्ताओं के लिए, डोमेन सीमाओं में भाषा डोमेन भी शामिल होते हैं: एक स्मृति आइटम को "जापानी—शौक—संगीत" या "कोरियाई—परिवार—वित्त" के रूप में टैग किया जा सकता है। जब एजेंट को कोरियाई में एक क्वेरी प्राप्त होती है, तो यह पहले कोरियाई यादों की खोज करता है लेकिन यदि अर्थ सामग्री मेल खाती है, तो जापानी यादों की ओर संघ बना सकता है। यह क्रॉस-प्रदूषण को रोकता है जबकि क्रॉस-भाषाई निरंतरता को सक्षम बनाता है।
वो यादें जो शायद ही कभी उपयोग की जाती हैं, समय के साथ कमज़ोर हो जाती हैं; विभिन्न क्षेत्रों में कमज़ोरी की दर भिन्न हो सकती है। संदर्भ क्षय तंत्र अप्रयुक्त यादों के वजन को कम करता है, यह सुनिश्चित करता है कि एक जापानी उपयोगकर्ता की कोरियाई ड्रामा में थोड़ी रुचि स्थायी रूप से स्मृति स्थान पर कब्जा न करे। क्षय से गोपनीयता का समर्थन भी होता है; परिवार या वित्तीय जानकारी जैसी संवेदनशील जानकारी को तेजी से कमज़ोर होने के लिए सेट किया जा सकता है। उपयोगकर्ता स्पष्ट रूप से यादों को हटा सकते हैं या उन्हें गोपनीय के रूप में चिह्नित कर सकते हैं। मैकरॉन का नीति बाइंडिंग ढांचा मशीन-पढ़ने योग्य गोपनीयता नियमों को सीधे डेटा से जोड़ता है, ताकि "निजी—कोरियाई" टैग वाली स्मृति केवल उस भाषा में प्रमाणित सत्रों के दौरान ही सुलभ हो सकती है। विभेदित पारदर्शिता के साथ संयुक्त, जो विभिन्न हितधारकों को विभिन्न स्तरों की खुलासा प्रदान करती है, ये तंत्र मैकरॉन को जापान की गोपनीयता मानदंडों और कोरिया के उभरते AI नियमन के बीच नेविगेट करने की अनुमति देते हैं।
साइन अप करने पर, उपयोगकर्ता तीन व्यक्तित्व परीक्षण पूरा करते हैं जो मैकरॉन को उनके साथ एक व्यक्तिगत व्यक्तित्व से मेल खाने में मदद करते हैं - जिसमें रंग, संचार शैली और आवाज शामिल है। जापान में, जहाँ सौंदर्य सामंजस्य और औपचारिकता को महत्व दिया जाता है, परीक्षण सामाजिक शिष्टाचार पर जोर दे सकते हैं, जबकि कोरियाई प्रश्नावली परिवार की गतिशीलता और सहकर्मी संबंधों पर ध्यान केंद्रित कर सकते हैं। परिणामी व्यक्तित्व न केवल उपयोगकर्ता इंटरफ़ेस को प्रभावित करता है बल्कि एजेंट की शिष्टाचार स्तर, टोन और सांस्कृतिक संदर्भों की पसंद को भी प्रभावित करता है। एक जापानी व्यक्तित्व अप्रत्यक्ष सुझावों को पसंद कर सकता है ("अगले हफ्ते पिकनिक की योजना कैसे बनाएं?"), जबकि एक कोरियाई व्यक्तित्व सीधे प्रोत्साहन की सराहना कर सकता है ("चलो एक पारिवारिक यात्रा की योजना बनाएं!")।
मकारोन की मांग पर मिनी-ऐप्स उत्पन्न करने की क्षमता सामान्य उत्पादकता उपकरणों तक सीमित नहीं है। प्लेटफ़ॉर्म विशेष अनुप्रयोगों का उत्पादन कर सकता है जिनमें 100,000 से अधिक कोड की पंक्तियाँ होती हैं, जैसे जापान की कैकैबो परंपरा (घरेलू लेखांकन की एक विधि) से प्रेरित बजटिंग टूल या कोरियाई होजिक्वान योजना ऐप (परिवारिक कार्यक्रम और पूर्वजों के स्मारकों का प्रबंधन)। उपयोगकर्ता बस अपनी आवश्यकताओं को प्राकृतिक भाषा में वर्णित करता है, और एजेंट एक प्रोग्राम को एकत्र करता है जो स्थानीय परंपराओं के अनुरूप होता है। इसके लिए डोमेन-विशिष्ट टेम्पलेट्स की लाइब्रेरी और स्थानीय कैलेंडर, सार्वजनिक छुट्टियों और वित्तीय नियमों को एकीकृत करने की क्षमता की आवश्यकता होती है। सुदृढीकरण सीखना उपयोगकर्ता संतोष के मूल्यांकन द्वारा उत्पन्न प्रक्रिया को अनुकूलित करता है: यदि जापानी उपयोगकर्ता अक्सर कैकैबो ऐप को "ओमियागे" (स्मृति चिन्ह) और "ओत्सुकुरी" (मासिक चैरिटी) जैसी श्रेणियों को जोड़ने के लिए संशोधित करते हैं, तो जनरेटर भविष्य के ऐप्स में उन्हें डिफ़ॉल्ट रूप से शामिल करना सीखता है।
जापान और दक्षिण कोरिया में भावनाओं को व्यक्त करने के लिए अलग-अलग मानदंड हैं। जापानी संस्कृति अक्सर विनम्रता और संदर्भ संवेदनशीलता को महत्व देती है, जबकि कोरियाई संस्कृति में अभिव्यक्तिपूर्ण सामाजिक इंटरैक्शन का स्वागत किया जाता है। मैकरॉन अपनी प्रतिक्रिया शैली को तदनुसार अनुकूलित करता है, डिजिटल पर्सनहुड अनुसंधान पर आधारित जो तरल पहचान और उपयोगकर्ता सशक्तिकरण पर जोर देता है। व्यावहारिक रूप से, इसका मतलब है कि एजेंट जापानी में बातचीत करते समय आदरसूचक रूपों और अप्रत्यक्ष भाषण का उपयोग कर सकता है, और कोरियाई में बात करते समय अधिक सक्रिय सुझाव दे सकता है। मेमोरी सिस्टम टोन पर फीडबैक को लॉग करता है और वार्तालाप शैलियों को अनुकूल रूप से समायोजित करता है। ये अनुकूलन हार्ड-कोडेड नहीं हैं, बल्कि RL के माध्यम से उभरते हैं: यदि कोई उपयोगकर्ता लगातार किसी निश्चित संचार शैली पर सकारात्मक प्रतिक्रिया देता है, तो रिवॉर्ड सिग्नल उस व्यवहार को मजबूत करता है।
जापानी और कोरियाई में बातचीत करने में सक्षम एक व्यक्तिगत एजेंट बनाने के लिए उच्च गुणवत्ता वाले डेटा की आवश्यकता होती है। मैकरॉन का प्रशिक्षण कॉर्पस लाइसेंस प्राप्त पुस्तकों, समाचार लेखों, ब्लॉगों, ट्रांसक्रिप्ट्स और सभी समर्थित भाषाओं में उपयोगकर्ता-जनित सामग्री शामिल करता है। डेटा को शिष्टाचार, पूर्वाग्रह और डोमेन कवरेज के लिए फ़िल्टर किया जाता है। पूर्व-प्रशिक्षण चरण में साझा प्रतिनिधित्व सीखने के लिए संयुक्त बहुभाषी डेटा पर मुखौटा भाषा मॉडलिंग और अगले-टोकन भविष्यवाणी का उपयोग किया जाता है। फाइन-ट्यूनिंग मानव प्रतिक्रिया से सुदृढीकरण सीखने (आरएलएचएफ) को पेश करता है: टोक्यो और सियोल में द्विभाषी एनोटेटर सांस्कृतिक उपयुक्तता के लिए प्रतिक्रियाओं को रेट करते हैं, जिससे मॉडल को सूक्ष्म संकेतों को सीखने में मदद मिलती है जैसे कि सम्मानजनक शब्दों का उपयोग कब करना है या स्पष्ट करने वाले प्रश्न कब पूछने हैं। अतिरिक्त विपरीत शिक्षण उद्देश्यों से भाषाओं के बीच अर्थपूर्ण रूप से समकक्ष वाक्यांशों के बीच संरेखण को प्रोत्साहन मिलता है।
मैकॅरोन की मेमोरी बैंक उच्च-आयामी वेक्टर स्पेस में एम्बेडिंग्स को संग्रहीत करती है। प्रत्येक मेमोरी आइटम के लिए, एजेंट एक प्रतिनिधित्व गणना करता है जो सामग्री और भाषा दोनों को पकड़ता है। एक क्रॉस-लिंगुअल मेमोरी इंडेक्स लगभग निकटतम पड़ोसी खोज का उपयोग करता है ताकि प्रश्न की भाषा की परवाह किए बिना आइटम प्राप्त किए जा सकें। उदाहरण के लिए, यदि एक कोरियाई उपयोगकर्ता "피자 만들기 레시피" (पिज्जा रेसिपी) पूछता है, तो एजेंट "ピザの作り方" (पिज्जा बनाने का तरीका) के बारे में जापानी मेमोरी पा सकता है क्योंकि दोनों पिज्जा की अवधारणा के करीब एम्बेड करते हैं। पुनर्प्राप्ति के समय, एजेंट उपयोगकर्ता की अनुमतियों द्वारा फ़िल्टर करता है और फिर प्राप्त मेमोरी को उपयोगकर्ता की पसंदीदा भाषा में परिवर्तित करता है, एक अंतर्निहित अनुवादक और सारांशकर्ता का उपयोग करते हुए। यह गोपनीयता सीमाओं को बनाए रखते हुए भाषाओं के बीच ज्ञान साझा करने में सक्षम बनाता है।
बहुभाषीय मॉडल उन पूर्वाग्रहों को फैलाने का जोखिम रखते हैं जो प्रशिक्षण डेटा में मौजूद होते हैं। जापान और कोरिया के लिए, जहां लिंग भूमिकाएं और आयु श्रेणियाँ महत्वपूर्ण सांस्कृतिक भूमिका निभाती हैं, मैकरॉन पूर्वाग्रह‑शमन रणनीतियों को लागू करता है। फाइन‑ट्यूनिंग के दौरान, RL इनाम में उन प्रतिक्रियाओं के लिए दंड शामिल होते हैं जो रूढ़िवाद को बढ़ावा देते हैं या स्थानीय मानदंडों का उल्लंघन करते हैं (जैसे, यह मानना कि केवल महिलाएं ही घरेलू वित्त को संभालती हैं)। नीति बाध्यकारी प्रणाली यह सुनिश्चित करती है कि उपयोगकर्ता की सहमति के बिना व्यक्तिगत डेटा को भाषाओं के बीच कभी अनुवाद नहीं किया जाए। इसके अलावा, मैकरॉन की विभेदित पारदर्शिता नियामकों को विभिन्न स्तरों पर मॉडल व्यवहार का ऑडिट करने की अनुमति देती है: जापानी अधिकारी सामान्य उपयोग पैटर्न की समीक्षा कर सकते हैं, जबकि कोरियाई नियामक सख्त गोपनीयता के तहत कच्चे लॉग की जाँच कर सकते हैं।
जापानी और कोरियाई दोनों में क्षेत्रीय बोलियाँ होती हैं। जापान में, कंसाई बोली में टोक्यो की मानक भाषा की तुलना में अलग शब्दावली और लहजा होता है। कोरियाई बोलियाँ जैसे जिओला और ग्योंगसांग समान चुनौतियाँ प्रस्तुत करती हैं। वर्तमान भाषा पहचानकर्ता बोली इनपुट को गलत वर्गीकृत कर सकते हैं, जिससे असहज प्रतिक्रियाएँ हो सकती हैं। भविष्य के काम में क्षेत्रीय कॉर्पोरा पर प्रशिक्षित बोली एम्बेडिंग को शामिल किया जा सकता है, जिससे एजेंट संबंधित बोली को पहचान सके और उसमें प्रतिक्रिया दे सके। उपयोगकर्ता मैकरोन से किसी विशेष उच्चारण की नकल करने के लिए भी कह सकते हैं, जो रोल‑प्लेइंग खेलों या भाषा सीखने के मॉड्यूल के लिए आकर्षक हो सकता है।
जबकि वर्तमान मॉडल भाषाई प्रतिनिधित्वों को भाषाओं के बीच संरेखित करता है, सामान्य ज्ञान का अभाव सांस्कृतिक अंतरालों से प्रभावित होता है। "त्सुंदोकु" (積ん読, किताबें खरीदना और उन्हें न पढ़ना) या "빵셔틀" (ब्बांग शटल, किसी को अन्य लोगों के लिए रोटी खरीदने के लिए धमकाने की स्लैंग) जैसी अभिव्यक्तियों का अंग्रेज़ी में कोई सीधा समकक्ष नहीं है। क्रॉस-लिंगुअल कॉमन्सेंस नॉलेज ग्राफ्स पर शोध मैकारॉन को इस तरह के सांस्कृतिक विशिष्ट अवधारणाओं को समझने और समझाने में मदद कर सकता है। कॉन्सेप्टनेट जैसी ज्ञान आधारों या एटोमिक के स्थानीयकृत संस्करणों के साथ एकीकरण संरचित सांस्कृतिक ज्ञान प्रदान कर सकता है जो LLM की सांख्यिकीय सीखने के लिए पूरक हो सकता है।
जापान में एआई प्रमोशन एक्ट पारदर्शिता पर जोर देता है और एआई विकास को मौजूदा नियमों के साथ संरेखित करता है, जबकि कोरिया का प्रस्तावित एआई फ्रेमवर्क एक्ट जोखिम प्रबंधन और मानव निगरानी के लिए दायित्व प्रस्तुत करता है। व्यक्तिगत एजेंटों को इन ढांचों को नेविगेट करना होगा जबकि उपयोगकर्ता की गोपनीयता का सम्मान करना होगा। उपयोगकर्ता डेटा को डिवाइस पर रखने के लिए संघीय शिक्षा पर शोध की आवश्यकता है, प्रभेदक गोपनीयता विभिन्न भाषाओं में पहचान विहीनता को रोकने के लिए, और कानूनी अनुपालन इंजन जो जापानी और कोरियाई में नियामक पाठ की व्याख्या कर सकते हैं और इसे नीति बाइंडिंग नियमों के साथ मैप कर सकते हैं।
भविष्य के व्यक्तिगत एजेंट केवल पाठ तक सीमित नहीं होंगे। मैकरॉन का दृष्टिकोण IoT डिवाइस, VR इंटरफेस और पहनने योग्य उपकरणों से जुड़ने को शामिल करता है। विभिन्न भाषाओं के साथ काम करते समय क्रॉस-मॉडल इंटरैक्शन नई जटिलता जोड़ता है: एक जापानी उपयोगकर्ता स्मार्ट स्पीकर से जापानी में बात कर सकता है जबकि मिश्रित वास्तविकता हेडसेट पर कोरियाई उपशीर्षक पढ़ रहा होता है। ऑडियो, पाठ और दृश्य डेटा को भाषाओं के बीच समन्वयित करना मल्टीमॉडल ट्रांसफॉर्मर्स की आवश्यकता होगी जो भाषण, पाठ और छवियों को एक साथ संसाधित कर सकें, साथ ही मोडालिटी के बीच अस्थायी समकालिकता भी आवश्यक होगी।
यह दिखाने के लिए कि क्रॉस-लिंगुअल पर्सनलाइजेशन वास्तविकता में कैसे काम करता है, एक जापानी उपयोगकर्ता पर विचार करें जो कोरियाई सीखना चाहता है और मैकरॉन से एक अध्ययन ऐप बनाने के लिए कहता है। एजेंट उपयोगकर्ता की पिछली भाषा के अनुभवों के लिए उनकी स्मृति से परामर्श करता है—शायद उन्होंने अंग्रेजी पढ़ी हो, इसलिए एजेंट को पता है कि वे दृश्य सहायता और स्थानिक पुनरावृत्ति पसंद करते हैं। इंटेंट पार्सर "लक्ष्य भाषा: कोरियाई," "स्रोत भाषा: जापानी," "अध्ययन फोकस: व्याकरण और शब्दावली," और "दैनिक समय: 20 मिनट" जैसे स्लॉट निकालता है। मैकरॉन का प्रोग्राम सिंथेसिस इंजन तब मॉड्यूल्स को इकट्ठा करता है: हंगुल के लिए एक रूपात्मक विश्लेषक, जापानी उपशीर्षकों के लिए एक वाक्य विभाजन मॉड्यूल, एक स्पेस्ड-रिपीटीशन शेड्यूलर, और एक क्विज जनरेटर जो उपयोगकर्ता की रुचियों से उदाहरणों को एकीकृत करता है (उदाहरण के लिए, कोरियाई ड्रामा या जे-पॉप गीत)।
परिणामी ऐप उच्चारण, उदाहरण वाक्य और सांस्कृतिक टिप्पणियों के साथ शब्दावली कार्ड प्रस्तुत करता है। एक द्विदिश अनुवाद परत कोरियाई शब्दावली को समकक्ष जापानी वाक्यांशों से जोड़ती है, जिसमें पहले वर्णित क्रॉस-भाषिक एम्बेडिंग का उपयोग किया गया है। सुदृढीकरण शिक्षण अनुक्रम को व्यक्तिगत बनाता है: यदि उपयोगकर्ता क्रिया संयुग्मन के साथ संघर्ष करता है, तो इनाम मॉडल व्याकरण अभ्यास को प्राथमिकता देता है; यदि वे गाने के बोल पढ़ने का आनंद लेते हैं, तो एजेंट अधिक गीत अनुवाद प्रस्तुत करता है। क्योंकि मेमोरी सिस्टम प्रत्येक पाठ को भाषा और डोमेन के साथ टैग करता है, कोरियाई अध्ययन में प्रगति बाद में उपयोगकर्ता की जापानी रचनात्मक लेखन को सूचित कर सकती है, भाषाओं के बीच स्थानांतरण शिक्षण को पोषित करती है। उपयोगकर्ता अपने द्विभाषी अध्ययन योजनाओं को मैकरॉन समुदाय में साझा कर सकते हैं, और एजेंट मॉड्यूल लाइब्रेरी को परिष्कृत करने के लिए प्रतिक्रिया की निगरानी करता है।
विभिन्न भाषाओं में संचालित करने की क्षमता डिजिटल पहचान के बारे में गहरे प्रश्न उत्पन्न करती है। Macaron का स्व-प्रारूप पहचान को एक उभरती हुई कथा के रूप में मानता है जो इंटरैक्शन से निर्मित होती है। जब ये इंटरैक्शन कई भाषाओं में होते हैं, तो कथा और भी अधिक प्रवाही हो जाती है। शब्द सांस्कृतिक अर्थों को वहन करते हैं: जापानी शब्द कोकोरो और कोरियाई शब्द 마음 दोनों का अनुवाद "हृदय/मन" के रूप में होता है, लेकिन वे अलग-अलग सूक्ष्मताओं को व्यक्त करते हैं। जब Macaron उपयोगकर्ता की यादों को विभिन्न भाषाओं में बुनता है, तो उसे यह निर्णय लेना होता है कि भावनाओं या यादों का उल्लेख करते समय किन शब्दों का उपयोग किया जाए। यह विकल्प उपयोगकर्ता की आत्म-धारणा को आकार देता है। भाषा के दार्शनिकों का तर्क है कि हमारे विचार उन शब्दों से प्रभावित होते हैं जिन्हें हम उपयोग करते हैं; Macaron इस विचार को क्रियान्वित करता है और संदर्भ और वांछित भावनात्मक स्वर के आधार पर भाषा का चयन करता है।
क्रॉस-लिंगुअल पहचान डिजिटल व्यक्तित्व की अवधारणा को भी छूती है। एक उपयोगकर्ता जापानी और कोरियाई संदर्भों में विभिन्न व्यक्तित्व बनाए रख सकता है - कार्यस्थल पर औपचारिक और आरक्षित, जबकि फैंडम समुदायों में अनौपचारिक और अभिव्यक्तिपूर्ण। मैकरॉन इन सीमाओं का सम्मान करता है और अलग-अलग स्मृति समूहों को बनाए रखते हुए जानबूझकर क्रॉस-परागण की अनुमति देता है। समय के साथ, उपयोगकर्ता अपने पहचान के पहलुओं को जोड़ने का चुनाव कर सकते हैं, अपने जापानी और कोरियाई जीवन के बीच समान धागों की खोज करते हुए। मैकरॉन इस प्रक्रिया को आसान बनाता है, दोनों स्मृति सेटों में समान मूल्य, आदतें और आकांक्षाएं उजागर करके, उपयोगकर्ताओं को संस्कृतियों के पार एक संगठित व्यक्तिगत कहानी बनाने में मदद करता है।