
क्या आप सुलभ AI का अनुभव करने के लिए तैयार हैं? Macaron के साथ इसे आज़माएं: "10 मिनट के फोकस ब्लॉक, कोमल टाइमर और एक टैप में पूरा होने वाले 3-स्टेप सुबह के फ्लो बनाएं।" देखें कि कैसे ADHD-अनुकूल रूटीन आपके दिन की शुरुआत कर सकता है – सब एक व्यक्तिगत AI के माध्यम से जो जानता है कि सुलभता अंतर्निर्मित है, जोड़ी नहीं गई।
सुलभता व्यक्तिगत AI के लिए कोई "अच्छी-अच्छी चीज़" नहीं है – यह आवश्यक है। एक सच्चा व्यक्तिगत AI हर उपयोगकर्ता की आवश्यकताओं के अनुकूल होना चाहिए, चाहे उन्हें ADHD, डिस्लेक्सिया, कम दृष्टि, या सीमित कनेक्टिविटी हो। इस पोस्ट में, हम यह पता लगाते हैं कि Macaron AI न्यूरोडिवर्सिटी और मल्टीमॉडल जीवन के लिए कैसे बनाया गया है, चेकबॉक्स से आगे जाकर सबके लिए समावेशी बुद्धिमानी प्रदान करता है।
समावेशी डिज़ाइन केवल नैतिक नहीं है – यह उस AI के लिए आवश्यक है जो "व्यक्तिगत" होने का दावा करता है। दुनिया का एक महत्वपूर्ण हिस्सा न्यूरोडायवर्जेंट है, फिर भी कई डिजिटल अनुभव अभी भी एक काल्पनिक "औसत" उपयोगकर्ता के लिए बनाए जाते हैं। उदाहरण के लिए, अनुमानित 5 में से 1 बच्चे में सीखने की अक्षमता होती है जो लिखित पाठ को संसाधित करना मुश्किल बना देती है, और लगभग 10% अमेरिकी बच्चों को ADHD का निदान किया गया है (हमारे बीच कई अज्ञात वयस्क भी हो सकते हैं)। यदि एक व्यक्तिगत AI केवल न्यूरोटाइपिकल, पूरी तरह सक्षम उपयोगकर्ताओं के लिए अच्छी तरह से काम करता है, तो यह व्यक्तिगत होने में विफल हो रहा है। उपयोगकर्ताओं से सॉफ़्टवेयर के अनुकूल होने की उम्मीद करने के बजाय, AI को प्रत्येक उपयोगकर्ता की संज्ञानात्मक और संवेदी प्रोफ़ाइल के अनुसार अनुकूलित होना चाहिए – मूल रूप से मास UX से व्यक्तिगत संज्ञान तक शिफ्ट होना।
पारंपरिक "एक आकार सभी के लिए" UX अक्सर न्यूरोविविध उपयोगकर्ताओं को निराश करता था। व्यक्तिगत AI इस स्क्रिप्ट को उलट देता है: यह लगातार सीखता है और आपके सोचने और काम करने के तरीके के अनुरूप होता है। दूरदर्शी शोधकर्ता भविष्यवाणी करते हैं कि AI-संचालित इंटरफेस जल्द ही उपयोगकर्ता की पहुंच प्राथमिकताओं के अनुसार वास्तविक समय में अनुकूलन करेंगे, जो डिजिटल उत्पादों में लगभग सर्वव्यापी हो जाएंगे। व्यवहार में, इसका मतलब है कि यदि आपको ध्यान केंद्रित करने में कठिनाई होती है, तो आपका AI कार्यों को छोटे चरणों में विभाजित कर सकता है; यदि चमकदार स्क्रीन से इंद्रिय अधिभार होता है, तो यह एक शांत, उच्च-विपरीत थीम पर डिफ़ॉल्ट कर सकता है। लक्ष्य एक संज्ञानात्मक फिट है: आपका AI आपको उसी स्थान पर मिलना चाहिए जहां आप हैं (न कि इसके विपरीत)। अंततः, न्यूरोविविधता के चरम सीमा के लिए डिजाइन करना हर किसी के लिए UX को सुधारता है – जैसा कि माइक्रोसॉफ्ट के इमर्सिव रीडर ने साबित किया, जो डिस्लेक्सिक छात्रों की मदद कर रहा था और फिर लाखों सामान्य उपयोगकर्ताओं द्वारा प्रिय हो गया।
वेब कंटेंट एक्सेसिबिलिटी गाइडलाइंस (WCAG) जैसे एक्सेसिबिलिटी मानकों को पूरा करना एक आवश्यक प्रारंभिक बिंदु है, लेकिन सच्चा व्यक्तिगत AI इससे आगे जाता है। WCAG सामान्य सर्वोत्तम प्रथाओं पर ध्यान केंद्रित करता है - रंग कंट्रास्ट, टेक्स्ट विकल्प, कीबोर्ड नेविगेशन - और एक ठोस नींव प्रदान करता है। हालाँकि, केवल अनुपालन ही ADHD या ऑटिज़्म वाले व्यक्ति के लिए अनुभव को सुलभ महसूस कराने की गारंटी नहीं देता। उदाहरण के लिए, WCAG वीडियो के लिए कैप्शन या छवियों के लिए ऑल्ट टेक्स्ट की आवश्यकता कर सकता है, लेकिन यह सुनिश्चित नहीं करता कि सामग्री सरल भाषा में लिखी गई है या इंटरफेस संज्ञानात्मक रूप से भारी नहीं हैं। मैकरॉन WCAG 2.1 को मूलभूत मानता है और फिर इसमें वैयक्तिकरण की परतें जोड़ता है। मानक एक्सेसिबिलिटी सुविधाओं को रैंप और रेलिंग के रूप में सोचें - मैकरॉन के पास निश्चित रूप से ये हैं। लेकिन यह समय के साथ प्रत्येक उपयोगकर्ता की अनूठी आवश्यकताओं को सीखता है, प्रभावी रूप से एक व्यक्तिगत एक्सेसिबिलिटी सहायक बन जाता है। एक ऐसा इंटरफेस जो दिशानिर्देशों का पालन करता है लेकिन कठोर रहता है, पर्याप्त नहीं है; इसे प्रत्येक व्यक्ति के लिए लचीला और अनुकूल होना चाहिए। जैसा कि एक डिज़ाइन एजेंसी ने कहा, "एक्सेसिबिलिटी अनुपालन एक प्रारंभिक बिंदु है, लेकिन सच्ची समावेशिता के लिए उपयोगकर्ता आवश्यकताओं की गहरी समझ आवश्यक है।"

न्यूरोडाइवर्सिटी में ADHD, ऑटिज़्म, डिस्लेक्सिया जैसे हालात शामिल हैं, जिनमें अलग-अलग चुनौतियाँ और ताकतें होती हैं। न्यूरोडाइवर्जेंट उपयोगकर्ताओं के लिए मैकरॉन डिज़ाइन करना लचीलापन, संरचना और स्पष्टता को समान रूप से अपनाना है। हम समावेशी डिज़ाइन अनुसंधान और संज्ञानात्मक विज्ञान से उधार लेते हैं ताकि ऐसे फ्लो तैयार किए जा सकें जो संज्ञानात्मक बोझ को कम करें और उपयोगकर्ता को नियंत्रण में रखें। नीचे, हम मैकरॉन के डिज़ाइन में शामिल कुछ न्यूरोडाइवर्सिटी-अनुकूल पैटर्न को उजागर करते हैं।
एडीएचडी वाले उपयोगकर्ताओं के लिए, लंबे असंरचित कार्य और अंतहीन विकल्प अवरोधक हो सकते हैं। मैकरॉन इसे केंद्रित, छोटे चरणों में बातचीत को संरचित करके संबोधित करता है - मूल रूप से "एक स्क्रीन, एक कार्य" नियम का पालन करके अतिभार से बचाता है। आपके ऊपर एक विशाल फॉर्म या 10-चरण प्रक्रिया डालने के बजाय, मैकरॉन कार्यप्रवाह को प्रबंधनीय भागों में तोड़ता है जिनमें स्पष्ट अगले कार्य होते हैं। इससे गति का अनुभव होता है (जैसा कि एडीएचडी वाले एक डिज़ाइनर ने नोट किया, "अगला" पर क्लिक करने से एक छोटी सी उपलब्धि का एहसास होता है जो आपको आगे बढ़ने में मदद करता है)। मैकरॉन समय-सीमा तकनीकों का भी उपयोग करता है: उदाहरण के लिए, आप इसे किसी कार्य के लिए 10 मिनट का ध्यान केंद्रित टाइमर सेट करने के लिए कह सकते हैं, या यह सुझाव दे सकता है "चलो 5 मिनट विचार मंथन करते हैं, फिर ब्रेक लेते हैं" - एडीएचडी के लिए अक्सर सिफारिश की जाने वाली समय प्रबंधन रणनीतियों का लाभ उठाते हुए।
कोमल इशारे और याद दिलाने वाले नोट्स एक और अंतर्निहित विशेषता हैं। भूलने की आदत ADHD की एक सामान्य बाधा है, इसलिए Macaron आपको कार्यों या समय सीमाओं के बारे में बिना ध्यान आकर्षित किए याद दिलाएगा इससे पहले कि वे संकट बन जाएं। ये सामान्य सूचनाएं नहीं हैं, बल्कि संदर्भ-सचेत संकेत हैं (जैसे आपके सुबह के समय "👍 3 में से 2 चरण पूरे हो गए हैं, जारी रखें!" का एक सूक्ष्म संदेश)। प्रेरणा बनाए रखने के लिए, Macaron दृश्य प्रगति संकेतक का भी उपयोग करता है - सरल चेकलिस्ट से जो पूरे हुए चरणों को टिक करता है, उन प्रगति पट्टियों तक जो वर्कफ़्लो में आगे बढ़ने के साथ भरती जाती हैं। अनुसंधान से पता चलता है कि इनाम देने वाली दृश्य प्रतिक्रिया जैसे प्रगति पट्टियाँ या कंफ़ेटी बर्स्ट ADHD वाले उपयोगकर्ताओं को संलग्न रहने और यह देखने में मदद कर सकते हैं कि वे लक्ष्य की ओर बढ़ रहे हैं। संक्षेप में, Macaron में ADHD-अनुकूल प्रवाह संरचित लेकिन बाध्यकारी नहीं है: यह ध्यान बनाए रखने के लिए गार्डरेल प्रदान करता है, जबकि प्रत्येक छोटे विजय का जश्न मनाकर गति बनाए रखता है।
पाठ-गहन सामग्री डिस्लेक्सिया वाले उपयोगकर्ताओं के लिए महत्वपूर्ण चुनौतियां पेश कर सकती है। इसलिए, मैकरॉन का यूआई अधिकतम पठनीयता के लिए समायोजित है। डिफ़ॉल्ट रूप से, हम साफ-सुथरे सैन्स-सेरिफ़ फोंट (जैसे हेल्वेटिका या एरियल) का उपयोग करते हैं और शैलीबद्ध या इटैलिक टेक्स्ट से बचते हैं, जो समझने में कठिन हो सकता है। अधिक महत्वपूर्ण बात यह है कि मैकरॉन एक डिस्लेक्सिया मोड टॉगल प्रदान करता है जो डिस्लेक्सिया-अनुकूल सेटिंग्स के साथ सामग्री को पुन: स्वरूपित करता है। इस मोड को सक्रिय करने से अक्षर-अंतराल और शब्द-अंतराल को अनुशंसित स्तरों तक बढ़ाया जाएगा (अध्ययन बताते हैं कि विस्तृत अंतराल – लगभग 35% अतिरिक्त अक्षर-अंतराल और शब्द-अंतराल में उससे 3.5 गुना ज्यादा – डिस्लेक्सिक पाठकों के लिए पठनीयता को नाटकीय रूप से सुधारता है)। जब डिस्लेक्सिया मोड चालू होता है, तो हम लिगेचर और फैंसी टाइपोग्राफी को भी अक्षम कर देते हैं, क्योंकि कभी-कभी एक संयुक्त "fi" अक्षर भी पाठकों को भ्रमित कर सकता है। लक्ष्य "दृश्य भीड़भाड़" को कम करना है, जिससे प्रत्येक अक्षर और शब्द को अधिक सांस लेने की जगह मिल सके।
टाइपोग्राफी से परे, मैकरॉन सामग्री के लेआउट और जटिलता को डिस्लेक्सिक या अन्य पाठकों के लिए समायोजित कर सकता है जो सरलता पसंद करते हैं। उदाहरण के लिए, यह एक लंबे दस्तावेज़ या ईमेल का वैकल्पिक सरल सारांश प्रस्तुत कर सकता है। अपनी विशाल भाषा मॉडल का उपयोग करते हुए, मैकरॉन जटिल पाठ को उपयोगकर्ता के पढ़ने के स्तर पर साधारण भाषा में पुनःप्रस्तुत करेगा - बिना अर्थ को कम किए। इस तरह की मांग पर पाठ सरलीकरण केवल सुविधा नहीं है; यह कई उपयोगकर्ताओं के लिए महत्वपूर्ण है। अकेले जर्मनी में, 10-17 मिलियन लोगों को गंभीर पढ़ने की चुनौतियाँ हैं, और विश्व भर में 16% वयस्कों (लगभग 759 मिलियन) के पास बुनियादी साक्षरता कौशल की कमी है। उनके लिए, एक जटिल दस्तावेज़ एक अजेय बाधा हो सकता है। मैकरॉन का उत्तर एक व्यक्तिगत पढ़ने सहायक है जो स्वचालित रूप से सामग्री को सरल या समझा सकता है। यदि आपको एक घना कानूनी नोटिस या एक शैक्षणिक लेख प्राप्त होता है, तो आप मैकरॉन से इसे रोजमर्रा की भाषा में "अनुवाद" करने के लिए कह सकते हैं। परिणाम एक बातचीतपूर्ण, संक्षिप्त शैली में प्रस्तुत सामग्री होता है जिसे एक व्यापक दर्शक समझ सकता है - "साधारण भाषा" का एक व्यावहारिक अनुप्रयोग। महत्वपूर्ण रूप से, यह सुविधा अन्य लोगों के लिए भी फायदेमंद है (व्यस्त लोग जो जल्दी से सारांश चाहते हैं, गैर-मूल वक्ता आदि)। निजीकृत करने का अर्थ है कि आप पाठ की जटिलता को अपनी पसंद के अनुसार बढ़ा या घटा सकते हैं - एक विशिष्टता जो स्थिर पहुंच दिशानिर्देशों से कहीं अधिक है।
संवेदी संवेदनशीलताएँ न्यूरोडायवर्सिटी का एक और पहलू हैं जिसे मैकरॉन सक्रिय रूप से समायोजित करता है। कुछ उपयोगकर्ता (जिनमें से कई ऑटिज्म स्पेक्ट्रम या वेस्टिबुलर विकारों वाले होते हैं) अत्यधिक ऑन-स्क्रीन गति और चमकदार एनिमेशन से अभिभूत या यहां तक कि मतली महसूस कर सकते हैं। मैकरॉन में, एनिमेशन और प्रभाव डिफ़ॉल्ट रूप से न्यूनतम होते हैं, और एक वैश्विक "गति कम करें" सेटिंग किसी भी गैर-आवश्यक गति को हटा देगी (इसे iOS की "गति कम करें" सेटिंग की तरह समझें, लेकिन एआई के इंटरफ़ेस पर वेब और ऐप में लागू किया गया है)। हम उपयोगकर्ता की ओएस-स्तरीय प्राथमिकता का भी सम्मान करते हैं – अगर आपका डिवाइस prefers-reduced-motion पर सेट है, तो मैकरॉन स्वचालित रूप से चीजों को कम कर देगा। यही बात दृश्य विपरीतता और रंग के लिए भी लागू होती है: कम दृष्टि वाले उपयोगकर्ताओं के लिए एक उच्च विपरीत मोड उपलब्ध है, जो गहरे थीम के साथ बोल्ड टेक्स्ट और साफ़ संकेतकों का उपयोग करता है (यह किसी भी व्यक्ति के लिए फायदेमंद है जो तेज धूप में या कम गुणवत्ता वाली स्क्रीन पर है)। मैकरॉन में सभी आइकन और रंग संकेतक रंग-ब्लाइंड के अनुकूल पैलेट के साथ डिज़ाइन किए गए हैं और न्यूनतम WCAG AA विपरीत अनुपालन के लिए परीक्षण किए गए हैं।
Macaron उन लोगों के लिए "क्वाइट मोड" भी प्रदान करता है जिन्हें कम-विघटन, कम-उत्तेजना अनुभव की आवश्यकता होती है। जब सक्रिय होता है, क्वाइट मोड गैर-आवश्यक सूचनाओं और ध्वनियों को बंद कर देता है, आवश्यक अलर्ट के लिए एक कोमल हैप्टिक या सॉफ़्ट चाइम का उपयोग करता है, और वर्तमान कार्य से असंबंधित किसी भी UI तत्व (जैसे साइडबार या सजावटी चित्र) को छिपा देता है। यह कई लोगों के लिए सहायक "फोकस मोड" के समान है – यह आपके इंटरफेस पर शोर-रद्द करने वाले हेडफ़ोन लगाने जैसा है। गैर-आवश्यक सामग्री और ऑडियो को छिपाकर, Macaron का क्वाइट UX मोड संवेदनशील उपयोगकर्ताओं के लिए काम करने के लिए एक शांत स्थान बनाता है। डिजाइनरों ने नोट किया है कि यहां तक कि न्यूरोटिपिकल उपयोगकर्ता भी अक्सर ऐसी विकल्पों की सराहना करते हैं – कभी-कभी आप विघटन-मुक्त अनुभव चाहते हैं। सभी मामलों में, सिद्धांत है उपयोगकर्ता को नियंत्रण देना: चमक, कंट्रास्ट, फ़ॉन्ट आकार, गति, ध्वनि – हर संवेदी पहलू को समायोजित किया जा सकता है। यह अनुकूलन सुनिश्चित करता है कि Macaron तब भी पर्याप्त उत्तेजक हो सकता है जब प्रेरणा कम हो, या उपयोगकर्ता पर भार अधिक हो तो शांत और स्थिर।

आपका जीवन एक ही मोड में नहीं चलता - आप बात करते हैं, टेक्स्ट करते हैं, देखते हैं, सुनते हैं। तो आपके पर्सनल AI को एक ही इंटरेक्शन मोड में क्यों फंसा रहना चाहिए? मैकरॉन को इस तरह बनाया गया है कि यह आपके लिए जो भी सबसे आरामदायक या सुविधाजनक हो, उसी तरह से इंटरैक्ट करे। कुछ लोग "टेक्स्टर्स" नहीं होते और बात करना पसंद करते हैं; अन्य लोग विज़ुअल्स पर निर्भर हो सकते हैं या हर ऑडियो का ट्रांसक्रिप्ट चाहिए। मल्टीमोडल डिज़ाइन को अपनाना सिर्फ एक शानदार ऐड-ऑन नहीं है, बल्कि एक्सेसिबिलिटी के लिए एक आवश्यकता है। जैसा कि AI के विचारशील नेता देखते हैं, अगली पीढ़ी के इंटरफेस में आवाज़, दृष्टि, और इशारों को टेक्स्ट के साथ एकीकृत किया जाएगा, जिससे उपयोगकर्ता लचीले, सन्दर्भ-उपयुक्त तरीकों से इंटरैक्ट कर सकें। यहाँ बताया गया है कि मैकरॉन व्यक्तिगत सहायता में मल्टीमोडलिटी कैसे लाता है:
आवाज़ एक शक्तिशाली माध्यम है, खासकर उन उपयोगकर्ताओं के लिए जिनके हाथ व्यस्त हैं, कम दृष्टि वाले हैं, या जो सुनकर जानकारी को बेहतर तरीके से समझते हैं। मैकरॉन के पास एक मजबूत वॉयस-फर्स्ट इंटरफेस है: आप इसे वाक इनपुट के माध्यम से संवाद कर सकते हैं और यह एक प्राकृतिक आवाज़ में वापस बात करेगा। यह आपका पुराना असुविधाजनक फोन सिस्टम नहीं है - यह एक संवादात्मक एजेंट है जो संदर्भ को समझता है। उदाहरण के लिए, खाना बनाते समय आप कह सकते हैं, "हे मैकरॉन, मेरे शॉपिंग लिस्ट में लहसुन जोड़ो और 5 मिनट का पास्ता टाइमर सेट करो।" यह मौखिक रूप से प्रत्येक क्रिया की पुष्टि करेगा ("लहसुन जोड़ा गया। 5 मिनट के लिए टाइमर सेट किया गया है।") ताकि आपको पता चले कि यह सही तरीके से समझा गया - ये पुष्टिकरण चक्र आवाज़ का इस्तेमाल करते समय गलतफहमियों से बचने के लिए महत्वपूर्ण हैं। हमने वॉयस UX अनुसंधान से सीखा है कि स्पष्ट पुष्टिकरण और आवाज के माध्यम से रद्द करने या पूर्ववत करने की क्षमता एक अच्छे हाथ-मुक्त अनुभव के लिए कुंजी हैं (कोई भी ऐसा एआई नहीं चाहता जो गलत काम करे और बिना जाँच के आगे बढ़े)।
वॉयस इंटरैक्शन कई क्षेत्रों में एक्सेसिबिलिटी को नाटकीय रूप से सुधारते हैं। ये उन लोगों की मदद कर सकते हैं जिनकी गतिशीलता में बाधा है (अगर स्वाइप करना या टाइप करना मुश्किल हो तो इसकी जरूरत नहीं), और कुछ उपयोगकर्ताओं के लिए संज्ञानात्मक भार को कम कर सकते हैं - अनुरोध बोलना जटिल GUI को नेविगेट करने की तुलना में अधिक सहज हो सकता है। व्यापक प्रवृत्ति को ध्यान में रखना महत्वपूर्ण है: वॉयस असिस्टेंट पहले से ही सैकड़ों मिलियन लोगों द्वारा दैनिक रूप से उपयोग किए जाते हैं, और ये उन लोगों के लिए प्रौद्योगिकी की पहुंच खोलते हैं जिन्होंने पहले पारंपरिक इंटरफेस के साथ संघर्ष किया था। उदाहरण के लिए, दृष्टि विकलांगता वाले व्यक्ति मैकरॉन के वॉयस मोड का उपयोग करके ऐप्स को संचालित कर सकते हैं, संदेश भेज सकते हैं, या बिना स्क्रीन देखे जानकारी प्राप्त कर सकते हैं। शिक्षा में भी, वॉयस तकनीक अमूल्य साबित हो रही है: स्कूल-आयु के लगभग 20% बच्चों को पढ़ने में चुनौतियाँ होती हैं, और वॉयस-एनेबल्ड लर्निंग टूल्स उन्हें सुनकर सामग्री को अवशोषित करने देते हैं या लिखने के बजाय बोलकर प्रतिक्रिया देने देते हैं। मैकरॉन का वॉयस-फर्स्ट डिज़ाइन इसके अनुरूप है - यह एक समानता लाने वाला है जो आपको प्राकृतिक रूप से इंटरैक्ट करने देता है। चाहे आप ड्राइविंग करते समय (हैंड्स फ्री) कमांड दे रहे हों, या आप टाइपिंग के बजाय बात करना पसंद करते हों, AI अनुकूलित होता है। और अगर आपके भाषण में अंतर या उच्चारण हैं, तो मैकरॉन लगातार आपकी आवाज़ सीख रहा है; साथ ही, इलिनोइस विश्वविद्यालय की स्पीच एक्सेसिबिलिटी प्रोजेक्ट जैसी चल रही परियोजनाएं उन उपयोगकर्ताओं के लिए आवाज़ मान्यता को बेहतर बना रही हैं जिनके भाषण पैटर्न सामान्य से अलग हैं, जिसे हम ध्यान में रखते हैं।
Macaron एक और तरीका जिसमें माहिर है, वह है दृष्टि - सिर्फ चित्र या चार्ट नहीं बनाना, बल्कि वास्तव में आपके दिए गए दृश्य इनपुट को समझना। जीवन दृश्य जानकारी से भरा है: फोटो, स्क्रीनशॉट, स्कैन किए गए PDF, स्लाइड्स, उत्पादों पर लेबल, जो भी कहें। Macaron इन्हें विश्लेषित कर सकता है और इनसे अर्थ और कार्यवाही करने में आपकी मदद कर सकता है। उदाहरण के लिए, आप एक पत्र या अपॉइंटमेंट कार्ड की तस्वीर ले सकते हैं और Macaron से पूछ सकते हैं, "मुझे इसके साथ क्या करना चाहिए?" OCR और दृष्टि AI का उपयोग करके, यह टेक्स्ट को पढ़ेगा, उसे समझेगा, और कुछ ऐसा जवाब देगा: "ऐसा लगता है कि आपका दांत का अपॉइंटमेंट 5 जून को सुबह 10 बजे है। मैंने इसे आपके कैलेंडर में जोड़ दिया है और एक रिमाइंडर सेट किया है।" यह सरल विवरण से परे है - यह कार्य योग्य जानकारी निकालने के बारे में है। यह फॉर्म्स के लिए भी ऐसा कर सकता है (जैसे, "यहां हस्ताक्षर करें और इसे शुक्रवार तक अपने HR को भेज दें") या अधिक रोज़मर्रा के कार्यों के लिए जैसे जब आप अपने चश्मे नहीं ढूँढ पा रहे हों तब पैकेज से सामग्री पढ़ना।
एक दृष्टिहीन या कम दृष्टि वाला उपयोगकर्ता उस AI से लाभ उठा सकता है जो दुनिया को देखता है और उसका वर्णन करता है। मैकरॉन, Be My Eyes के "Be My AI" फीचर के समान कंप्यूटर विज़न का उपयोग करता है, जो छवियों के तेज़ और जीवंत वर्णन प्रदान करता है और यहां तक कि उनके बारे में आगे के प्रश्नों के उत्तर भी देता है। इस तरह, व्यक्तिगत AI एक हमेशा उपलब्ध दृश्य दुभाषिया के रूप में कार्य कर सकता है, चाहे वह कोई संकेत पढ़ना हो, किसी वस्तु की पहचान करना हो, या सादे अंग्रेजी में एक चार्ट का सारांश देना हो।
विशिष्ट पढ़ने के स्तर तक सारांश बनाने की क्षमता भी एक गेम-चेंजर है। हमने चर्चा की कि कैसे Macaron डिस्लेक्सिया वाले उपयोगकर्ताओं के लिए पाठ को सरल बनाता है; यह किसी भी दस्तावेज़ या वेब पेज पर लागू होता है जिसका आप सामना करते हैं। आप Macaron को एक अकादमिक पेपर या लंबा समाचार लेख दे सकते हैं और कह सकते हैं, "मुझे 8वीं कक्षा के पढ़ने के स्तर पर TL;DR दें" - और यह सरल, स्पष्ट भाषा में एक संक्षिप्त सारांश तैयार करेगा। इसके पीछे, यह उन्नत LLM-आधारित पाठ सरलीकरण तकनीकों का उपयोग करता है ताकि जटिलता को कम करते हुए अर्थ को बनाए रखा जा सके। यह न केवल पढ़ने में कठिनाई वाले उपयोगकर्ताओं के लिए, बल्कि गैर-मूल भाषा बोलने वालों (या सच कहें तो, किसी भी समय की कमी वाले व्यक्ति) के लिए भी अत्यंत सहायक है। यूरोप में लगभग 20-25% लोग क्रियात्मक रूप से निरक्षर हैं और कई अन्य अपनी गैर-मूल भाषा में सीमित साक्षरता रखते हैं, ऐसी सुविधा का महत्व कम नहीं आंका जा सकता। मोडालिटी को अनुकूलित करके (पाठ को आवाज में बदलना, या घने पाठ को सरल पाठ + चित्रों में बदलना), Macaron यह सुनिश्चित करता है कि आपको प्रारूप के कारण जानकारी से वंचित नहीं किया जाए। यह अनुवाद के माध्यम से पहुंच है - भाषाओं के बीच, जटिलता स्तरों के बीच, और संवेदी मोड के बीच।
एक बहुविध AI में, ऑडियो आउटपुट अद्भुत होता है – लेकिन हर कोई ऑडियो सुन या समझ नहीं सकता। इसलिए जो कुछ भी मैकरॉन कहता या बजाता है, वह डिफ़ॉल्ट रूप से टेक्स्ट रूप में उपलब्ध होता है। यदि मैकरॉन कोई वॉइस उत्तर देता है या सारांश सुनाता है, तो आपको चैट या ऐप लॉग में एक साथ ट्रांसक्रिप्ट दिखाई देगा। यह निश्चित रूप से बहरे और सुनने में कठिनाई वाले उपयोगकर्ताओं के लिए फायदेमंद है, लेकिन यह कई स्थितियों में भी उपयोगी होता है: हो सकता है कि आप एक शांत पुस्तकालय में हों और ध्वनि नहीं चला सकते, या आप बाद में बातचीत को फिर से देखना चाहते हैं। विशेष रूप से, अध्ययन बताते हैं कि जो लोग वीडियो पर कैप्शन का उपयोग करते हैं उनमें से 80% से अधिक सुनने में अक्षम नहीं होते हैं – वे सुविधा के लिए या शोरगुल/शांत वातावरण के कारण कैप्शन का उपयोग करते हैं। मैकरॉन में, कैप्शनिंग कोई बाद की बात नहीं है; यह निर्मित होता है। यदि आप मैकरॉन के इंटरफ़ेस के माध्यम से कोई वीडियो या पॉडकास्ट देखते हैं (एक AI-कीरीकृत लर्निंग प्लेलिस्ट की कल्पना करें), तो आप स्वतः उत्पन्न कैप्शन और एक पूर्ण ट्रांसक्रिप्ट प्राप्त कर सकते हैं ताकि आप साथ-साथ जा सकें या उसके भीतर खोज सकें। हम इन ट्रांसक्रिप्ट्स को अत्यधिक सटीक बनाने के लिए अत्याधुनिक स्पीच-टू-टेक्स्ट मॉडल का उपयोग करते हैं, और टेक्स्ट को पठनीयता के लिए स्वरूपित किया गया है (स्पीकर लेबल, समय-स्टैम्प आदि, आवश्यकतानुसार)।
प्रतिलेख और कैप्शन कई न्यूरोडायवर्जेंट उपयोगकर्ताओं के लिए समझ को बेहतर बनाते हैं – उदाहरण के लिए, ADHD वाले किसी व्यक्ति को AI के स्पष्टीकरण को सुनने और उसे पढ़ने से ध्यान केंद्रित करने में मदद मिल सकती है। इसी तरह, गैर-स्थानीय वक्ताओं को अक्सर यह जांचने के लिए प्रतिलेख का उपयोग करना पड़ता है कि उन्होंने क्या सुना। इन बहु-मोडल पुनरावृत्तियों को प्रदान करके, मैकरॉन सब कुछ कवर करता है। यह सार्वभौम डिजाइन के एकाधिक प्रतिनिधित्व के सिद्धांत के साथ मेल खाता है: विभिन्न प्राथमिकताओं के अनुरूप जानकारी को विभिन्न रूपों में प्रस्तुत करें। और यह एक कदम आगे बढ़ता है: मैकरॉन में प्रतिलेख खोजने योग्य और निर्यात करने योग्य होते हैं, इसलिए आप पिछले सप्ताह आपके AI ने क्या बताया था इसकी समीक्षा कर सकते हैं या यहां तक कि अपने पिछले सत्र का सारांश प्राप्त कर सकते हैं (मेटा, हम जानते हैं!)। मुख्य बात यह है कि यदि कोई ऑडियो आउटपुट है, तो एक समान पाठ वहीं है – किसी भी उपयोगकर्ता को इसे पूछने या खोजने की आवश्यकता नहीं होनी चाहिए। पहुंच की दुनिया में, यह सिर्फ मूल बातें सही कर रहा है: कैप्शन और प्रतिलेख सुनिश्चित करते हैं कि कोई भी बोले गए सामग्री से बाहर नहीं रह जाता। जैसा कि धारा 508 दिशानिर्देशों में उल्लेख किया गया है, प्रतिलेख केवल सुनने की हानि वाले लोगों के लिए नहीं हैं; वे भाषा सीखने वालों और शोरगुल या मौन स्थानों में किसी के लिए भी समान रूप से सहायक होते हैं। मैकरॉन इसे पूरी तरह से अपनाता है।