Macaron 如何适应神经多样性及您生活的方方面面(第一部分)

Macaron AI 无障碍和神经多样性

Author: Boxu Li at Macaron

准备好体验可访问的 AI 实际应用了吗?试试用 Macaron 做这个:"制作一个包含 10 分钟专注时间块、温和计时器和一键完成的 3 步晨间流程。" 看看 ADHD 友好的例程如何启动您的一天——所有这些都通过一个知道无障碍功能是内置的,而不是外加的个人 AI 来实现。

对于个人 AI 来说,无障碍功能不是"锦上添花"——它是基本要求。真正的个人 AI 必须灵活适应每个用户的需求,无论他们有 ADHD、阅读障碍、低视力还是网络连接受限。在这篇文章中,我们探讨了 Macaron AI 如何为神经多样性和多模态生活而构建,超越简单的功能清单,为所有人提供包容性智能。

为什么无障碍功能是个人 AI 的核心(而不是锦上添花)

包容性设计不仅是道德要求——对于声称"个人化"的 AI 来说,这是必不可少的。世界上很大一部分人口是神经多样性的,但许多数字体验仍然迎合虚构的"平均"用户。例如,估计五分之一的儿童有学习障碍,使处理书面文本变得困难,近10% 的美国儿童被诊断患有 ADHD(其中许多未被诊断的成年人可能就在我们中间)。如果个人 AI 只对神经典型、完全健全的用户有效,那么它就无法做到真正的个人化。与其期望用户适应软件,AI 必须适应每个用户的认知和感官特征——本质上是从大众用户体验转向个性化认知。

从大众用户体验到个性化认知

传统的"一刀切"用户体验经常让神经多样性用户感到沮丧。个人 AI 颠覆了这种做法:它持续学习并适应的思维和工作方式。有远见的研究人员预测,AI 驱动的界面很快将实时适应用户的无障碍偏好,在数字产品中变得几乎无处不在。在实践中,这意味着如果您难以集中注意力,您的 AI 可以将任务分解为小块步骤;如果明亮的屏幕触发感官过载,它可以默认使用平静、高对比度的主题。目标是认知契合:您的 AI 应该在您所在的地方与您会面(而不是相反)。最终,为神经多样性的极端情况设计最终会改善每个人的用户体验——正如微软的沉浸式阅读器通过帮助阅读障碍学生,然后被数百万普通用户喜爱所证明的那样。

标准及其之上(WCAG 合规性作为基线,个性化作为差异化因素)

符合网页内容无障碍指南(WCAG)等无障碍标准是必要的起点,但真正的个人 AI 更进一步。WCAG 专注于一般最佳实践——颜色对比、文本替代、键盘导航——并提供坚实的基础。然而,仅仅合规并不能保证对患有 ADHD 或自闭症的人来说感觉无障碍的体验。例如,WCAG 可能要求视频字幕或图像替代文本,但不能确保内容以简单语言编写或界面在认知上不会造成负担。Macaron 将 WCAG 2.1 视为基本要求,然后构建个性化层次。将标准无障碍功能视为坡道和扶手——Macaron 当然有这些。但它还会随着时间的推移学习每个用户的独特需求,有效地成为个人无障碍助手。符合指南但保持僵化的界面是不够的;它应该为每个人变形和弯曲。正如一家设计机构所说,"无障碍合规性是一个起点,但真正的包容性需要对用户需求的更深入理解。"

为神经多样性设计 Macaron

神经多样性设计原则

神经多样性涵盖 ADHD、自闭症、阅读障碍等条件——每种都有不同的挑战和优势。为神经多样性用户设计 Macaron 意味着同等地拥抱灵活性、结构性和清晰性。我们借鉴包容性设计研究和认知科学,创建减少认知负荷同时让用户保持控制的流程。下面,我们重点介绍 Macaron 设计中内置的一些神经多样性友好模式。

ADHD 友好流程(短步骤、时间分块、提醒、视觉进度)

对于 ADHD 用户来说,长而无结构的任务和无穷的选择可能令人瘫痪。Macaron 通过将交互结构化为专注的短步骤来解决这个问题——本质上遵循"一屏一任务"规则以避免过载。Macaron 不会向您倾倒巨大的表单或 10 步流程,而是将工作流程分解为具有明确下一步操作的可管理块。这创造了一种动力感(正如一位患有 ADHD 的设计师所说,点击"下一步"给出一点成就感,让您继续前进)。Macaron 还采用时间分块技术:例如,您可以要求它为任务设置10 分钟专注计时器,或者它可能建议*"让我们花 5 分钟头脑风暴,然后休息一下"*——利用通常推荐给 ADHD 的时间管理策略。

温和的提醒和推送是另一个内置功能。健忘是常见的 ADHD 障碍,所以 Macaron 会在任务或截止日期成为危机之前不显眼地提醒您。这些不是通用通知,而是上下文感知的提示(例如,在您的晨间例程中微妙的"👍 完成了 3 步中的 2 步,继续加油!")。为了保持动力,Macaron 还使用视觉进度指示器——从简单的复选框列表勾选完成的步骤,到随着您推进工作流程而填满的进度条。研究表明,像进度条或彩带爆发这样的奖励性视觉反馈可以帮助 ADHD 用户保持参与并看到他们正朝着目标前进简而言之,Macaron 中的 ADHD 友好流程是结构化但不压抑的:它提供护栏来保持专注,同时庆祝每个小胜利以维持动力。

阅读障碍感知呈现(可读性、间距、可选简化模式)

文本繁重的内容可能对阅读障碍用户构成重大挑战。因此,Macaron 的 UI 调整为最大可读性。默认情况下,我们使用干净的无衬线字体(例如 Helvetica 或 Arial)并避免风格化或斜体文本,这些可能更难辨认。更重要的是,Macaron 提供阅读障碍模式切换,使用阅读障碍友好设置重新格式化内容。激活此模式将增加字母间距和单词间距到推荐水平(研究表明,更宽的间距——大约35% 的额外字母间距和 3.5 倍的单词间距——显著改善阅读障碍读者的可读性)。当阅读障碍模式开启时,我们还禁用连字和花哨的排版,因为有时甚至合并的"fi"字符也可能让读者绊倒。目标是减少文本的"视觉拥挤",给每个字母和单词更多的呼吸空间。

除了排版,Macaron 还可以为阅读障碍或其他喜欢简单的读者调整内容的布局和复杂性。例如,它可以呈现冗长文档或电子邮件的可选简化摘要。使用其大型语言模型,Macaron 将复杂文本重新表述为用户阅读水平的简单语言——不会简化意思。这种按需文本简化不仅仅是便利;对许多用户来说至关重要。仅在德国就有**1000-1700 万人有严重的阅读困难,全世界 16% 的成年人(约 7.59 亿)缺乏基本识字技能。**对他们来说,充满术语的文档可能是无法克服的障碍。Macaron 的答案是一个可以自动简化或解释内容的个人阅读助手。如果您收到密集的法律通知或学术文章,您可以要求 Macaron 将其"翻译"成日常语言。结果是以对话式、简洁的风格呈现的内容,更广泛的受众可以理解——这是"简单语言"的实际应用。重要的是,此功能也惠及其他人(想要快速了解要点的忙碌人士、非母语使用者等)。个性化意味着您可以根据喜好调整文本复杂性——这是远超静态无障碍指南的差异化因素。

感官适应模式(减少动画、高对比度、安静用户体验)

感官敏感性是 Macaron 积极适应的神经多样性的另一个方面。一些用户(包括许多自闭症谱系或前庭疾病患者)可能被过多的屏幕动画和闪烁动画所淹没,甚至感到恶心。在 Macaron 中,动画和效果默认是最小的,全局*"减少动画"*设置将去除任何非必要的运动(想想 iOS 的"减少动画"设置,但应用于 AI 在网络和应用程序中的界面)。我们也尊重用户的操作系统级偏好——如果您的设备设置为 prefers-reduced-motion,Macaron 将自动降低效果。视觉对比度和颜色也是如此:高对比度模式可供低视力用户使用,使用深色主题配粗体文本和清晰指示器(这也有利于在明亮阳光下或低质量屏幕上的任何人)。Macaron 中的所有图标和颜色提示都设计有色盲友好调色板,并经过 WCAG AA 对比度合规性测试。

Macaron 还为那些需要低干扰、低刺激体验的人提供*"安静模式"。启用时,安静模式将关闭非关键通知和声音,对必要警报使用温和的触觉或柔和的铃声,并隐藏与当前任务无关的任何 UI 元素(如侧边栏或装饰图像)。这类似于许多人发现有用的"专注模式"——就像在界面上戴上降噪耳机。通过隐藏非必要内容和音频,Macaron 的安静用户体验模式为敏感用户创造了一个平静的工作空间。正如设计师所指出的,即使是神经典型用户也经常欣赏这样的选项——有时您想要无干扰的体验。在所有情况下,原则都是给用户控制权*:亮度、对比度、字体大小、动画、声音——每个感官方面都可以调整。这种适应性确保 Macaron 在动力不足时可以足够刺激,或在用户过载时保持平静和稳定。

多模态,因为生活是多模态的

多模态 AI 界面设计

您的生活不是在一种模态中进行的——您说话、发短信、观看、聆听。那么为什么您的个人 AI 应该停留在单一的交互模式?Macaron 构建为以您当时最舒适或最方便的方式与您互动。有些人不是"发短信者",更喜欢说话;其他人可能依赖视觉或需要每个音频的转录。拥抱多模态设计不仅仅是花哨的附加功能,而是无障碍的必需品。正如 AI 思想领袖观察到的,下一代界面将整合语音、视觉和手势以及文本,允许用户以灵活、适合上下文的方式交互。以下是 Macaron 如何将多模态性带入个人助理:

语音优先交互(免提提示、确认循环)

语音是一种强大的模式,特别是对于双手忙碌、低视力或只是通过聆听更好地处理信息的用户。Macaron 有一个强大的语音优先界面:您可以通过语音输入与它对话,它会以自然的声音回答。这不是您笨拙的旧电话树系统——这是一个理解上下文的对话代理。例如,在烹饪时您可能会说,"嘿 Macaron,将大蒜添加到我的购物清单并设置 5 分钟意大利面计时器。"它会口头确认每个操作("已添加大蒜。计时器设置为 5 分钟。"),这样您就知道它理解正确——这些确认循环对于在使用语音时避免误解至关重要。我们从语音用户体验研究中了解到,清晰的确认和通过语音取消或撤销的能力是良好免提体验的关键(没有人希望 AI 做错事情并在不检查的情况下继续前进)。

语音交互也显著改善许多领域的无障碍性。它们可以帮助有行动障碍的人(如果滑动或打字困难,则不需要),并且可以降低某些用户的认知负荷——说出请求可能比导航复杂的图形用户界面更直观。值得注意的是更广泛的趋势:语音助手已经被数亿人每天使用,它们为以前在传统界面上有困难的人打开了技术访问例如,有视觉障碍的人可以使用 Macaron 的语音模式操作应用程序、发送消息或获取信息,而无需看屏幕。在教育方面,语音技术也证明了宝贵的价值:大约 20% 的学龄儿童有阅读困难,语音启用的学习工具让他们通过聆听吸收内容或通过说话而不是写作来回应。Macaron 的语音优先设计与此一致——它是一个均衡器,让您自然地交互。无论您是在开车时发出命令(免提),还是只是喜欢说话而不是打字,AI 都会适应。如果您有言语差异或口音,Macaron 会持续学习您的声音;此外,像伊利诺伊大学的语音无障碍项目这样的持续项目正在让语音识别对具有非典型语音模式的用户更好,我们会跟上这些发展。

图像和文档理解(提取可操作项;总结到用户的阅读水平)

Macaron 擅长的另一种模式是视觉——不仅仅是输出图像或图表,而是实际理解您给它的视觉输入。生活充满视觉信息:照片、截图、扫描的 PDF、幻灯片、产品标签,应有尽有。Macaron 可以分析这些并帮助您从中得出意义和行动。例如,您可以拍一张邮寄信件或预约卡的照片,然后问 Macaron,"我需要用这个做什么?"使用 OCR 和视觉 AI,它会读取文本、解释它,并回应类似:"看起来您在 6 月 5 日上午 10 点有牙医预约。我已将其添加到您的日历并设置了提醒。"这超越了简单的描述——它是关于提取可操作信息。它可以对表格做同样的事情(例如"在这里签名并在周五之前发送给您的人力资源部")或更日常的任务,如当您找不到眼镜时阅读包装上的成分。

盲人或低视力用户可以从看见和描述世界的 AI 中受益。Macaron 利用类似于 Be My Eyes "Be My AI" 功能的计算机视觉,提供图像的快速、生动描述,甚至回答关于它们的后续问题。这样,个人 AI 可以作为始终可用的视觉解释器,无论是阅读标志、识别物体,还是用简单英语总结图表。

总结到特定阅读水平的能力也是游戏规则改变者。我们讨论了 Macaron 如何为阅读障碍用户简化文本;这扩展到您遇到的任何文档或网页。您可以向 Macaron 提供学术论文或长篇新闻文章,并说,"给我一个 8 年级阅读水平的 TL;DR"——它会用清晰、简单的语言产生简洁的摘要。在底层,它使用先进的基于 LLM 的文本简化技术来保持意义,同时降低复杂性。这不仅对有阅读困难的用户非常有帮助,对非母语使用者(或坦率地说,任何时间紧迫的人)也是如此。考虑到欧洲约20-25% 的人功能性文盲,更多人在非母语中识字能力有限,这种功能的重要性不言而喻。通过适应模态(将文本转为语音,或将密集文本转为简化文本+图像),Macaron 确保您不会因格式而被排除在信息之外。这是通过翻译实现的无障碍——在语言之间、复杂性水平之间以及感官模式之间。

默认字幕和转录(用于音频/语音输出)

在多模态 AI 中,音频输出很好——但不是每个人都能轻松听到或处理音频。这就是为什么Macaron 说或播放的所有内容默认也以文本形式提供。如果 Macaron 提供语音答案或叙述摘要,您将同时在聊天或应用程序日志中看到转录。这当然有利于聋人和听力障碍用户,但在许多场景中也很有用:也许您在安静的图书馆不能播放声音,或者您想稍后浏览对话。值得注意的是,研究表明超过 80% 使用视频字幕的人并非听力障碍——他们出于便利或因为嘈杂/安静环境而使用字幕。在 Macaron 中,字幕不是事后想法;它是内置的。如果您通过 Macaron 的界面观看视频或播客(想象一个 AI 策划的学习播放列表),您可以获得自动生成的字幕和完整转录来跟随或在其中搜索。我们利用最先进的语音转文本模型使这些转录高度准确,文本格式化以提高可读性(演讲者标签、时间戳等,根据需要)。

转录和字幕也改善许多神经多样性用户的理解——例如,患有 ADHD 的人可能从聆听 AI 的解释同时阅读它以加强专注中受益。同样,非母语使用者经常使用转录来再次检查他们听到的内容。通过提供这些多模态冗余,Macaron 涵盖所有基础。它与通用设计中多重表示的原则一致:以不同形式呈现信息以适应不同偏好。它更进一步:Macaron 中的转录是可搜索和可导出的,所以您可以回顾您的 AI 上周告诉您的内容,甚至获得您过去会话的摘要(我们知道,很元!)。底线是,如果有任何音频输出,等效的文本就在那里——没有用户应该必须询问或寻找它。在无障碍世界中,这只是正确地做基础工作:字幕和转录确保没有人被排除在口头内容之外。正如第 508 节指南所指出的,转录不仅仅是为听力损失的人;它们同样帮助语言学习者和在嘈杂或安静环境中的任何人。Macaron 完全拥抱这一点。

相关文章

Loading related articles...

申请成为 Macaron 的首批朋友