作者: Boxu Li

准备好体验无障碍的 AI 吗?试试 Macaron 的这个功能吧:*「设计一个包含 10 分钟专注块、温柔提醒和一键完成的三步晨间流程。」*看看如何通过一个了解无障碍的个人 AI 启动您的一天——无障碍是内建的,而不是附加的

无障碍对于个人 AI 来说不是「锦上添花」,而是基础要求。一个真正的个人 AI 必须能够满足每个用户的需求,无论他们是 ADHD、阅读障碍、视力低下或连接有限。在这篇文章中,我们探讨了Macaron AI是如何为神经多样性和多模态生活而设计的,不仅仅是简单打勾,而是提供包容性智能。

为什么无障碍是个人 AI 的核心(而不是可有可无)

包容性设计不仅仅是道德问题——对于声称是「个人化」的 AI 而言,它是必不可少的。世界上有相当一部分人是神经多样性人群,但许多数字体验仍然迎合一个神话中的「平均」用户。例如,估计五分之一的儿童有学习障碍,这使得他们很难处理书面文字,而近10% 的美国儿童被诊断患有多动症(许多未被诊断的成年人也可能在我们中间)。如果个人 AI 只对神经典型、完好无损的用户效果良好,那就未能实现个人化。AI 不应该期待用户适应软件,而是必须根据每个用户的认知和感官特征进行适应——实质上是从大众用户体验转向个性化认知。

从大众用户体验到个性化认知

传统的「一刀切」用户体验常常让神经多样性用户感到沮丧。个性化AI颠覆了这种模式:它不断学习并适应你的思维和工作方式。具有远见的研究人员预测,AI驱动的界面将很快实时适应用户的无障碍偏好,几乎遍及所有数字产品。实际上,这意味着如果你难以集中注意力,你的AI可以将任务分解成小步骤;如果明亮的屏幕引发感官过载,它可以默认使用平静的高对比度主题。目标是认知匹配:你的AI应该在你所在之处与你相遇(而不是反过来)。最终,为神经多样性极端情况设计的用户体验会改善每个人的用户体验——正如微软的沉浸式阅读器通过帮助阅读障碍学生证明了这一点,并且后来被数百万普通用户喜爱。

标准与超越(以WCAG合规为基础,个性化为差异化)

遵循网络内容无障碍指南(WCAG)等可访问性标准是一个必要的起点,但真正的个人 AI 更进一步。WCAG 关注的是一般的最佳实践——颜色对比、文本替代、键盘导航——并提供了坚实的基础。然而,仅仅遵循标准并不能保证对 ADHD 或自闭症患者来说体验感觉是可访问的。例如,WCAG 可能要求视频提供字幕或图像提供替代文本,但这并不能确保内容是用简明语言编写的或界面不会让人感到认知负担。Macaron 将 WCAG 2.1 视为基础,并在此基础上增加个性化层。想象一下,标准的无障碍功能如坡道和栏杆——Macaron 当然具备这些。但它还会随着时间的推移学习每个用户的独特需求,有效地成为个人的无障碍助手。一个符合指南但仍然僵化的界面是不够的;它应该为每个人量身定制并灵活变通。正如一家设计机构所说,「无障碍合规是起点,但真正的包容性需要对用户需求更深刻的理解。」

为神经多样性设计 Macaron

神经多样性涵盖了像 ADHD、自闭症、阅读障碍等状态,每种状态都有不同的挑战和优势。为神经多样性用户设计 Macaron 意味着同等重视灵活性、结构性和清晰性。我们借鉴包容性设计研究和认知科学,打造出既能减轻认知负担又让用户掌控的流程。以下是 Macaron 设计中一些友好神经多样性的模式。

ADHD 友好流程(短步骤、时间限制、提示、视觉进度)

对于 ADHD 用户,长时间的无结构任务和无尽的选项可能会让人无从下手。Macaron 通过将交互结构化为专注的短步骤来解决此问题——基本遵循“一屏一任务”规则以避免过载。与其给你一个庞大的表单或 10 步流程,Macaron 将工作流程拆分为可管理的部分,并明确下一步操作。这营造了一种动感(正如一位有 ADHD 的设计师所说,点击“下一步”带来的微小成就感能让你继续前进)。Macaron 还采用了时间限制技术:例如,你可以要求它为任务设置一个10 分钟的专注计时器,或者它可能会建议*“让我们花 5 分钟头脑风暴,然后休息一下”*——利用了常被推荐给 ADHD 的时间管理策略。

温柔的提示和提醒是另一个内置功能。健忘是 ADHD 的常见障碍,因此 Macaron 会在任务或截止日期成为危机之前不动声色地提醒你。这些不是普通的通知,而是情境感知的提示(例如在你的晨间例行公事中,悄悄地提示「👍 已完成 3 个步骤中的 2 个,继续加油!」)。为了保持动力,Macaron 还使用视觉进度指示器——从简单的清单勾选已完成的步骤到随着你推进工作流程而填满的进度条。研究表明,像进度条或彩纸爆破这样的奖励性视觉反馈可以帮助 ADHD 用户保持参与感,并看到他们正在朝目标前进。简而言之,Macaron 中对 ADHD 友好的流程是有结构但不压抑的:它提供了保持专注的护栏,同时庆祝每一个小胜利以维持动力。

适应阅读障碍的展示(可读性、间距、可选简化模式)

大量文字内容可能会对患有阅读障碍的用户构成重大挑战。因此,Macaron 的用户界面经过调整,以实现最大程度的可读性。默认情况下,我们使用清晰的无衬线字体(例如 Helvetica 或 Arial),并避免使用难以辨认的花式或斜体文字。更重要的是,Macaron 提供了一个阅读障碍模式开关,该模式可将内容重新格式化为适合阅读障碍的设置。激活此模式会将字母间距和单词间距增加到推荐水平(研究表明,较宽的间距——大约额外 35% 的字母间距和 3.5 倍的单词间距——可以显著改善阅读障碍读者的可读性)。我们还会在开启阅读障碍模式时禁用连字和花哨的排版,因为有时即使是合并的「fi」字符也会使读者感到困惑。目标是减少文本的「视觉拥挤」,为每个字母和单词提供更多的呼吸空间。

除了字体之外,Macaron 还可以调整内容的布局和复杂性,以适应喜欢简单风格的阅读者,如有阅读障碍的人。例如,它可以为冗长的文档或电子邮件提供可选的简化摘要。利用其大型语言模型,Macaron 可以将复杂的文本重述为用户阅读水平的简单语言,而不降低其意义。这种按需文本简化不仅仅是便利,对于许多用户来说至关重要。仅在德国,就有1000万到1700万人面临严重的阅读挑战,而全球有16%的成年人(约7.59亿人)缺乏基本的读写能力。 对他们而言,充满术语的文件可能是不可逾越的障碍。Macaron 的解决方案是一个个人阅读助手,能够自动简化或解释内容。如果你收到了一份密集的法律通知或学术文章,你可以请 Macaron 将其“翻译”成日常语言。结果是以对话式、简洁风格呈现的内容,能够被更广泛的受众理解——这就是“简单语言”的实际应用。重要的是,这项功能也惠及其他人(忙碌的人想快速了解要点、非母语使用者等)。个性化意味着你可以根据需要调整文本的复杂性——这是一种远远超越静态可访问性指南的差异化特征。

感官自适应模式(减少运动、高对比度、安静的用户体验)

感官敏感性是神经多样性的另一个方面,Macaron 积极支持这一点。一些用户(包括许多自闭症谱系或前庭系统障碍者)可能会因为过多的屏幕运动和炫目的动画而感到不适甚至恶心。在 Macaron 中,动画和效果默认情况下是最小化的,并且有一个全局*“减少运动”*设置,可以去除任何非必要的移动(就像 iOS 的“减少动态效果”设置,但应用于 AI 的网页和应用界面)。我们也尊重用户的操作系统级别偏好——如果您的设备设置为偏好减少运动,Macaron 将自动降低动画效果。同样适用于视觉对比度和颜色:为低视力用户提供高对比度模式,采用深色主题搭配粗体文本和清晰的指示符(这对在强烈阳光下或低质量屏幕上的用户也有帮助)。Macaron 中的所有图标和颜色提示都使用色盲友好的调色板设计,并经过 WCAG AA 对比度合规性测试至少达到最低标准。

Macaron 还提供「静音模式」,适合需要低干扰、低刺激体验的人。启用后,静音模式将关闭非关键通知和声音,使用轻柔的触觉反馈或柔和的提示音进行必要的提醒,并隐藏与当前任务无关的 UI 元素(如侧边栏或装饰性图像)。这类似于许多人觉得有用的「专注模式」——就像给你的界面戴上降噪耳机。通过隐藏非必要的内容和音频,Macaron 的静音用户体验模式为敏感用户创造了一个宁静的工作空间。正如设计师所指出的,即使是神经正常的用户也常常欣赏这样的选项——有时你需要一个无干扰的体验。在所有情况下,原则是将控制权交给用户:亮度、对比度、字体大小、运动、声音——每个感官方面都可以调整。这种适应性确保 Macaron 在用户动力不足时能够提供足够的刺激,或在用户负担过重时提供宁静而稳定的环境。

多模态,因为生活是多模态的

你的生活并不局限于一种模式——你说话、发短信、观看、聆听。那么为什么你的私人 AI 要被限制在单一的交互模式中呢?Macaron 的设计是为了以你当前觉得最舒适或方便的方式与您互动。有些人不喜欢发短信,更喜欢说话;而另一些人可能依赖视觉或需要每段音频的文字记录。拥抱多模态设计不仅是一种炫酷的附加功能,更是无障碍的必要条件。正如 AI 思想领袖所观察到的,下一代界面将整合语音、视觉和手势与文本一起,让用户以灵活且适合语境的方式进行交互。以下是 Macaron 如何将多模态引入个人助手的方式:

语音优先交互(免提提示,确认回路)

语音是一种强大的模式,特别适合那些忙碌着、视力较弱或更喜欢通过倾听来处理信息的用户。Macaron 拥有强大的语音优先界面:你可以通过语音输入与其交流,它会以自然的声音与你对话。这不是你那笨拙的老式电话树系统,而是一个理解上下文的对话代理。例如,做饭时你可以说:“嘿 Macaron,把大蒜加入我的购物清单,并设置一个 5 分钟的意大利面定时器。” 它会通过语音确认每个操作(“已添加大蒜。定时器设置为 5 分钟。”),让你知道它正确理解了——这些确认循环对于避免语音使用中的误解至关重要。我们从语音用户体验研究中了解到,清晰的确认以及通过语音取消或撤销的能力是良好免提体验的关键(没有人希望 AI 在没有确认的情况下做错事然后一意孤行)。

语音交互也在许多领域显著提高了可访问性。对于行动不便的人来说(如果不便滑动或打字),语音交互可以帮助他们;对于某些用户来说,它可以降低认知负担——说出请求可能比浏览复杂的图形界面更直观。值得注意的是,语音助手的使用已经成为一种广泛趋势,每天有数亿人使用它们,为那些之前在传统界面上遇到困难的人打开了技术访问的大门。例如,视障人士可以使用 Macaron 的语音模式操作应用程序、发送信息或获取信息,而无需查看屏幕。在教育领域,语音技术也证明了其价值:大约 20% 的学龄儿童在阅读方面存在挑战,而语音学习工具让他们可以通过听来吸收内容,或者通过说话来回应,而不是书写。Macaron 的语音优先设计正符合这一趋势——它是一个平等器,让你能够自然互动。无论是开车时发出指令(免提)还是你更喜欢说话而不是打字,AI 都会适应。而且,如果你有口音或语言差异,Macaron 会持续学习你的声音;此外,我们也密切关注伊利诺伊大学的语音可访问性项目等持续项目,这些项目正在改善非典型语音模式用户的语音识别。

图像和文档理解(提取可行项;总结到用户的阅读水平)

Macaron 擅长的另一种模式是视觉——不仅仅是输出图像或图表,而是真正理解您提供的视觉输入。生活充满了视觉信息:照片、截图、扫描的 PDF、幻灯片、产品标签,等等。Macaron 可以分析这些内容,并帮助您从中提取意义和行动。例如,您可以拍一封邮寄信件或预约卡的照片,并询问 Macaron,“我需要对此做些什么?” 利用 OCR 和视觉 AI,它会读取文本、解释内容,并回复您:“看起来您有一个牙医预约,时间是 6 月 5 日上午 10 点。我已将其添加到您的日历,并设定了提醒。” 这超越了简单的描述——这是关于提取可行信息。它可以对表格执行相同操作(例如,“在此签名,并在周五前发送给您的 HR”),或者在您找不到眼镜时,处理更日常的任务,如读取包装上的成分。

视障或低视力用户可以从能看见和描述世界的 AI 中受益。Macaron 利用类似于 Be My Eyes 的“Be My AI”功能的计算机视觉,快速生动地描述图像,甚至回答有关图像的后续问题。这样,个人 AI 可以作为始终可用的视觉解释器,无论是阅读标志、识别物体,还是用简单英语总结图表。

能够总结到特定的阅读水平也是一个游戏规则的改变者。我们讨论了 Macaron 如何简化失读症用户的文本;这也适用于您遇到的任何文档或网页。您可以把一篇学术论文或一篇长篇新闻文章交给 Macaron,然后说:「给我一个八年级阅读水平的简要总结」——它会用清晰、简单的语言生成一个简明的摘要。在幕后,它使用先进的基于 LLM 的文本简化技术,在减少复杂性的同时保留意义。这对有阅读困难的用户以及非母语者(或者坦白说,任何时间紧迫的人)都非常有帮助。考虑到整个欧洲约有20-25% 的人功能性文盲,还有更多人在其非母语中识字有限,这一功能的重要性不容小觑。通过调整模式(将文字转化为语音,或将密集的文字转化为简化的文字加图像),Macaron 确保您不会因为格式而被信息拒之门外。这是通过翻译实现的无障碍——在语言之间,在复杂性水平之间,以及在感官模式之间。

默认字幕和转录(针对音频/语音输出)

在多模态 AI 中,音频输出非常出色——但并不是每个人都能轻松听到或处理音频。因此,Macaron 说或播放的所有内容默认也都提供文本形式。如果 Macaron 提供语音答案或叙述总结,您会同时在聊天或应用日志中看到文字记录。这当然对听障人士有益,但在许多情况下也很实用:比如您在安静的图书馆不能播放声音,或者您想稍后快速浏览对话。值得注意的是,研究显示,超过 80% 使用视频字幕的人并非听力受损——他们因便利或环境嘈杂/安静而使用字幕。在 Macaron 中,字幕不是事后添加的,而是内置的。如果您通过 Macaron 的界面观看视频或播客(想象一下 AI 筛选的学习播放列表),您可以获得自动生成的字幕和完整的文字记录,以便跟随或在其中搜索。我们利用最先进的语音转文字模型,使这些文字记录高度准确,并为可读性进行格式化(如需要时标记说话者、时间戳等)。

字幕和文字记录也能提高许多神经多样性用户的理解力——例如,有 ADHD 的人可能会通过 AI 的解释并同时阅读来加强注意力。同样,非母语者常使用文字记录来核对他们所听到的内容。通过提供这些多模式的冗余,Macaron 确保面面俱到。这与通用设计中的多重呈现原则相符:以不同形式呈现信息以适应不同偏好。而且更进一步:在 Macaron 中,文字记录是可搜索和可导出的,所以你可以回顾 AI 上周告诉你的内容,甚至可以获取过去会话的摘要(我们知道,这很元!)。最重要的是,如果有音频输出,相应的文本就在那儿——用户不应该需要去询问或寻找。在无障碍世界中,这只是做好基础工作:字幕和文字记录确保没有人被排除在口语内容之外。正如《第 508 条》指南指出,文字记录不仅仅是为听力障碍者准备的;它们同样帮助语言学习者和处于嘈杂或安静环境中的任何人。Macaron 完全拥抱这一点。

Boxu 在埃默里大学获得了定量经济学专业的学士学位。在加入 Macaron 之前,Boxu 的职业生涯大部分时间都在美国的私募股权和风险投资领域度过。他现在是 Macaron AI 的首席参谋和市场营销副总裁,负责管理财务、物流和运营,并监督市场营销。

申请成为 Macaron 的首批朋友