Macaron AI 如何适应每个用户

作者:Boxu Li at Macaron


我们探讨了为什么可访问性对个人AI至关重要,讨论了神经多样性和多模态交互。在这第二篇文章中,我们深入了解Macaron AI如何将包容性融入其设计——从迷你应用模板到自适应内容和离线智能。

迷你应用中的可访问性(模板模式)

Macaron的独特功能之一是其**"迷你应用"模板库——帮助您完成特定任务的模板化微流程(如日常构建器、膳食计划器、习惯追踪器等)。确保这些微流程具有可访问性和包容性是我们的首要任务。我们没有将包容性留给偶然,而是将通用设计模式直接融入这些模板中。每个迷你应用都旨在最小化认知负担:长流程被分解为逻辑块,让您一次处理一个部分。这符合认知可访问性的UX最佳实践——将任务分解为更小、可管理的步骤有助于用户(尤其是ADHD患者)保持专注,不会感到不知所措。例如,"活动规划器"模板可能首先询问活动名称和日期,然后下一步询问邀请谁,而不是一次性展示一个巨大的表单。每个迷你应用还提供清晰的标题和视觉进度指示器**(简单的进度条或步骤计数),让您始终知道已完成多少步骤以及还剩多少步骤。研究表明,实时看到进度能提升动力——具有视觉进度跟踪的应用用户参与度显著更高(一项研究发现,添加进度指示器后日常使用量增加了31%)。

许多迷你应用集成了计时器和提醒作为可选支持。例如,ADHD友好的日常构建器模板会建议为日常的每个步骤添加温和的计时器(鼓励保持专注,无需刺耳的闹钟)。类似地,番茄工作法风格的专注会话模板可能默认包含25分钟倒计时和休息提醒。这些模式借鉴了生产力研究和ADHD指导技术——时间分块和定时休息可以大大改善时间管理困难人群的执行力。Macaron让包含这种支持变得容易:模板有"为此任务添加计时器?"或"如果X时间前未完成请提醒我"等开关。由于这些功能是内置的,受益的用户(ADHD患者、记忆问题患者、忙碌人士等)不必从头开始配置一切——包容性是主动的。

另一个常见模式是每个步骤都有令人满意的"完成"按钮的清单。迷你应用通常输出一个子任务清单,一键完成。即使是看到三个项目的列表并点击每个项目标记完成这样简单的事情,也能将令人不知所措的工作变成游戏般的一系列可实现的步骤。这与上述的进度反馈相关,并提供即时的微奖励。我们从习惯养成应用中看到,庆祝小胜利(如视觉复选标记或一点五彩纸屑)可以强化动力——在任务完成后立即提供快速反馈或积分有助于维持专注和动力。换句话说,Macaron的迷你应用给您早期胜利来保持您的参与。这种方法提高了每个人的完成率,不仅仅是神经多元化人群。

重要的是,所有这些微流程辅助功能都是可选和可定制的。可访问性是关于提供有用的选项,而不是强迫每个人使用刚性的"简易模式"。神经典型的高级用户可能会为了速度而禁用额外的确认和进度提示,而其他人则严重依赖它们。Macaron的模板默认具有包容性,但在设计上灵活——您可以根据自己的工作风格调节支持的程度。

自适应阅读等级和节奏(自动简化或丰富内容)

没有两个用户具有完全相同的阅读能力或背景知识。因此,Macaron的AI会调整内容的复杂性节奏以适应每个人的需求。任何时候Macaron呈现信息(如说明、解释或教育内容),您都可以控制措辞应该多简单或多丰富。在实践中,这意味着食谱迷你应用可以提供烹饪步骤的简化版本("像对初学者解释一样")或丰富版本("包括菜肴的科学或文化历史")。在后台,AI可以自动调整其输出的阅读等级以匹配您的偏好。如果系统知道您偏好简单直接的语言,它会默认用那种方式进行解释。相反,如果您是喜欢细节的专家,它会使用更多技术术语和深度。这种适应甚至可能主动发生——例如,如果Macaron观察到您经常问后续澄清问题,它可能开始给出稍微更简化的初始答案来省去您的麻烦。

欧洲低识字率的大致比例(深色=更高)。在许多欧盟国家,20%或更多的成年人在基本读写方面有困难。Macaron的"自动简化"功能通过按需提供简单、易于处理的语言来帮助识字能力较低的用户。

我们利用第一部分中提到的相同自然语言重写能力在整个应用中实现**"自动简化"开关**。在任何迷你应用中(比如"了解太阳系"教育流程),打开自动简化会导致所有文本内容以易于阅读的形式输出:短句、常用词汇和主动语态。这就像一个按需调整阅读水平的导师。另一方面,**"丰富文本"**选项可以为那些想要挑战的人添加更多深度或高级细节(在语言学习迷你应用中很有用,或者只是为了满足个人好奇心)。我们实质上是将学习通用设计的原则引入个人AI领域——提供信息的多种表示和可调节的难度级别。通过这样做,Macaron支持低识字或认知障碍的用户仍然能够成功完成任务(因为他们总是可以请求更简单的措辞)。对于那些渴望细致入微的人,他们可以调高难度。

传统软件很难做到这一点,但真正理解内容的AI可以即时转换该内容。想象一个医疗说明迷你应用:一个有阅读障碍的用户选择这样的版本:"早上吃一片,晚上吃一片,配食物。"与此同时,另一个熟悉医学术语的用户得到:"每日两次服用一片,配餐。"这是相同的信息,以不同方式传递。关键是选择。由于Macaron记住个人偏好,随着时间的推移,它会学习您喜欢如何呈现信息(例如,总是先给我简单的摘要;如果我需要更多细节,我会问)。

另一个方面是交互流程中的自适应节奏。有些人阅读很快,有些人很慢;有些人可能需要更多时间在步骤之间思考。Macaron的迷你应用可以插入刻意的暂停或等待您的信号再继续。例如,在引导呼吸练习中,节奏可以根据用户反馈(或未来的传感器数据)调整("吸气...呼气...")更快或更慢。在学习测验中,Macaron可能注意到您回答需要更长时间,然后温和地提供提示或额外时间。这种适应性使体验感觉支持而不是匆忙(或者相反,不是无聊地慢)。个性化是这里的差异化因素——两个用户可以使用相同的模板,但感觉像是为他们的速度和风格量身定制的。

本地化和双语支架

如果一个个人AI真的是个人的,它应该是多语言的。Macaron的界面和内容可以即时本地化。如果您是双语或正在学习新语言,您可以无缝切换AI的语言输出——甚至在对话或任务中途。例如,您可能通常用英语与Macaron对话,但说您添加:"Explique-moi ça en français"("用法语向我解释")。Macaron会顺利地用法语继续话题。迷你应用中的所有按钮、标签和响应都可以相应地切换语言。这不仅对国际用户有用——对于可能想要双语支架的语言学习者也很棒。想象一个双语词汇测验迷你应用:Macaron可以用西班牙语呈现一个单词,然后用英语提供解释(或反之),帮助您在两种语言之间建立联系。或者一个食谱应用,用英语和意大利语列出食材的本地名称(茄子 / melanzana,香菜 / coriandro)。这迎合了多元文化家庭或任何想在做晚餐时学习新语言的人。

这种流畅的本地化对可访问性来说是一个福音,因为它让人们在任何时候都可以使用他们最舒适的语言。一个在第二语言中有阅读障碍的人可能更喜欢为复杂任务切换到他们的第一语言。或者用户可能通过将AI的响应切换到他们祖父母理解的语言来让家人参与。Macaron还可以对您提供的内容进行即时翻译:如果您收到一份不熟悉语言的文本或邮件,AI会翻译它,如果需要的话甚至会大声朗读。这个功能是AI打破障碍的直接例子——语言不应该成为信息或实用性的障碍。事实上,新的GPT-4驱动的助手已经通过丰富的描述和翻译为盲人用户转变视觉和文本可访问性,所以我们对语言和阅读可访问性应用相同的原则。

我们甚至考虑了代码转换(在一句话中混合语言)的场景。Macaron被训练优雅地处理多语言输入,所以如果您穿插另一种语言,它不会感到困惑或强迫您坚持一种语言。最终,目标是让Macaron在文化和语言上具有适应性——就像一个真正的个人助理,可能会根据需要切换语言。这是我们对可访问性更广泛看法的一部分:它不仅仅是关于残疾,而是关于满足人们多样化的文化和语言需求。

在开发者方面,我们提供工具确保任何社区贡献的迷你应用模板都是可翻译的。Macaron自己的AI模型在各种语言上进行了微调,以保持跨语言的质量。简而言之,无论您想要周二的西班牙语日程安排,还是使用Macaron帮助通过双语闪卡练习普通话,它都能满足您。您的个人AI应该说您的语言。

低带宽和离线优先设计

可访问性不仅仅是关于人类能力;它也关于环境限制,如糟糕的互联网连接或较旧的设备。真正的个人AI应该随时随地为您服务——包括当您在2G网络上或在飞机上完全离线时。Macaron采用弹性的离线优先心态设计,使得核心功能即使在有限或无连接的情况下仍然可用。这很关键,考虑到截至2024年,世界人口的大约三分之一(26亿人)仍然没有互联网接入,更多人只有间歇性或缓慢的连接。即使在发达地区,您也可能发现自己没有信号(想想农村地区、地铁或自然灾害期间),在那些时刻您不应该失去您的AI助手。

缓存和优雅降级: Macaron采用智能缓存确保您的重要数据和例程尽可能存储在设备上。经常使用的迷你应用和最近的对话上下文保存在本地(适当加密),这样如果您离线,Macaron仍然可以执行许多任务。例如,假设您经常每天早上使用呼吸练习迷你应用——Macaron会提前缓存所需的步骤和任何媒体(如平静的动画或声音)。当您离线启动它时,它工作得天衣无缝。如果您在离线时要求Macaron"在我的日历中添加事件",它会排队该请求并在本地确认它已记录;一旦您重新上线,它会同步到您的云日历。这种优雅降级确保缺乏互联网最多导致轻微延迟,而不是失败。设置本地闹钟、记笔记或调出您存储的待办事项列表等核心功能默认可离线使用。

对于通常需要云端的AI特定任务(如复杂查询或生成长文本),Macaron正在探索设备上的模型能力。现代智能手机可以为某些任务运行令人惊讶的强大神经模型。在无法到达Macaron完整大语言模型的情况下,较小的离线模型可能处理基本请求(例如,理解播放本地存储歌曲的语音命令)。它可能不如云版本智能,但可以覆盖基本要素直到连接恢复。

UI清楚地指示Macaron何时处于离线模式以及什么功能可能受限,所以您永远不会猜测。如果您问一些真的无法离线完成的事情(如"搜索今天的新闻"),Macaron会礼貌地解释它已保存您的查询并会在可能时稍后完成。设计目标是软失败行为:没有突然崩溃或死胡同——总是确认和替代路径。Macaron甚至包括离线知识包:本地缓存的一般事实和FAQ数据库,所以它仍然可以在没有互联网的情况下回答许多常见问题(很像一些语音助手如何有基本命令的离线模式)。

轻量级UI和后备模式: 不是每个人都有最新的手机或无限数据。我们确保Macaron的界面可以缩放到低资源环境。有一个可以切换的低带宽模式(如果应用检测到非常慢的连接会自动启用)。在这种模式下,Macaron切换到只有文本或基本HTML界面,最少的图像或视频。AI通常会显示的任何多媒体内容(如说明性图像)被推迟或用描述性说明替换,而不是下载大文件。这类似于非常受欢迎的应用"精简"版本——例如,Facebook的慢网络轻量级应用在发布后两年内达到了2亿用户,验证了对带宽友好设计的需求。类似地,Macaron的轻量级模式通过减少数据密集型资产和网络调用频率在糟糕的连接上保持体验流畅。

我们还优化了后台同步。Macaron的更新和备份以小块机会性地完成,它们可以无缝暂停/恢复。如果您只有短暂的连接窗口,应用优先处理关键同步(例如发送您离线时编写的任何消息或邮件)并将非关键同步(如备份对话记录)推迟到稍后。我们这样做是为了尊重网络可用性数据成本——在某些地区,移动数据很昂贵,个人AI不应该不必要地消耗它。用户甚至可以设置"仅在Wi-Fi上同步图像/视频"等偏好。

对于设备兼容性,我们的网络客户端和基本应用经过测试,可以在内存有限的旧智能手机上工作。花哨的3D头像或沉重的动画纯粹是可选的装饰;核心功能本质上是一个强化的消息界面,这并不十分苛刻。我们甚至为Macaron提供短信界面(用于无法使用智能手机应用的市场或场景)——您失去一些功能,但仍然可以通过纯文本消息与您的AI交互以获得答案或更新您的日程安排。

本质上,个人AI不应该是需要最新硬件在最快网络上的奢侈品。Macaron的包容性哲学延伸到技术基础设施:无论您的连接是慢还是快,无论您的设备是旧还是新,它都试图适应并保持有用。我们从Google地图的离线模式、YouTube的质量选择器和渐进式网络应用等例子中汲取灵感,这些应用无论连接如何都能提供核心功能。Macaron遵循这条道路,所以无论生活把您带到哪里,它都是可靠的。

透明同步和排队: 当您在离线或低带宽模式下工作时,Macaron让您了解一旦重新上线会发生什么。我们提供一个"同步中心"面板,您可以在其中看到待处理的操作(例如"2条消息要发送,1个笔记要备份,1个答案等待获取")。这给人安心感,事情不会在虚无中丢失。它也尊重用户自主权——也许您离线时写了什么,然后决定在发送前取消它;您可以从同步中心做到这一点。

隐私在这里也被考虑:所有待处理数据在同步之前安全地存储在设备上。如果您在计量连接上并且应用有很多要同步的内容(比如您捕获了一堆照片供Macaron稍后分析),它会在上传大文件之前询问您。用户总是可以选择触发手动同步("我现在在Wi-Fi上,同步所有内容"),或者相反地暂停同步以保持离线更长时间。

从可访问性的角度来看,这种透明度和控制减少了焦虑。没有什么比不知道您在死区期间"告诉"您的AI的事情是否真的通过了更糟糕的。通过清楚地显示状态(如果您启用,甚至通过语音宣布,例如"没有互联网——我会保留您的请求并稍后同步"然后"重新上线——所有待处理的任务现在都已完成"),我们让您了解情况。这类似于电子邮件客户端为未发送邮件显示"发件箱"——Macaron将该概念扩展到所有交互,所以您总是知道您的信息在哪里。

这种方法对有执行功能困难的用户(常见于ADHD)特别有支持——他们可能依赖Macaron从他们的思维中卸载任务。知道这些任务安全地排队(而不是被遗忘)对信任至关重要。我们的目标是您即使离线也能自信地使用Macaron,而不用担心必须记住稍后重复自己。如果它在Macaron中,它不会丢失——这是我们的承诺。

衡量可访问性结果(超越合规性)

构建一堆可访问性功能是一回事,但真正的问题是:它们是否真的帮助用户以更少的摩擦实现他们的目标?Macaron致力于根据用户结果而不是仅仅勾选功能框来衡量成功。我们将可访问性和包容性视为持续的实践,由反馈和数据驱动。以下是我们衡量Macaron为多样化需求的人群服务得如何好的一些方式:

任务完成和挫折指标: 首先,我们查看用户完成关键任务的可靠性,特别是利用辅助设置的用户。使用屏幕阅读器或仅语音模式的人能否像其他人一样轻松地创建提醒或安排事件?我们测量不同用户群体的任务成功率,旨在实现平等(我们的内部目标是所有核心任务的成功率>90%,这符合优秀产品的可用性基准)。除了原始完成率,我们还监控挫折的指标。在用户同意和隐私保护下,Macaron可以检测重复命令或"愤怒点击"等模式——例如,如果用户必须点击按钮五次或重复发出相同的语音命令,这表明有问题。现代UX分析将这些定义为挫折信号(如当某些内容没有响应时的快速重复点击)。如果某些流程对于神经多元化用户有更高的挫折迹象,这标志着我们设计中需要改进的领域。

我们还收集关于难易程度的直接用户反馈。在主要任务之后(可选),Macaron可能会问一个快速问题:"这个体验如何?有什么困难吗?"——保持简单,或通过表情符号评级。这反馈到内部的"挫折分数"。如果我们看到,例如,阅读障碍模式的用户仍然报告阅读某些文本有困难,我们会集中精力修复(也许字体或间距需要调整)。我们将这些定性响应与被动摩擦信号(如那些愤怒点击或人们频繁调用帮助菜单)结合起来以确定痛点。当然,所有这些遥测都是匿名和选择加入的。目标是不等待支持邮件,而是主动看到人们可能卡住或烦恼的地方。

我们定期与多样化的用户群体(包括残疾人)进行可用性测试,并尽可能将他们的反馈转化为可测量的指标。例如,如果盲人用户说某个迷你应用流程令人困惑,我们可能引入一个指标来跟踪屏幕阅读器用户在该流程中偏离或重试步骤的频率。通过将这些情况视为可量化的数据,我们可以观察我们所做的改进是否真的减少了困惑。

配置时间和错误恢复: 入职和错误处理是经常决定残疾用户体验成败的两个时刻。我们测量新用户的设置时间,特别是他们发现和启用所需的可访问性选项的速度。如果普通用户需要5分钟来适应Macaron,我们希望对于有低视力或阅读障碍的用户来说类似(如果不是更快的话)。如果不是,我们完善我们的入职"可访问性向导"或使某些提示更主动。理想情况下,需要特定便利(高对比度、较大文本、语音交互等)的用户可以在使用的前几分钟内实现这一点。Macaron的入职明确询问您是否想配置任何辅助设置(有清楚的解释),我们跟踪有多少新用户利用这一点以及他们是否成功立即启用他们需要的内容。

错误恢复是另一个关键测量。每个人都会犯错误或遇到错误,但对于神经多元化用户,令人困惑的错误消息可能是死胡同。我们测量错误恢复率:当出现问题时(例如"抱歉,我没听清楚"或"保存笔记失败"),用户成功重新回到正轨(自己或在Macaron的引导帮助下)的频率与放弃的频率。我们的目标是接近100%的恢复——意味着如果发生错误,用户总是被引导到解决方案或替代方案。例如,如果语音命令没有被理解,Macaron可能自动切换到拼写友好模式或建议可能选项的菜单("抱歉,您想设置闹钟还是提醒?")。通过跟踪这些事件,我们可以看到某些错误是否不成比例地影响具有特定设置的用户(也许仅语音用户有更多失败操作——然后我们知道要改进我们的语音识别或确认提示)。我们将错误视为不是死胡同而是需要平滑的用户旅程中的分叉。

我们观察的另一个指标是支持功能的持续使用。如果开启专注模式或阅读障碍模式的人最终比其他人更快地放弃应用,那是我们的失败。理想情况下,提供这些便利应该增加参与和成功。所以我们比较开启某些可访问性功能与关闭功能的用户的保留率和任务完成率(汇总)。如果启用功能与较低成功相关,那么该功能的实现或呈现有问题。我们期望相反——辅助功能与那些需要它们的人的更高成功相关,这告诉我们这些功能正在发挥作用,消除障碍。

长期结果(习惯和坚持): 个人AI的承诺之一是帮助用户建立好习惯和维持例程——无论是按时服药、遵循学习计划还是练习减压技术。对于神经多元化用户,由于执行功能差异,维持例程可能特别具有挑战性。我们认为看到Macaron是否真的帮助用户长期坚持他们选择的例程是其影响的关键衡量。

例如,如果一个有ADHD的用户使用Macaron的例程构建器建立"3步晨间例程"(配有10分钟专注块和温和计时器),我们跟踪他们每天完成它的频率以及他们连续坚持多少天。当然,生活会发生,没有人是100%一致的,但如果我们发现大多数用户在一周后放弃例程,这表明也许例程模板不可持续或我们的推动需要调整。另一方面,如果健康百分比的用户在一个月后仍在做他们的例程(或其调整版本),那是成功——这意味着Macaron有效地支持了积极的行为改变。

当用户选择分享时,我们也收集主观报告。例如,有人可能告诉我们,"我通常永远无法坚持锻炼,但在Macaron的帮助下,我已经连续5天做了晨间伸展例程。"这些轶事告知我们的量化指标。随着时间的推移,我们希望发布匿名统计数据,如"使用例程模板的ADHD用户在4周后晨间例程坚持率提高了X%"——因为这是具体的生活改善。

类似地,对于健康导向的模板(如情绪追踪器或药物提醒),我们测量坚持率和结果。用户是否更一致地按时服药?在使用工具一段时间后,他们是否报告改善的情绪或专注?我们小心地处理这些数据——任何此类跟踪都是选择加入的,主要呈现给用户以获得他们自己的洞察(Macaron可以向您显示您的连击、趋势等)。但总体而言,我们分析模式以看什么有效什么没有效。如果添加一点游戏化(如连击奖励或进度的社交分享)显著改善神经多元化用户的坚持率,我们会加倍努力。如果它不起作用,我们专注于其他地方。

口号是结果胜过光学。我们说"我们有可访问性功能X"是不够的。我们问,功能X是否帮助某人完成了有形的事情或感到不那么沮丧?通过测量任务成功、错误减少、节省时间和例程坚持等,我们对该问题保持问责。由于Macaron的核心是AI,我们甚至使用AI来帮助分析反馈并发现这些指标中的趋势,持续完善体验。最终目标是一个不仅勾选包容性框而且通过包容性真正改变生活的个人AI——帮助每个用户更有生产力、更独立,并被一个真正适应他们的助手更好地理解。

相关文章

Loading related articles...

申请成为 Macaron 的首批朋友