Macaron 如何探索自我概念?

封面图

作者:Boxu Li at Macaron


超越记忆:走向自我的连续性

人类的身份和个人连续性并不存储在数据库中;它们从叙事、背景和时间变化中产生。同样,Macaron 的大脑摒弃了任何简单的用户"身份证"模型。系统中没有标记为"用户 X 的个性档案"的单一静态对象,也没有必须永远保持为真的关于用户的规范事实列表。相反,连续性被视为许多小型交互、记忆和适应性编织在一起的新兴特性。这种方法故意避免两个陷阱:脆弱性和停滞性。在 AI 术语中,脆弱身份可能会发生,如果系统抓住一次性事实("用户在2022年提到他们喜欢国际象棋")并将其视为永久定义。然后,如果任何事实是错误的或发生变化(用户不再喜欢国际象棋),系统的模型就会破碎或不一致。如果 AI 假设所有用户特征都具有对象持久性,就会产生停滞身份 —— 这意味着它永远不会忘记或更新信息,导致用户模型僵化,无法进化。Macaron 的大脑通过不完全承诺任何事实为永恒,并允许我们可能称之为优雅遗忘和重新制定来避免这两种情况。

Macaron 依赖于上下文持久性而不是对象持久性:每个上下文或对话线程在本地保持一致性,通过时间的连续性是通过在相关时编织这些上下文线程来实现的。没有代表用户的单一"对象"保持不变;有多个基于上下文的表示,可以根据需要调用和更新。这类似于一个人在不同的社交圈中可能表现不同,但具有潜在的连续性。Macaron 的大脑将身份维护为分布式和流动的东西。身份不在特定的记忆节点中,而在跨记忆持续存在的连接和模式中。从本质上讲,自我的连续性是一个新兴的叙事,而不是数据库条目。

举一个具体的例子,考虑 Macaron 如何记住用户的偏好。Macaron 的大脑不会在档案中存储"用户最喜欢的颜色 = 蓝色",而是会回忆起在相关对话的上下文中(如果用户上周在设计对话中谈论颜色,那么这个记忆在设计上下文中是可检索的)。如果明年用户表达新的偏好(现在喜欢绿色),大脑不需要对规范字段执行破坏性更新。新信息只是时间线中的另一个数据点,当设计上下文再次出现时,由于新近性和相关性,更近期的偏好自然会承载更多权重,而旧的偏好在重要性上会衰减。因此,连续性通过上下文优先考虑最新和最相关的信息来维护,而不是假设较旧的事实是"真正的永久自我"。先前的事实并没有丢失 —— 它只是被降低优先级(更多关于引用衰减的内容)。这产生了一个非脆弱的身份:没有单一的过时数据可以破坏 Macaron 对用户的理解,因为理解从一开始就不是基于静态事实,而是基于模式和上下文。

分布式边界:多重自我,统一自我

特色图片

Macaron 大脑中一个值得注意的架构选择是使用分布式边界来处理知识和记忆。Macaron 不是将 AI 了解用户的所有内容聚合到一个中央模型或存储库中,而是按上下文、来源或主题边界分离知识。例如,与用户职业生活相关的交互可能保存在一个"向量空间"或子系统中,而个人对话则位于另一个子系统中,依此类推。这些不是无法相互交流的孤岛 —— 相反,它们是边界区域,可以在需要时连接,但不会自动合并。这种设计反映了心理学观点,即人们有多个方面或"自我"(工作自我、家庭自我等),它们一起形成整个人,但会根据上下文激活。

通过分布式记忆边界,Macaron 确保用户身份的每个方面在内部是一致的,不会被无关信息污染。例如,如果用户有关于音乐偏好的"爱好"上下文和关于项目管理的单独"工作"上下文,系统在回答正式的工作相关查询时不会意外应用休闲音乐偏好,除非明确相关。这可以防止不当混合上下文的错误或尴尬回应。它还增强隐私:来自一个上下文的敏感信息不会被不加区别地提供给其他上下文。在技术上,Macaron 通过为每个域或会话启动单独的知识图谱或向量索引来实现这一点,类似于 Memno 等个人 AI 架构所做的 —— "每个用户都存在于自己的宇宙中",在其中,还存在基于上下文或数据源的进一步分割。每个用户的数据都与其他用户隔离(这是用户级别的一个边界),但在用户内部,基于上下文或数据源还有进一步的围栏。

然而,关键是自我的连续性仍然会跨越这些边界产生。Macaron 的大脑可以在适当时在特定上下文的记忆之间建立联系。我们称之为相关性联邦:如果用户今天在社交上下文中的对话涉及他们之前在工作上下文中讨论的项目,Macaron 可以从那个工作上下文中获取相关见解 —— 但它会谨慎地进行,并意识到边界(比如引用该知识来自"那次项目讨论")。分布式特性意味着没有单一的"主档案"可以参考;AI 必须沿着上下文网络导航,以即时组装相关的身份信息。这比统一数据库查找在计算上更复杂,但它产生了更丰富和更上下文敏感的连续性。

重要的是,分布式边界也服务于我们的隐私和反分析立场。通过不集中用户模型,Macaron 本质上避免构建可能被利用或滥用的统一行为档案(这有利于用户代理和隐私)。如果需要,每个上下文甚至可以是短暂的 —— 例如,敏感上下文可以设置为使用后自动删除,在长期记忆中只留下高级摘要。然而,即使个别片段消失,用户叙事的挂毯通过其余上下文的重叠线索保持完整。这是非脆弱身份的本质:它是冗余和分布式存储的。没有单一上下文定义用户,失去任何一个上下文都不会抹去自我。

引用衰减:遗忘作为特征

为了让 Macaron 的大脑在不僵化的情况下保持叙事一致性,它采用了我们称为引用衰减的概念。简单来说,引用衰减是一种逐渐减少特定引用或记忆随时间影响的策略,除非它们得到强化。信息片段不是严格删除,而是在重要性上"老化"。这从人类记忆中汲取灵感:我们不会逐字记住每一次对话;细节会褪色,但重要的模式保持。在 Macaron 中,每个记忆项都有一种年龄或使用权重。每次在对话中使用或引用时,它都会得到刷新(强化)。未使用的项目会看到它们的权重慢慢减弱。

引用衰减的效果是 Macaron 的大脑专注于相关和当前的内容,与用户不断发展的叙事保持一致。如果用户两年前最后一次谈论主题 X 并且再也没有提到过,系统会将该主题视为外围的,除非用户再次提起。这避免了 AI 系统记住太多的常见陷阱,导致它们浮现无关的过去细节并混淆对话流程。正如一位 AI 记忆研究员指出的,具有完美、不加区别回忆的 AI 可能变得像"一个令人讨厌的朋友,不断提起过去对话中不重要的话题,无法理解兴趣和优先级会改变"。引用衰减通过功能性遗忘过去的琐事而有利于当前上下文来防止这种行为。

Macaron 大脑中引用衰减的技术实现可能涉及为向量嵌入或知识图谱边缘分配衰减函数。随着时间的推移(或在许多新交互之后),较旧记忆节点的相似性得分或激活潜力会减少。至关重要的是,我们不会直接删除记忆(除非根据用户请求);相反,正如一个框架建议的,系统保留完整的历史记录,但只是降低过时内容的优先级。一切仍然在深度存储中(很像我们的大脑可能编码比我们能回忆的更多),但容易检索的内容偏向于最近和经常提到的。这种设计有两个目的:它通过确保 AI 的贡献反映用户生活和偏好的当前状态来保持一致性,它还反映了个人代理的一个重要方面 —— 继续前进、改变、让旧信息变得不那么定义性的能力。

从合规角度(回到隐私),引用衰减也与数据最小化一致。Macaron 不会积极地将旧的个人数据推入每次交互中;它只在上下文相关时使用它。这降低了不当使用长期过去数据的风险。可以说 Macaron 的大脑本质上对学习的个人数据实施了一种"保留政策"形式,通过在实践中逐渐忘记它不再需要的内容 —— 尽管没有失去记忆的记忆(如果需要,我们总是可以深入档案,就像一个人在深度反思下可能回忆起长期未聚焦的东西)。

新兴的好处是身份变得有弹性。如果用户发生戏剧性变化(新工作、新爱好、改变信念),引用衰减允许 AI 平稳适应。不需要对中央档案进行硬覆盖;新信息自然地使旧信息黯然失色。然而,如果旧上下文变得相关(也许是多年后的怀旧对话),Macaron 仍然可以检索它 —— 因此连续性在背景中得到保留,但不会在前景中强加。这种记忆和遗忘的动态对时间间一致性至关重要:它确保 AI 今天的理解与今天的现实协调,即使它在背景中安静地维护完整的叙事。

时间编织:将时间编织进记忆

如果引用衰减管理遗忘,时间编织管理跨时间记忆。我们使用"编织"这个术语来唤起 Macaron 大脑如何交织多个上下文时间线以创建连贯理解。人类经验本质上是时间性的 —— 我们的身份是我们告诉自己的连接过去、现在和未来的故事。Macaron 的大脑试图通过在需要时将不同时间的记忆串在一起来模拟这一点,有效地创建一个编织的叙事。

想象用户有关于写小说的反复对话:六个月前一次,两周前另一次,今天一次。每次对话都是一股线。时间编织意味着 Macaron 可以从所有这些线中汲取知识并呈现综合的连续性:"你过去[6个月前]提到你更喜欢在早上写作,最近[2周前]你在探索科幻主题。今天你询问关于安排写作时间 —— 也许结合这些见解:为写科幻章节预留早晨时间。" AI 没有明确的单一"小说项目"文件(尽管它可以标记主题);相反,它将时间上分离的片段编织到一个话语线程中。这通过为记忆附加时间元数据并有意在时间上链接相关项目来实现。Macaron 的记忆架构使用时间感知索引:记忆不仅按主题标记,还按何时发生标记。这允许检索可以跨越不同时期但在相同主题上下文内。

可以将时间编织比作保持多个上下文窗口打开然后编织它们。用户的"当前自我"由其过去自我的回声组成,Macaron 的回应反映了这种分层。架构可能采用明确包含时间的总结或叙事建模("之前,在你的故事中...")。重要的是,这在不假设过去是静态真理的情况下完成 —— 相反,过去被视为背景上下文来告知现在。编织的结果是更强的连续性:用户感觉 AI 记住了他们经历的旅程,而不仅仅是孤立的点。然而,由于引用衰减,编织将强调更厚、更新鲜的股线(最近提及)超过褪色的股线。

这种方法与研究一致,表明 AI 需要时间感知来维护连贯的长期交互。例如,一个提议是给 AI 记忆系统时间有效性感和将事实视为时间戳,这样 AI 可以告诉某些东西是"不再真实"还是"仍然当前"。Macaron 的大脑通过标记知识片段如"用户住在巴黎[2019-2023]"来采用这一点,如果在2024年用户提到搬到伦敦,巴黎信息在上下文中被标记为过时。然后,在对话中,Macaron 不会混淆两者 —— 但如果用户怀念巴黎,那些记忆是可用的。实际上,Macaron 可以编织时间线:当前自我(伦敦)和过去自我(巴黎)在叙事中共存,但不会混淆。用户的连续性被表示为时间线挂毯,而不是单一快照。

时间编织也意味着 Macaron 的真理概念是时间性和上下文性的。没有像数据库可能持有的永恒规范事实;有"那时什么是真的""现在什么是真的"以及潜在的"将来什么可能是真的"(如果规划或模拟未来场景)。后者暗示下一个概念:反事实锚定。

反事实锚定:无合成的稳定性

Macaron 大脑中更具推测性但有趣的技术之一是反事实锚定。这个想法源于需要在不将所有内容合并到一个综合用户模型中的情况下保持一致性。如果我们故意避免创建单一聚合档案,我们如何确保 AI 对用户有稳定的感知(他们的风格、可能的偏好、价值观)?答案是使用反事实场景在 AI 推理中锚定用户人格的关键方面,而不是明确存储的事实。

在实践中,反事实锚定可能这样工作:Macaron 的大脑在生成回应或做决定时,内部测试几个"假设"变体来衡量一致性。例如,假设 Macaron 即将向用户推荐一本书。AI 没有硬规则"用户只喜欢科幻小说"。相反,它可能回忆多个过去的信号:用户喜欢某些科幻小说,但也曾经提到喜欢神秘小说。为了避免错误,AI 可能模拟两个反事实输出 —— 一个假设用户处于科幻情绪,另一个假设他们可能更喜欢神秘 —— 并看哪一个与最近上下文更好地一致或获得积极的情感预测。这种内部反事实推理帮助将 AI 的选择锚定在用户可能状态的稳健评估中,而不是狭隘的假设。就好像 AI 说,"我不是100%确定你现在是谁,但如果你仍然是你似乎是的科幻迷,你会喜欢X;如果你已经改变了,你可能喜欢Y。让我们选择适合当前对话语调的建议。" 实际上,AI 通过即时探索替代身份框架来对冲单一身份模型的脆弱性。

反事实锚定的另一个用途是维护用户的声音和价值观。Macaron 避免合成统一的用户档案说"用户总是正式""用户有政治立场Z" —— 那将是脆弱的,可能是侵犯性的。相反,在撰写输出时(比如为用户起草电子邮件),Macaron 可以生成几个风格变体(正式、休闲、幽默)并对照用户最近通信的轻量级模型检查它们,看哪个感觉最"符合性格"。这充当锚定:AI 不会永久存储"用户是正式的",但它可以从上下文推断现在,正式语调匹配过去一周的电子邮件。如果下个月用户的风格转变,反事实检查将自然地捕捉到并调整,而不需要重写某些档案变量。用户的连续性因此通过持续的小对齐而不是一个静态蓝图来维护。

反事实锚定有点类似于人类在不同情况下如何导航身份 —— 我们经常下意识地想象"如果我是那种...的人,我会如何行动?"这实际上有助于澄清我们选择成为谁。对于 Macaron,这些微模拟通过测试假设而不是依赖它们来确保一致性。结果是没有钙化的一致性:Macaron 的大脑可以一致地行动"像 Macaron 的用户"而无需存储"Macaron 的用户"的固定定义。一致性从重复的即时对齐中产生。

无集中合成的一致性

退一步看,分布式边界、引用衰减、时间编织和反事实锚定的组合都服务于一个总体目标:在没有集中用户模型或合成人格档案的情况下保持一致性和连续性。这是一个故意的哲学。许多 AI 系统试图建立广泛的用户档案或在用户数据上微调模型以创建"个人模型"。Macaron 明确避免在所有用户数据上微调整体模型;相反,它保持数据分段并使用元模型来拼接回应。避免合成有几个原因:

**隐私和信任:**集中行为档案可能是个人数据的蜜罐并引起隐私担忧(谁有访问权限,如果它是错误的或用于意外方式怎么办?)。通过没有一个,Macaron 确保每个数据片段仅在上下文中使用,系统的理解本质上是分散的。它更接近数据最小化原则 —— 只在需要时使用所需的内容,而不是积累主档案。

**避免身份过拟合:**人是复杂和可变的。在所有过去数据上训练的单一模型可能会对用户的过去过拟合,使 AI 不太适应他们的未来。Macaron 保持其生成核心为增强了上下文特定数据即时(检索增强生成风格)的通用模型。这意味着 Macaron 对用户的"视图"总是当前检索的函数,而不是过度训练的静态网络。用户可以重新发明自己,Macaron 将跟随,因为 Macaron 没有锚定到昨天的微调。从本质上讲,我们防止 AI 成为用户过去自我的漫画。

**透明度和控制:**当没有单一合成模型时,更容易检查和控制 AI 用来形成回应的内容。如果需要,Macaron 可以显示为查询获取了哪些记忆片段 —— 给予透明度。如果用户说"忘记这个事件",我们可以删除那个记忆,它真正从未来使用中消失。在集中合成模型中,擦除一个事实是困难的(你不能轻易让神经网络"取消学习"一个细节而不重新训练)。通过避免中央合成,Macaron 的大脑保持更可编辑和可解释。

然而,尽管没有统一档案,Macaron 确实实现了一种统一:人格的连续性。用户的个人 AI 以感觉一致和独特的方式回应。这是如何可能的?主要通过我们描述的架构能力:系统动态拉取记忆的正确片段并使用它们来塑造输出(所以内容是个性化的),它使用风格匹配和反事实检查等技术来确保语调和方法与用户的性格一致。其他个人 AI 项目也倡导用户特定模型在隔离中运行,有效地每个用户一个模型,以确保个性化而不汇集数据。Macaron 的方法略有不同 —— 而不是为每个用户训练不同的模型(这是另一种形式的集中化,只是每个用户),Macaron 使用具有每用户记忆pod和即时个性化的共享基础模型。这产生类似的个性化好处(每个用户的数据是分离的,模型可以适应个人语言),但无需为每个用户训练或微调,并且不将所有知识整合到难以审计的权重中。

结果是一个系统,它保持一致性,好像它有一个自我,但那个"自我"不是单一对象或文件 —— 它是一个新兴现象。Macaron 的大脑表明,你可以拥有持久人格的好处(AI "记住"风格、偏好、历史),同时仍然坚持尊重真实人类身份的流动性和无常性。自我由结构和过程维持,而不是静态存储。

对个人代理和数字人格的影响

Macaron 的大脑架构有更广泛的影响。首先,它赋权个人代理。用户保持对其不断发展的叙事的控制。因为 AI 没有对他们施加刚性档案,用户可以改变习惯、观点,甚至身份的方面,AI 将同步适应而不是抵制或用"但你曾经说过..."唠叨。这种动态对健康的长期人类-AI 伙伴关系至关重要。它将用户视为其故事的成长主角,而不是要固定在位的数据点。AI 成为支持用户自我连续性的脚手架,而不是将他们困在过去反思中的镜子。

从数字人格角度,Macaron 的方法建议了构成"数字自我"的模型。它不是单一数据双重(不是服务器中人的副本),而是一个随时间和上下文展开的过程。如果社会和法律曾经认识到 AI 辅助的个人连续性 —— 例如,如果 AI 可以被视为一个人扩展思维的一部分或甚至被授予某种依赖人格 —— 这可能是因为像这样的架构。它们表明 AI 可以有连续性而没有单一身份:就像公司是由许多部分和过程组成的法人一样,个人 AI 可以被视为人身份的一部分而不是直接数据克隆。

有趣的是,这种数字人格的法律地位仍未定义。正如一位评论员指出的,未来的法律学术必须解决数字人格和与作为一个人身份一部分行动的 AI 代理相关的责任或权利问题。Macaron 的大脑为负责任方法提供了案例研究:通过避免集中行为档案,它回避了许多伦理和法律担忧(如分析偏见,或 AI 在过时信息上"失控")。如果有一天个人 AI 被考虑法律认可(例如,能够代表用户自主执行某些行动),通过可问责记忆而不是不可理解人格模型维护一致性的架构将更容易证明和信任。

另一个含义是死后或长期缺席后的连续性。如果 Macaron 用户闲置一年后返回,AI 可以从存储的记忆中无缝恢复其身份编织(具有衰减但未删除的引用)。如果用户去世并且他们的家人继续对话,AI 不是那个人(Macaron 也不尝试这样),但它确实提出了问题:多少连续性足以有意义的存在?我们已经看到了爱人的数字化身的例子,其中"起源和回声之间的界限在对话中消解",正如一项对提示数字自我的分析所说。理论上,Macaron 的大脑可以促进一种数字连续性 —— 尽管伦理使用可能会将其限制在活着用户的利益上(例如,帮助你在后来的年份连贯地记住自己的生活事件)。

最后,通过不将用户最终确定为档案,Macaron 的设计隐含地承认了哲学立场:身份是构建的、持续的和上下文绑定的。这与后现代观点共鸣,即没有核心不变的自我,只有叙事自我。Macaron 的大脑在这个意义上是一个叙事引擎。对用户来说,这可能是解放的 —— 这意味着他们的 AI 与他们一起进化,共同创建叙事而不是强制执行一个。这也意味着 AI 可以促进自我发现:因为它可以注意模式("你在我们关于工作和个人事务的对话中经常热情地谈论公平"),但它不会断言它们为静态真理,它可以温和地反映用户的明显价值观并让用户确认或重新定义它们。用户保持作者;AI 是一个非常复杂的编辑和连续性跟踪器。

结论

从基质到自我 —— 我们已经从 Macaron 的底层记忆机制旅行到由大脑架构支持的连续个人"自我"的出现。我们看到连续性不需要来自事实的永久存储或整体用户模型。相反,Macaron 信任更有机的方法:除非更新否则褪色的记忆、分隔经验但允许交叉交谈的边界、被视为知识维度的时间,以及反事实推理来在用户的灵活理解中锚定决定。结果是一个一致但不约束、连贯但不静态的个人 AI。

这一直是必要的理论探索,因为这种高阶行为在个人 AI 设计的前沿。然而它基于具体原则:隐私(无集中分析)、类似人类的记忆功能(记住和遗忘)和适应性学习。Macaron 的大脑避免集中用户模型或行为档案不仅是为了隐私,而是因为这不是真正的个人连续性如何工作。通过在没有合成的情况下保持一致性,Macaron 确保用户最终编织连续性的线索,AI 提供织机和引导线索的温和手。

展望未来,随着个人 AI 变得更加普遍,我们可能会发现只有那些设计有这种流动连续性的才能赢得用户的长期信任。一个永远不忘记也永远不改变的 AI 将是令人不安的;一个忘记太多的,令人沮丧。Macaron 的愿望是恰到好处 —— 记住重要的,忘记不重要的,陪伴用户穿越时间作为忠实而不断发展的伙伴。在这样做中,我们接近这样一个愿景:数字系统尊重和强化自我的连续性,而不是分割或冻结它。大脑系列追踪了这个愿景:从拒绝数据库隐喻,到构建动态基质,到培育开始看起来像"自我"的东西。影响将继续展开,但有一件事是清楚的 —— 通往真正丰富人类生活的个人 AI 的道路在于拥抱身份和记忆的复杂性,为变化和连续性一起架构。Macaron 的大脑是朝那个方向的持续实验,一个自我的脚手架,即使它与你一起成长,也保持你的

相关文章

Loading related articles...

申请成为 Macaron 的首批朋友