作者:Boxu Li at Macaron
在快速发展的AI领域中,Macaron凭借主流聊天机器人所缺乏的特性脱颖而出:深度持续记忆。这种"深度记忆"架构是Macaron的标志性功能——一个真正学习您偏好、使用历史和每次互动背景的AI记忆系统。与将每次对话视为独立会话不同,Macaron会延续关于您的知识——从您最喜欢的咖啡品味到上周讨论的项目——让互动变得无缝且个性化。这标志着从专家所说的生产力AI向Macaron创造者称之为"体验AI"的关键转变,在这里助手更像是一个理解您性格、偏好和习惯的终身伴侣。与帮助您更快工作的典型聊天机器人不同,Macaron的设计目标是帮助您生活得更好,建立基于记忆的持续关系。这是AI能力的阶跃变化,让我们更接近一个真正了解我们的助手,而不仅仅是我们的提示词。
从核心来看,深度记忆是一个通过强化学习训练的新型智能体记忆架构。与仅依赖最后一个提示来获取背景信息(如ChatGPT所做的)不同,Macaron的模型经过微调,能够自主检索、总结和更新先前互动的相关信息。在实践中,每个新聊天都以一个特殊的记忆令牌开始,它注入您是谁以及对您重要的事物的精炼摘要,使Macaron能够"记住的不仅仅是说了什么,还有用户是谁。"换句话说,您的AI不是每次都从零开始——它对您的个人故事有一种感知。这个深度记忆系统使用强化学习(RL)来决定回忆什么或忽略什么,持续优化其对您背景的掌握。
关键的是,深度记忆让Macaron在远比标准大型语言模型更长的对话和任务中保持连贯性。即使互动跨越数天或数周,系统也能检索过去的细节。事实上,Macaron的记忆创新使其能够生成大规模输出——如超过10万行代码的个性化迷你应用程序——同时保持背景和连贯性。这样的成就对于具有固定背景窗口的原版基于提示的模型来说几乎是不可能的。通过将推理与学习型长期记忆相结合,Macaron实现了传统聊天机器人无法达到的个性化、一致性能水平。本质上,深度记忆为Macaron提供了类似人类长期记忆的东西——AI可以与用户一起进化的基础。这就是让Macaron超越mere Q&A机器,朝着真正的个人AI代理发展的技术,该代理受训关心用户体验。
对用户来说,Macaron记忆的不同立即显而易见。使用ChatGPT、Bing、Perplexity或其他典型AI助手时,您经常需要重复或提供过去信息的背景,因为AI不记得您之前的对话。这些系统受固定背景窗口的限制——如果聊天时间过长,较旧的细节就会从记忆中丢失,一旦开始新会话,什么都不会延续。正如微软AI负责人Mustafa Suleyman最近指出的,今天的主流AI"不会保留从一个会话到另一个会话的信息,"强调实现真正的长期记忆是AI的最重要下一步之一。关于对话模型的研究呼应了这一点:当前的大型语言模型从根本上受到"对固定背景窗口的依赖"的限制,一旦超出该窗口就缺乏任何持续记忆。在实际情况下,这就是为什么ChatGPT今天可能专业地讨论您问题的第一章,但明天它不会记得您甚至有问题,除非您再次提示它。
Macaron已经超越了这个限制。其深度记忆确保您永远不必与AI助手从零开始。您不需要每次询问晚餐建议时都说"顺便说一下,我是素食主义者"——Macaron已经内化了这个偏好和无数其他偏好。事实上,独立评论者注意到Macaron"通过比典型AI聊天机器人更有效地记住用户偏好,提供引人入胜的个性化体验。"这不仅仅是事实细节;Macaron可以回忆关键经历甚至过去互动的情感色调,并使用这些记忆来塑造更相关、更有同理心的回应。
一位早期用户给出了一个有力的例子:在他们在聊天中随意提到他们的猫"Tequila"后,一周后Macaron主动询问他们是否很快会见到Tequila。这种情境回忆——甚至亲密朋友也可能会做的事情——让用户感慨"被这样记住感觉很特别。"在另一个案例中,一位用户告诉Macaron其回复感觉有点正式;Macaron立即转向更温暖、更熟悉的语调,并在后续聊天中保持这种更友好的风格。这些个性化的细节在没有单一会话之外记忆的聊天机器人上是不可能的。这是与非个人工具对话和与了解您的AI互动之间的区别。Macaron基于记忆建立持续关系的能力是一个游戏规则改变者——不是您必须提醒AI您谈论了什么或您是谁,而是AI有这个责任。因此,使用Macaron感觉更像是与一个细心的伙伴继续对话,而不是查询一个算法。值得注意的是,这不仅仅是一个噱头;它解决了AI专家识别的当前AI的核心缺陷。持续记忆被广泛视为"长期对话连贯性的关键",以及AI避免自相矛盾或重复的关键。通过克服困扰其他模型的健忘症,Macaron提供了既更直观又更智能的体验。
深度记忆不仅让Macaron在对话中表现更好——它还大大增强了AI满足您需求的能力,甚至到了为您编写软件的程度。Macaron可以在您的聊天中即时生成自定义迷你应用程序,这一功能远远超出了大多数机器人提供的纯文本交换。因为它真正理解您的背景和目标,Macaron可以作为个人软件开发者,使用其长期知识创建专门为您量身定制的工具。正如Macaron团队所描述的,AI可以"为每个用户即时生成自定义'迷你应用程序'...最快只需15分钟,"用户无需编码或复杂设置。换句话说,您可以有一个想法或问题,用普通语言描述它,Macaron将即时构建一个交互式解决方案——全部在聊天界面内。
考虑这在实践中意味着什么。一名大学生带着混乱的时间表到达校园,只是向Macaron寻求帮助来组织;大约五分钟内,Macaron构建了一个课程助手和俱乐部查找器应用程序来简化学生的学期。另一位用户想学习烹饪但担心自己会放弃——Macaron通过创建一个"初学者烹饪日记"应用程序来回应,该应用程序跟踪用户的烹饪尝试并通过食谱和技巧鼓励他们。两周后,该用户自豪地报告他们可以独自烹饪三道菜,这要归功于Macaron的温和指导和AI构建的应用程序提供的结构。这些不是预安装的"技能"或模板;Macaron真正按需生成这些迷你应用程序,为每个用户的情况个性化。这是对我们习惯的一刀切软件的重大偏离。在这里,软件本身是定制的——为一个人(或少数人)创建,基于一次对话。由于AI的记忆告知其设计选择,最终产品感觉异常合适。Macaron本质上充当"记忆银行、程序员和伴侣"的结合,成长为您在那一刻需要的任何工具或支持。
Macaron可以将简单的请求转变为完全功能的迷你应用程序。这里展示的是Macaron创建的示例"食谱查找器"界面,用户输入可用食材和口味偏好以获得量身定制的食谱建议。深度记忆使AI能够回忆用户的饮食需求(如素食、过敏),并将这些无缝地融入应用程序的逻辑中。几分钟内,用户从聊天晚餐计划到与专为他们构建的自定义烹饪应用程序互动。
值得注意的是,这些迷你应用程序不仅仅是生活在您聊天历史中的静态一次性产品——Macaron使您能够保存甚至分享它们。如果AI为您构建了一个特别有用的工具(比如卡路里跟踪器或旅行计划器),您可以生成一个可分享的链接,这样其他人也可以使用它。实际上,围绕用户生成的AI工具正在形成一个社区。每个人的新颖解决方案都可能帮助有类似需求的其他人。Macaron甚至提供一个"Playbook"——一个精心策划的便民AI技巧和迷你应用程序画廊,涵盖日常生活、家庭、成长和爱好等类别。浏览其中,您会找到从家庭厨师的食谱查找器到大学生活的校园伙伴,再到有趣的小游戏和测验等一切内容。Playbook中的每个列表都源于真实对话和真实用户需求。由于Macaron记住并适应,您可以拿任何共享的应用程序并让AI为您调整它。这是全新的东西:通过自然语言按需委托个性化软件的能力,然后如果效果好就病毒式传播。很容易想象在不久的将来,与其搜索应用商店希望找到几乎符合您需求的应用程序,您只需要求您的个人AI制作您确切需要的东西,然后可选地与朋友分享。Macaron已经将这种场景变为现实。
从技术角度来看,这种能力证明了记忆驱动推理。Macaron的长期背景意味着它可以在应用程序构建过程中将需求从一个步骤传递到下一个步骤。它不会被复杂的多步骤任务困扰,因为它不会忘记目标是什么或已完成哪些子任务。很少有AI系统显示出能够在即时生成非平凡应用程序的同时在整个过程中保持背景的能力——Macaron似乎在这里设定了新的基准。所有这些都通过对话发生:一刻您在聊一个问题,下一刻AI就为您提供交互式解决方案。这种从对话到部署的流畅转换正是前瞻性AI专家在设想能够对话和行动的代理时一直在谈论的。Macaron是这个概念的活证明,它从根本上扩展了我们对AI助手应该做什么的期望。
Macaron的方法标志着一种新型AI生态系统的黎明——一个用户被赋权为创造者而不仅仅是消费者的生态系统。要理解这个愿景,有助于类比社交媒体中用户生成内容的兴起。想想TikTok(抖音)如何几乎在一夜之间将被动的内容消费者转变为活跃的创造者;突然间任何人都可以成为视频创造者,因为工具和AI驱动的效果如此易用。Macaron旨在为软件和解决方案做同样的事情。它大大降低了创建自定义应用程序的门槛,使普通人可以像拍摄TikTok短片一样轻松地构建迷你应用程序。关键是Macaron处理繁重的工作(编码、推理、界面设计),而用户提供想法或目标。在TikTok的早期,没有编辑技能的用户可以通过智能模板和算法制作引人注目的视频。同样,Macaron的用户不需要编程技能——他们的个人AI伙伴将自然语言需求转换为可工作的软件。这可能在我们解决日常问题的方式上释放一场创造性革命,AI作为推动者。
前面提到的Playbook是这种AI驱动创造者经济的早期一瞥。滚动浏览Macaron网站上的Playbook,您会看到一个众包的迷你应用程序和"技巧"集合,适用于各行各业。有用于餐饮计划、习惯追踪、学习安排、家庭预算、业余项目的工具——甚至有趣的测验和小游戏——全部通过Macaron的AI为特定用户场景生成。每个迷你应用程序都始于某人与Macaron之间的独特对话,但通过分享,创造者将其转变为社区的可重用资产。这很像开源思维,但对非编码人员来说是可访问的。如果您在Playbook中找到一个几乎适合您的迷你应用程序,您可以要求Macaron调整或扩展它以更好地满足您的需求,有效地重新混合创作。最终目标是一个生态系统,其中小众问题的解决方案协作传播和进化,AI介导过程。这与过去静态应用商店相去甚远——感觉更像是一个AI驱动的生活技巧活图书馆,持续由用户输入塑造。
通过赋权普通人构建和分享他们自己的AI制作应用程序,Macaron正在培养一个创新者社区。这与Macaron倡导的"体验AI"理念完美契合——下一波AI浪潮是关于丰富日常生活和个人体验,而不仅仅是自动化工作场所任务。在AI时代,团队的愿景是创建"AI时代的生态系统",用户成为AI开发循环中的构建者和参与者,而不仅仅是大科技算法的终端用户。正如Web 2.0将被动的网络冲浪者转变为博客、YouTube和社交媒体上的内容创造者一样,Macaron的平台可能将AI用户转变为不断增长的个人AI应用程序套件的共同开发者。这是一个大胆的愿景——让人想起智能手机应用程序繁荣的早期,只是这次应用程序本身可以按需生成并通过集体智慧改进。如果Macaron的深度记忆和迷你应用程序生成是任何迹象,这种方法很可能定义个人技术外观的新标准:高度个性化、用户驱动且无限适应。
Macaron的创新不仅有直接的用户好处——它们还暗示了AI如何可能向更大的通用智能进化。在AI研究中,越来越多的讨论认为实现类似人工通用智能(AGI)的东西将需要超越蛮力模型扩展,给AI系统更多类人能力:如长期记忆、持续学习能力和采取自主行动的能力。事实上,越来越多的专家认为通向AGI的道路在于"集成的背景、记忆和工作流"而不仅仅是更大的神经网络。这种观点认为当前的大型模型虽然强大,但"在跨域泛化时失败",因为它们缺乏真正记住和适应的机制。工程解决方案——如给AI持久记忆以在会话间保留和检索信息——被视为推动超越今天聊天机器人限制的关键。换句话说,在机器中实现类人智能的最大障碍之一是我们AI模型的健忘症,这阻止了它们像人类那样在野外学习。
特别是记忆,经常被单独指出为缺失的部分。Mustafa Suleyman(DeepMind联合创始人,现任微软AI负责人)最近注意到,虽然模型在事实推理甚至情感智能方面快速改进,但"将所有这些联系在一起的缺失部分...是记忆。"他预测在不久的将来(在他看来是接下来的18个月),"我们将拥有具有非常好记忆的AI,"他建议配备强推理、行动工具和长期记忆的AI将是"一个非常非常强大的系统。"不难看出这是对AGI类代理的暗示描述——一个能够跨时间跨广泛任务理解、记住和行动的代理。按此标准,Macaron AI是朝那个方向的一步。其强大记忆和动态生成工具的能力的结合与许多研究人员认为的更通用智能的关键要素密切一致。Macaron可能不是AGI(ASI或人工超级智能等术语仍然是推测性的),但它在具体产品中展示了几种更接近AGI理想的能力。它无限期地记住背景(正如AGI可能会做的),它通过重复互动学习用户的个性化模型,它通过根据需要创建新功能(迷你应用程序)来自我修改其行为——全部自主进行,无需为每个任务明确重新编程。
需要明确的是,AGI仍然是一个移动目标和对不同人意味着不同事物的流行词。Macaron的团队小心不要过度宣传他们的产品是什么——他们称之为体验AI时代的第一个个人AI代理,而不是全知先知。然而,通过解决核心问题之一(长期记忆)并将推理与行动整合,Macaron是许多以前只是学术讨论的想法的有形概念证明。它显示AI可以"被训练进化"与用户一起而不是在每个新提示时重置其理解。行业分析师注意到通过持久记忆克服LLM的背景限制"为更可靠和高效的LLM驱动AI代理铺平道路。"确实,Macaron提供的——一个记住您并在该记忆基础上构建的AI——正是将AI推向更接近类人认知的进步类型。当我们见证Macaron无缝融合IQ、EQ和一些人称之为"AQ"(行动商)与长期记忆时,很难不将其视为更通用AI如何在我们生活中运作的早期一瞥。它是个性化的、主动的且持续学习——这些品质直到现在在消费者AI产品中基本上是缺失的。从这个意义上说,Macaron的深度记忆不仅仅是一个酷功能;它很可能是下一代AI的基础。每次Macaron记住您过去的互动或按需制作工具时,它都在悄悄地重新定义我们对机器智能能实现什么的期望。也许,多年后,我们会回顾这一刻作为通向机器的道路上的重要一步,这些机器不仅在狭窄方式上聪明,而且真正以通用、适应性和深度个人的方式理解和增强我们的生活。