展示基础模型演进的封面图片

作者:Boxu Li at Macaron

从基础模型到个性化智能体

现代基础模型展现出令人印象深刻的通用知识和推理能力。然而,这些基础模型并不是为个人用户量身定制的。它们往往缺乏对你的了解,在面对陌生场景时难以进行真正创造性的问题解决。例如,研究人员发现,即使是最先进的语言模型在需要创新解决方案的任务上也会表现不佳——需要比最优方案多十倍的步骤,但仍远远达不到人类的表现水平,因为它们倾向于坚持传统思维。平均而言,当前的语言模型在没有提示的创造性谜题基准测试中只取得了约15%的进展,这凸显了它们在创造力方面的局限性。这种创造力差距值得注意,因为创造性智能——超越预定义模式进行适应和创新的能力——被认为是智能的关键组成部分,但大多数AI基准测试在很大程度上尚未解决这一问题。

从思维链到ReAct:新的范式

为了突破这些限制,AI研究社区一直在探索让模型更像人类一样思考和行动的方法。一个突破性进展是由Shunyu Yao等人在2022年提出的ReAct范式。ReAct代表"推理+行动",这是一个将模型的内部推理过程与外部行动交织在一起的框架。ReAct智能体不是仅从静态记忆中生成答案或盲目地采取行动,而是两者兼而有之——它通过问题进行推理,并在循环中与工具或环境交互。这种协同方法允许AI收集新信息并随时调整其计划。Yao及其同事表明,ReAct方法系统性地优于仅依赖思维链推理或仅执行动作的方法。通过紧密整合思考和行动,该模型产生更像人类的任务解决轨迹,这提高了其可解释性和有效性。

Macaron的API——AI模型之上的个人微调层

Macaron平台可以被视为构建在最佳基础模型之上的个人微调层。Macaron并不是从零开始构建一个庞大的AI,而是利用现有大型模型的知识和语言能力,并为您进行个人化适配。系统使用对给定任务最优的模型或模型组合,然后根据您的个人使用模式微调其行为。

在实践中,Macaron充当智能编排层:它不断从您的交互和偏好中学习,更新其响应方式以更好地为您服务。这可以比作拥有您自己的定制版本GPT,它逐渐学习您的风格,而不是一刀切的模型。在底层,Macaron采用内部强化学习平台来大规模实现这种自适应微调。通过强化学习,特别是在模型的初始预训练之后,Macaron的AI基于真实用户反馈和数据进行后训练——本质上是在安全、受控的方式下通过经验学习。因此,AI随着日常使用而发展,随着时间的推移变得更加适应每个用户的需求。

深度记忆和情感智能

Macaron方法的另一个支柱是专注于深度记忆和情感智能。与忘记上下文或无法理解语调的通用聊天机器人不同,Macaron被设计为对您建立细致入微的长期理解,"就像一个值得信赖的朋友"。通过量身定制的引导和持续学习,它建立对您的偏好、习惯甚至情感线索的深度记忆。这使Macaron能够提供情感智能、上下文感知的交互,在个人层面与用户产生共鸣。

例如,如果您经常在压力大时询问食谱,Macaron可能会学会在提供食谱建议的同时给予温和的鼓励。它可以记住您偏爱素食菜肴或您曾经提到过敏症。这些个人化的触感——不仅理解您问什么,还理解您为什么问——让体验感觉更加真正人性化和支持性。许多AI平台在这里遇到困难。Macaron通过在其微调过程中优先考虑同理心和上下文来直接解决这个问题,旨在成为一个可爱的AI伴侣,而不是冷冰冰的软件工具。

按需自适应小程序生成

展示动态创建的小程序生成界面

Macaron最创新的功能——也是其个性化微调过程的关键成果——是按需制作"小程序"来解决您的问题的能力。只需向Macaron寻求现实生活需求的帮助,它就会动态组装解决方案,无需您动手。例如,如果您说"我需要帮助组织我的学习计划",Macaron可能会启动一个针对您课程大纲定制的课程助手小程序。如果您提到想要跟踪您的餐食,它可以创建一个轻量级的烹饪日记应用程序。这一切都是即时发生的——无需冗长的开发周期或手动提示工程。

Macaron将创造力、上下文和基础模型的丰富知识相结合,使这成为可能。传统的AI服务或开发者平台可能需要您找到模板或雇佣程序员来获得定制应用程序。相比之下,Macaron可以根据需要生成该功能,得益于其对您意图的微调理解。这大大减少了从想法到执行所需的时间和精力。

创造性智能基准测试:Macaron如何保持领先

像EscapeBench这样的研究表明,创造性问题解决对AI来说是多么具有挑战性。EscapeBench是基于文本的密室逃脱游戏基准测试,迫使AI智能体跳出思维定式——例如,以非常规方式重新利用物体。在这样的基准测试中,标准语言模型表现困难:它们经常被困在以明显方式使用工具上,错过创新解决方案。这就是Macaron设计发光的地方。通过整合预见和反思策略(类似于为解决EscapeBench挑战而引入的EscapeAgent方法),Macaron的智能体可以生成创新假设,并在面对复杂任务时跟踪未解决的目标。

得益于其强化学习增强的微调,Macaron还可以通过从每次尝试中学习来持续改进其创造力。如果特定的解决方案路径失败,Macaron的智能体可以反思和调整,就像人类一样。随着时间的推移和数千名用户的使用,这导致AI比那些部署后从不学习的AI更加足智多谋和适应性强。

Macaron与其他AI平台:为什么个性化胜过通用

Macaron与其他AI平台的比较图表

如今的AI领域提供了从开放模型中心到聊天机器人应用程序的一切,但Macaron独特的以用户为中心的微调使其脱颖而出:

  • 开发者平台(例如Hugging Face)提供对许多模型的访问,但需要专业知识来微调或部署。Macaron通过自动完成繁重的工作来消除这个障碍,呈现一个感觉为您量身定制的模型。

  • 角色聊天机器人(例如Character.AI)让用户与角色聊天,但它们并不真正学习或记忆。Macaron持续适应并保持长期的上下文记忆,创造更深入和更丰富的对话。

  • Lovable专注于演示和预设展示,但缺乏快速为日常消费者需求制作小程序的灵活性。相比之下,Macaron在几分钟内提供真正的实用性。

AI的未来:个人微调是前进的道路

随着AI系统变得更加强大,下一个前沿是使它们真正个性化和深度适应。Macaron展示了为什么个人AI智能体注定要成为未来。通过比大型通用模型更以用户为导向,比静态聊天机器人更具动态性,它提供了两个世界的最佳:顶级AI模型的强度和个人助手的适应性。

无论是在创造性基准测试中表现优异,还是简单地通过在几秒钟内制作小程序来为您节省时间,Macaron表明当AI关注个人时,可能性是无穷的。这是向为您量身定制的AI的范式转变——Macaron正在引领进入真正个性化AI智能体时代的道路。

相关文章

Loading related articles...

申请成为 Macaron 的首批朋友