作者:Boxu Li

從基礎模型到個性化代理

現代的基礎模型展現出令人印象深刻的普通知識和推理能力。然而,這些基礎模型一開始並未針對個別用戶進行調整。它們通常缺乏有關您的背景知識,並在不熟悉的情境中難以真正地創造性解決問題。例如,研究人員發現,即使是最先進的語言模型在需要創新解決方案的任務中表現不佳——需要多達十倍的步驟才能達到最佳水平,且仍然遠遠低於人類的表現,因為它們往往堅持於傳統的思維模式。目前的語言模型在沒有提示的創意謎題基準上平均僅能達到約15%的進展,這凸顯了它們在創意方面的限制。這種創意差距尤其值得注意,因為創造性智力——即適應和超越既定模式進行創新能力——被認為是智力的重要組成部分,但大多數AI基準卻很少涉及這一點。

從思維鏈到ReAct:新範式

為了突破這些限制,AI研究社群一直在探索讓模型更像人類思考和行動的方法。其中一個突破是由Shunyu Yao等人在2022年提出的ReAct範式。ReAct代表「Reason+Act」,是一種將模型的內在推理過程與外部行動交錯進行的框架。與其僅從靜態記憶生成答案或盲目採取行動,ReAct代理人能同時做到這兩點——它會透過問題推理並在循環中與工具或環境互動。這種協同方式使AI能夠獲取新資訊並動態調整計畫。Yao及其同事證明,ReAct方法系統性地優於僅依賴思維鏈推理或單純行動執行的方法。通過緊密整合思維與行動,模型能產生更類似人類的任務解決軌跡,從而提高其可解釋性和有效性。

Macaron的API——AI模型之上的個人微調層

Macaron的平台可以被視為建立在最佳基礎模型之上的個人微調層。不是從頭開始構建大型AI,Macaron利用現有大型模型的知識和語言能力,並根據您的需求進行個性化調整。系統會根據特定任務選擇最佳模型或模型組合,然後根據您的個人使用模式微調其行為。

在實踐中,Macaron 充當一個智能的協調層:它不斷從你的互動和偏好中學習,更新其回應方式,以便更好地服務於你。這可以比作擁有你自己的 GPT 定製版本,它逐漸學習你的風格,而不是一個統一的模型。在背後,Macaron 使用內部的強化學習平台來實現這種大規模的自適應微調。通過強化學習,特別是在模型的初步預訓練之後,Macaron 的 AI 根據真實用戶的反饋和數據進行後續訓練——基本上是在一個安全、受控的環境中通過經驗學習。因此,AI 隨著每日使用而演變,隨著時間的推移,變得更能貼合每個用戶的需求。

深度記憶與情感智慧

Macaron 方法的另一個支柱是其對深度記憶與情感智慧的關注。與那些忘記上下文或不能捕捉語氣的通用聊天機器人不同,Macaron 被設計成能像「信任的朋友」一樣,對你進行細膩的、長期的理解。通過量身定制的上手指導和持續學習,它建立起對你偏好、習慣,甚至情感線索的深刻記憶。這使得 Macaron 能夠提供富有情感智慧的、情境感知的互動,與用戶在個人層面產生共鳴。

例如,如果你在壓力大的時候經常尋找食譜,Macaron可能會在推薦食譜的同時提供溫柔的鼓勵。它可以記住你偏好素食料理或曾提到過的過敏反應。這些個人化的細節——不僅了解你問什麼,還了解你為什麼問——讓整個體驗更加真誠和支持。許多 AI 平台在這方面表現不佳。Macaron 通過在微調過程中優先考慮同理心和背景來直接解決這個問題,旨在成為一個可愛的 AI 伴侶,而不是冷冰冰的軟體工具。

按需自適應迷你應用生成

個人化微調層適應每位用戶的偏好。

Macaron 最創新的功能之一——也是其個性化微調過程的一個關鍵成果——就是能夠按需製作**「迷你應用程式」來解決您的問題。只需請求 Macaron 的幫助應對現實生活中的需求,它會自動組合出解決方案,您無需費心動手。例如,如果您說,「我需要幫助安排我的學習計劃,」** Macaron 可能會為您的課程安排量身打造一個課程助手迷你應用程式。如果您提到希望追踪餐飲,它可以創建一個輕量級的烹飪日記應用程式。這一切都是即時發生的——無需冗長的開發週期或手動提示設計。

Macaron 的創造力、上下文理解以及基礎模型的廣博知識使這一切成為可能。傳統的 AI 服務或開發者平台可能需要您找到模板或聘請程式設計師來獲得自定義應用程式。相反,由於 Macaron 對您的意圖進行了精細調整的理解,它能夠根據需要生成這些功能。這大大減少了從構思到執行所需的時間和精力。

創意智慧的基準:Macaron 如何保持領先

像 EscapeBench 這樣的研究顯示,對 AI 來說,創意解難是多麼具有挑戰性。EscapeBench 是一個文本為基礎的密室逃脫遊戲基準,迫使 AI 代理需要跳出框框思考——例如,以非常規的方式重新利用物品。在這類基準上,標準的語言模型常常表現不佳:它們經常陷入只用明顯的方法使用工具,而錯過了創新的解決方案。這正是 Macaron 設計的亮點所在。透過融合前瞻與反思策略(類似於為應對 EscapeBench 挑戰而引入的 EscapeAgent 方法),Macaron 的代理可以在面對複雜任務時生成創新的假設並追蹤未解決的目標。

得益於強化學習增強的精細調整,Macaron 也能夠通過每次嘗試持續提高其創造力。如果某個特定的解決方案路徑失敗了,Macaron 的代理可以反思並調整,就像人類一樣。隨著時間的推移以及數千用戶的使用,這將導致一個比從未學習過的 AI 更加足智多謀和適應性強的 AI。

Macaron vs. 其他 AI 平台:為何個性化勝過通用

Macaron 比任何其他 AI 代理更關心你

當今的 AI 版圖提供了從開放模型中心到聊天機器人應用的一切,但 Macaron 獨特的用戶中心化微調讓它脫穎而出:

  • 開發者平台(如 Hugging Face)提供許多模型的訪問,但需要專業知識來微調或部署。Macaron 自動進行繁重的工作,呈現出一個仿佛為你量身定做的模型。
  • 角色聊天機器人(如 Character.AI)讓用戶與角色對話,但它們不會真正學習或記憶。Macaron 持續適應並保持長期的上下文記憶,創造更深入和豐富的對話。
  • Lovable 專注於演示和預設展示,但缺乏快速創建日常消費者需求迷你應用的靈活性。相較之下,Macaron 可以在幾分鐘內提供真正的實用性。

AI 的未來:個人化微調是前進的方向

隨著 AI 系統變得更強大,下一個前沿是使它們真正個性化和深度適應。Macaron 展示了為什麼個人 AI 助理被認為是未來的趨勢。它比大型通用模型更以用戶為導向,比靜態聊天機器人更具動態性,提供了兩者的最佳結合:頂級 AI 模型的強大性能和個人助理的適應性。

無論是在創意基準上超越他人,或只是通過在幾秒鐘內製作迷你應用來節省您的時間,Macaron 展示了當 AI 關注個體時,可能性是無限的。這是一種向著符合您需求的 AI 的範式轉移,而 Macaron 正在引領進入真正個人化 AI 助理的時代。

Boxu 在埃默里大學獲得了定量經濟學專業的學士學位。在加入 Macaron 之前,Boxu 的職業生涯大部分時間都在美國的私募股權和風險投資領域度過。他現在是 Macaron AI 的首席參謀和市場營銷副總裁,負責管理財務、物流和運營,並監督市場營銷。

申請成為 Macaron 的第一批朋友