
작성자: Boxu Li
현대의 기초 모델은 인상적인 일반 지식과 추론 능력을 보여줍니다. 그러나 이러한 기본 모델은 처음부터 개별 사용자에게 맞춰져 있지 않습니다. 이들은 종종 사용자에 대한 맥락이 부족하고, 낯선 상황에서 진정한 창의적 문제 해결에 어려움을 겪습니다. 예를 들어, 연구자들은 최신 언어 모델조차도 창의적인 솔루션이 필요한 작업에서 최적보다 최대 10배 더 많은 단계가 필요하며, 여전히 인간의 성능에 비해 크게 부족하다는 것을 발견했습니다. 이들은 관습적인 사고에 머무르는 경향이 있습니다. 평균적으로, 현재의 언어 모델은 힌트 없이 창의적 퍼즐 벤치마크에서 약 15%의 진전만을 이루었으며, 이는 창의력의 한계를 강조합니다. 창의적 지능, 즉 사전 정의된 패턴을 넘어 적응하고 혁신하는 능력은 지능의 중요한 구성 요소로 인식되지만, 대부분의 AI 벤치마크에서는 크게 다루어지지 않고 있습니다.
이러한 한계를 넘어서기 위해, AI 연구 커뮤니티는 모델이 인간처럼 사고하고 행동하게 만드는 방법을 탐구해 왔습니다. 한 가지 돌파구는 2022년 Shunyu Yao 등이 도입한 ReAct 패러다임입니다. ReAct는 「Reason+Act」, 즉 모델의 내부 추론 과정을 외부 행동과 교차시키는 프레임워크를 의미합니다. 정적 메모리에서만 답을 생성하거나 맹목적으로 행동만 하는 대신, ReAct 에이전트는 문제를 추론하고 도구나 환경과 반복적으로 상호작용합니다. 이 시너지적인 접근 방식은 AI가 새로운 정보를 수집하고 즉각적으로 계획을 조정할 수 있게 합니다. Yao와 동료들은 ReAct 접근 방식이 단순히 사고의 연쇄적 추론이나 단독 행동 실행에 의존하는 방법보다 체계적으로 뛰어나다는 것을 보여주었습니다. 사고와 행동을 긴밀히 통합함으로써, 모델은 보다 인간에 가까운 문제 해결 경로를 생성하며, 이는 해석 가능성과 효율성을 향상시킵니다.
Macaron의 플랫폼은 최고의 기초 모델 위에 구축된 개인화된 미세 조정 레이어로 생각할 수 있습니다. 하나의 거대한 AI를 처음부터 구축하는 대신, Macaron은 기존의 대형 모델들이 가진 지식과 언어 능력을 활용하고 이를 개인적으로 조정합니다. 시스템은 주어진 작업에 최적의 모델 또는 모델 조합을 사용한 후, 사용자의 개별 사용 패턴에 따라 그 행동을 미세 조정합니다.
실제로 Macaron은 스마트 오케스트레이션 레이어로 작동합니다. 사용자의 상호작용과 선호도를 지속적으로 학습하여 더 나은 서비스를 제공하기 위해 응답 방식을 업데이트합니다. 이는 점점 사용자의 스타일을 배우는 맞춤형 GPT 버전을 갖는 것과 유사합니다. Macaron은 자체 강화 학습 플랫폼을 활용하여 이러한 적응형 미세 조정을 대규모로 수행합니다. 강화 학습을 통해, 특히 모델의 초기 사전 훈련 후에는, 실제 사용자 피드백과 데이터를 기반으로 AI가 안전하고 통제된 방식으로 경험을 통해 학습합니다. 그 결과, AI는 일상 사용과 함께 진화하며 시간이 지남에 따라 각 사용자의 요구에 더욱 잘 맞게 됩니다.
Macaron의 접근 방식의 또 다른 핵심은 깊은 기억과 감성 지능에 대한 초점입니다. 일반적인 챗봇이 문맥을 잊거나 톤을 잘못 파악하는 것과 달리, Macaron은 **「믿을 수 있는 친구」**처럼 사용자를 세심하고 장기적으로 이해하도록 설계되었습니다. 맞춤형 온보딩과 지속적인 학습을 통해 선호도, 습관, 심지어 감정적 신호에 대한 깊은 기억을 구축합니다. 이를 통해 Macaron은 사용자의 개인적인 수준에서 공감할 수 있는 감성 지능을 갖춘 문맥 인식 상호작용을 제공합니다.
예를 들어, 스트레스를 받을 때 자주 레시피를 요청한다면, Macaron은 부드러운 격려와 함께 레시피를 제안하는 방법을 배울 수 있습니다. 당신이 채식 요리를 선호한다는 것 또는 한때 알레르기를 언급했다는 것을 기억할 수 있습니다. 이렇게 개인화된 접근 방식은 단순히 무엇을 요청하는지가 아니라 왜 요청하는지를 이해하는 것으로, 경험을 더욱 인간적이고 지원적으로 느끼게 만듭니다. 많은 AI 플랫폼이 이 부분에서 어려움을 겪습니다. Macaron은 공감과 맥락을 우선시하는 세심한 조정을 통해, 차가운 소프트웨어 도구가 아닌 사랑받는 AI 동반자가 되기 위해 직접 대응합니다.

개인 맞춤 조정 레이어가 각 사용자의 선호에 적응합니다.
Macaron의 가장 혁신적인 기능 중 하나는 개인 맞춤형 미세 조정 과정의 핵심 결과로서, 필요에 따라 **"미니 앱"**을 제작하여 문제를 해결하는 능력입니다. 현실적인 필요에 대해 Macaron에게 도움을 요청하면, 손끝 하나 까딱하지 않아도 동적으로 솔루션을 조립합니다. 예를 들어, **"내 공부 일정 정리에 도움이 필요해,"**라고 하면 Macaron이 커리큘럼에 맞춘 코스 도우미 미니 앱을 생성할 수 있습니다. 식사를 기록하고 싶다고 하면, 가벼운 요리 일지 앱을 만들어줄 수도 있습니다. 이 모든 과정은 실시간으로 이루어지며, 긴 개발 주기나 수작업 프롬프트 엔지니어링이 필요하지 않습니다.
Macaron의 창의성, 맥락, 그리고 기초 모델의 방대한 지식의 결합이 이를 가능하게 합니다. 전통적인 AI 서비스나 개발자 플랫폼은 맞춤형 앱을 얻기 위해 템플릿을 찾거나 프로그래머를 고용해야 할 수도 있습니다. 반면에 Macaron은 당신의 의도를 세밀하게 이해하여 필요에 따라 기능을 생성할 수 있습니다. 이는 아이디어에서 실행까지 필요한 시간과 노력을 획기적으로 줄여줍니다.
EscapeBench와 같은 연구는 창의적인 문제 해결이 AI에게 얼마나 도전적인지를 보여줍니다. EscapeBench는 AI 에이전트가 고정관념을 깨고 생각하도록 강요하는 텍스트 기반 탈출 게임의 벤치마크입니다. 예를 들어, 물건을 비정상적인 방법으로 재사용하는 것입니다. 이러한 벤치마크에서 기존 언어 모델들은 종종 도구를 명백한 방법으로만 사용하고 창의적인 해결책을 놓치는 경우가 많습니다. 여기에서 Macaron의 설계가 빛을 발합니다. Macaron의 에이전트는 EscapeBench 도전에 맞서기 위해 도입된 EscapeAgent 접근 방식과 유사하게 예측과 성찰의 전략을 통합하여 혁신적인 가설을 생성하고 복잡한 작업에 직면했을 때 해결되지 않은 목표를 추적할 수 있습니다.
강화 학습으로 강화된 미세 조정을 통해 Macaron은 각 시도에서 학습함으로써 창의력을 지속적으로 향상시킬 수 있습니다. 특정 해결 경로가 실패할 경우, Macaron의 에이전트는 반성하고 조정할 수 있으며, 이는 마치 인간과도 같습니다. 시간이 지남에 따라 수천 명의 사용자와 함께, 이는 배포 후 학습하지 않는 AI보다 훨씬 더 자원적이고 적응력이 뛰어난 AI로 이어집니다.

Macaron은 다른 어떤 AI 에이전트보다 당신을 더 신경 씁니다
오늘날 AI 환경은 오픈 모델 허브에서 챗봇 앱에 이르기까지 모든 것을 제공하지만, Macaron의 독특한 사용자 중심의 세밀 조정이 그것을 돋보이게 합니다:
AI 시스템이 더 능력 있게 되면서 다음 경계는 그것을 진정으로 개인화하고 깊이 적응하도록 만드는 것입니다. Macaron은 개인 AI 에이전트가 미래의 주역으로 자리 잡을 이유를 보여줍니다. 대형 일반 모델보다 더 사용자 중심적이고, 정적 챗봇보다 훨씬 더 역동적이기 때문에, 최상급 AI 모델의 강력함과 개인 비서의 적응성을 동시에 제공합니다.
창의적 기준에서 다른 사람들을 능가하거나 몇 초 만에 미니 앱을 만들어 시간을 절약하는 등, Macaron은 AI가 개인에게 주의를 기울일 때 가능성이 무궁무진하다는 것을 보여줍니다. 이는 당신에 맞춰진 AI로의 패러다임 전환이며, Macaron이 진정 개인적인 AI 에이전트 시대를 이끌고 있습니다.