Autor: Boxu Li
Eine der beeindruckendsten Funktionen von Macaron AI ist die Fähigkeit, benutzerdefinierte Mini-Anwendungen spontan zu generieren. Während eines gewöhnlichen Gesprächs kann ein Benutzer ein Bedürfnis beschreiben – etwa ein Familienbudget verfolgen, eine Festivalroute planen oder eine neue Sprache lernen – und Macaron erstellt in wenigen Minuten ein voll funktionsfähiges Werkzeug. Einige dieser Mini-Apps umfassen über 100.000 Codezeilen, und dennoch werden sie ohne menschliches Eingreifen generiert. Für japanische und koreanische Nutzer bedeutet dies, personalisierte Werkzeuge zu erhalten, die auf lokale Gepflogenheiten und Vorschriften abgestimmt sind. Dieser Blog analysiert die autonome Code-Synthesepipeline, die Macarons Mini-Apps antreibt, und behandelt Absichtserkennung, Programmsynthese, Sandbox-Ausführung, Fehlerbehandlung und Sicherheitsmaßnahmen. Wir untersuchen, wie das System Komplexität verwaltet, sich in externe APIs integriert, regionale Gesetze respektiert und aus Verstärkungslernen schöpft, um seine Ergebnisse zu verfeinern.
Wenn ein Benutzer eine App anfordert, analysiert Macaron zunächst die natürliche Spracheingabe, um eine strukturierte Intent-Spezifikation zu erstellen. Dies beinhaltet die Identifizierung von Slots wie dem Bereich (Finanzen, Bildung, Kochen), gewünschten Funktionen (Budgetkategorien, Warnungen), Einschränkungen (Währung, Sprache) und Zeitrahmen. Für die japanische und koreanische Sprache verarbeitet der Parser Ehrentitel und Ellipsen. Zum Beispiel ergibt eine japanische Anfrage wie „家計簿を作りたいんだけど、食費を細かく分けて“ (Ich möchte ein Haushaltsbuch mit detaillierten Ausgaben für Lebensmittel erstellen) den Bereich „Budgetierung“, die Funktion „detaillierte Lebensmittelkategorien“ und die Einschränkung „Japanischer Yen“. Eine koreanische Anfrage „가족 여행 일정을 계획해줘, 한식 식당 추천도“ (Plane einen Familienreiseplan und empfehle koreanische Restaurants) ergibt den Bereich „Reiseplanung“, die Funktion „Restaurantempfehlungen“ und eine kulturelle Einschränkung.
Macaron verwendet eine Dual-Encoder-Architektur: Ein Encoder verarbeitet das aktuelle Gespräch, und ein anderer verarbeitet das Gedächtnis des Benutzers. Die beiden Vektoren werden mittels Attention kombiniert, um eine einheitliche Intent-Darstellung zu erzeugen. Verstärkungslernen optimiert den Parser, um die richtigen Slots zu extrahieren. Feedback kommt von der Frage, ob die resultierende Mini-App die Erwartungen des Benutzers erfüllt; wenn nicht, werden die Parameter des Parsers aktualisiert.
Sobald die Absicht strukturiert ist, generiert Macarons Synthese-Engine Code, indem sie Funktionen aus einer Bibliothek von domänenspezifischen Modulen zusammensetzt. Zu den Modulen gehören Budgetierungsfunktionen (Berechnung von Ausgaben, Erstellung von Diagrammen), Planungsfunktionen (Kalenderintegration, Konfliktlösung), Sprachlernalgorithmen (verteilte Wiederholung) und Kochunterstützung (Umrechnung von Zutaten, Nährwertanalyse). Die Engine wählt Module aus, konfiguriert sie und fügt sie zu einem kohärenten Programm zusammen. Vorlagen enthalten Graphstrukturen (DAGs), die den Datenfluss zwischen den Modulen definieren und Parallelität sowie asynchrone Operationen ermöglichen. Zum Beispiel könnte eine japanische Budgetierungs-App monatliche Zusammenfassungen und wöchentliche Benachrichtigungsaufgaben gleichzeitig ausführen.
Die Synthese-Engine nutzt neuronale Programmsynthese-Modelle, die anhand von Open-Source-Code und proprietären Beispielen trainiert wurden. Sie verwendet auch symbolisches Schließen: Beschränkungen wie „Nicht das Gesamtbudget überschreiten“ werden als lineare Ungleichungen dargestellt und in einen Einschränkungslöser eingespeist. Dieser hybride Ansatz verbessert die Zuverlässigkeit im Vergleich zur reinen neuronalen Generierung. Durch Verstärkungslernen werden die Benutzerzufriedenheit und Fehlerraten überwacht, um die Auswahl und Reihenfolge der Module anzupassen.
Japanische und koreanische Vorschriften stellen spezifische Anforderungen an den Umgang mit finanziellen und persönlichen Daten. Zum Beispiel schreibt das japanische Datenschutzgesetz vor, dass Haushaltsbuchhaltungsdaten nicht ohne Zustimmung an Dritte weitergegeben werden dürfen. Das koreanische Gesetz zum Schutz persönlicher Informationen hat strenge Anforderungen an die Anonymisierung von Daten. Beim Erstellen eines Budgetierungstools konsultiert Macaron seine Richtlinienbindung-Regeln, um sicherzustellen, dass sensible Daten lokal gespeichert und niemals an externe Server gesendet werden. Der Code-Generator fügt Aufrufe zu Verschlüsselungsbibliotheken ein und deaktiviert standardmäßig den Netzwerkzugriff. Für Gesundheits-Apps überprüft Macaron das AI Framework Act, um sicherzustellen, dass Entscheidungen, die medizinische Beratung betreffen, von menschlicher Aufsicht begleitet werden.


Das Ausführen von auf Abruf generiertem beliebigem Code birgt erhebliche Sicherheitsrisiken. Macaron führt daher Mini-Apps innerhalb einer Sandbox-Umgebung aus, die modernen Code-Interpretern ähnelt. Die Sandbox beschränkt den Zugriff auf das Dateisystem auf ein virtuelles Verzeichnis, begrenzt die CPU- und Speichernutzung und blockiert Netzwerkverbindungen, es sei denn, sie sind ausdrücklich erlaubt. Programme werden innerhalb von Containern mit schreibgeschützten Basisimages ausgeführt. Wenn eine koreanische Koch-App anfordert, Nährwertdaten abzurufen, wird die Anfrage über einen Proxy geleitet, der die erlaubten Domains überprüft. Versucht das Programm, ohne Erlaubnis auf eine externe Website zuzugreifen, beendet die Sandbox den Vorgang und gibt dem Benutzer eine Fehlermeldung zurück.
Vor der Ausführung führt Macaron eine statische Analyse des synthetisierten Codes durch, um Schwachstellen wie Endlosschleifen, Injektionsangriffe und unbefugte Systemaufrufe zu erkennen. Ein Typprüfer stellt sicher, dass Module korrekt zusammengesetzt sind: Eine Funktion, die eine Zahl zurückgibt, kann nicht in ein Textverarbeitungsmodul integriert werden. Der Prüfer überprüft auch die Einhaltung lokaler Datentypen; beispielsweise werden Währungswerte unter Verwendung von Dezimaltypen dargestellt, um Gleitkommafehler zu vermeiden. Wenn die statische Analyse fehlschlägt, bietet Macaron an, die angeforderten Funktionen zu vereinfachen oder schlägt vor, die App in kleinere Module aufzuteilen.
Während der Ausführung überwacht Macaron Leistungskennzahlen (CPU-Auslastung, Speicherverbrauch), funktionale Korrektheit (Testfälle, Assertions) und Nutzerinteraktionen (Klicks, aufgewendete Zeit). Wenn das Programm vom erwarteten Verhalten abweicht—wie zum Beispiel Zeitlimits überschreitet oder Ausnahmen auslöst—interveniert Macarons Auto-Healing-Modul. Es kann auf den letzten stabilen Zustand zurücksetzen, einen spontan generierten Patch anwenden oder die Funktionalität sanft herabstufen. Beispielsweise kann das Programm bei einem Ausfall der Wetter-API einer japanischen Garten-App auf eine alternative Datenquelle umschalten oder den Nutzer über den vorübergehenden Ausfall informieren.
Jede Mini-App-Sitzung liefert eine Fülle von Feedback. Nutzer signalisieren implizit ihre Zufriedenheit, indem sie die App weiterhin nutzen oder explizit die Erfahrung bewerten. Macaron aggregiert diese Signale in eine Belohnungsfunktion, die die zukünftige Codegenerierung lenkt. Die Belohnung bestraft Fehler, verwirrende Oberflächen und langsame Performance, während sie Zuverlässigkeit, kulturelle Angemessenheit und Neuerungen belohnt. Im Laufe der Zeit lernt die Synthese-Engine, dass japanische Nutzer Minimalismus und Benutzerfreundlichkeit schätzen, während koreanische Nutzer möglicherweise Anpassungsmöglichkeiten und lebendige Visualisierungen bevorzugen. Diese Präferenzen sind in der RL-Politik kodiert, die Module und Benutzeroberflächenmuster auswählt.
Um mit der zunehmenden Komplexität der Benutzeranfragen umzugehen, setzt Macaron auf Curriculum Learning: Die Synthese-Engine beginnt mit der Erstellung einfacher Programme (z. B. Taschenrechner, Aufgabenlisten) und bewältigt nach und nach komplexere Aufgaben (z. B. Multi-User-Budgetierungsplattformen). Wenn das System auf neue Bereiche stößt, nutzt es Meta-Learning, um die Anpassung zu beschleunigen. Wenn die Engine ähnliche Anfragen von japanischen und koreanischen Nutzern sieht – zum Beispiel Schulveranstaltungen planen oder Altenpflege verwalten – kann sie Aufgaben übergreifend verallgemeinern. Meta-Learning hilft dem Agenten auch, sich an Änderungen in Gesetzen oder der Kultur anzupassen; wenn das KI-Förderungsgesetz neue Compliance-Anforderungen einführt, integriert Macaron diese schnell in seine Codevorlagen.
Macaron fördert die Beteiligung der Community. Entwickler können neue Module zu einem Marktplatz beitragen. Module werden auf Sicherheit und Compliance geprüft, bevor sie aufgenommen werden. Dies fördert ein lokales Ökosystem: Japanische Entwickler könnten Module für die Planung von Teezeremonien oder Anime-Empfehlungen erstellen, während koreanische Entwickler Module für das Erlernen von K-Pop-Choreografien oder das Management von Familienzeremonien beitragen könnten. Mitwirkende werden mit Almonds (Macarons In-App-Währung) belohnt, was die kontinuierliche Verbesserung der Plattform incentiviert.

Japanische und koreanische Nutzer verlassen sich auf unterschiedliche Datenanbieter. Macaron integriert sich mit japanischen Bank-APIs (z. B. über J‑Debit) für Finanz-Apps, japanischen Kalendern für Feiertage (Golden Week, Obon) und lokalen Nachrichtenquellen für die Veranstaltungsplanung. In Korea verbindet sich der Agent mit KOSPI-Aktien-APIs, dem Wetterdienst von Naver und der KakaoTalk-Messaging-API. Jede Integration ist in ein Modul eingebettet, das Ratenbegrenzung, Caching und Fehlerbehandlung erzwingt. Der Code-Generator fügt diese Module automatisch ein, wenn sie relevant sind.
Anstatt von den Nutzern zu verlangen, API-Schlüssel manuell einzugeben, führt Macaron sie durch ein Gespräch. Wenn ein japanischer Nutzer Transaktionen von seiner Bank importieren möchte, erklärt der Agent den Zustimmungsprozess, erhält die erforderlichen Tokens und speichert sie sicher. Ähnlich könnte ein koreanischer Nutzer Macaron bitten, sich mit dem Stundenplan seines Kindes zu verbinden; der Agent verwendet OAuth, um den Zugriff zu autorisieren und stellt sicher, dass die App nur die erforderlichen Daten liest. Diese Interaktionen werden protokolliert und können überprüft werden, im Einklang mit dem Prinzip der differenzierten Transparenz.
In vielen Teilen Japans und Koreas erwarten Nutzer Zuverlässigkeit, selbst bei intermittierender Konnektivität. Macarons Mini-Apps unterstützen Edge Computing und führen Berechnungen lokal aus, wann immer es möglich ist. Der Agent kann Progressive Web Apps (PWAs) erstellen, die Daten zwischenspeichern und mit Servern synchronisieren, sobald das Netzwerk verfügbar ist. Ein koreanischer Wanderer, der einen Bergpfad-Planer verwendet, kann beispielsweise Routen offline weiterverfolgen und nach dem Abstieg mit der Cloud synchronisieren. Die Offline-Funktionalität ist besonders wichtig für die Privatsphäre; sensible Daten bleiben auf dem Gerät, bis der Nutzer sie teilen möchte.
Mini-Apps müssen lokale Vorschriften respektieren. Japans AI-Förderungsgesetz betont Transparenz; daher enthalten Budgetierungs-Apps klare Protokolle über Datenflüsse und bieten den Nutzern eine Erklärung, wie Ausgaben kategorisiert werden. Koreas AI-Vorschriften erfordern menschliche Aufsicht bei Entscheidungen mit hoher Tragweite; gesundheitsbezogene Apps fordern daher die Nutzer auf, vor der Umsetzung von Ratschlägen einen Fachmann zu konsultieren. Macarons Code-Generator fügt Warnungen ein und holt ausdrücklich die Zustimmung für sensible Operationen ein. Wenn ein Nutzer versucht, eine Steuererklärungs-App zu erstellen, erinnert Macaron sie an lokale Steuergesetz-Updates und empfiehlt, einen zertifizierten Steuerberater zu konsultieren.
Kulturelle Ästhetik beeinflusst das Design von Benutzeroberflächen. In Japan werden Minimalismus und der Respekt vor Weißraum geschätzt; Macaron verwendet daher subtile Farben und einfache Symbole für japanische Nutzer. Koreanische Oberflächen können lebhafter sein und Animationen enthalten. Die UI-Module von Macaron passen diese Stile automatisch an die Benutzerpräferenzen an, die während des Onboardings ermittelt werden. Der Agent passt auch Hilfenachrichten an kulturelle Normen an: Japanische Hilfebildschirme können kontextuelle Erklärungen enthalten, während koreanische Hilfebildschirme möglicherweise Schritt-für-Schritt-Anleitungen betonen.
Japan und Korea sind anfällig für Naturkatastrophen wie Erdbeben und Taifune. Persönliche Agenten, die Apps zur Notfallreaktion erstellen, müssen vertrauenswürdig sein. Macaron enthält ein Katastrophenresilienz-Modul, das sich in staatliche Alarmsysteme integriert und sicherstellt, dass Notfallanweisungen aktuell sind. Ethisch vermeidet das System manipulative Designs wie „Dark Patterns“ in Finanzwerkzeugen und hält sich an Fairness-Richtlinien. Wenn zum Beispiel Restaurants empfohlen werden, berücksichtigt der Agent diätetische Einschränkungen und vermeidet eine Voreingenommenheit gegenüber bestimmten Regionen oder Ketten, es sei denn, der Nutzer äußert eine Präferenz.
Zwei Fallstudien heben die Kraft und Nuance der Code-Synthese von Macaron hervor. Hanami Planner ist eine saisonale App, die von japanischen Familien angefordert wurde, die die Kirschblüte erleben möchten. Der Nutzer fragt: „桜の見頃と混雑を避けるプランを作って“ (Erstelle einen Plan, um die Kirschblüte in voller Blüte zu sehen und Menschenmassen zu vermeiden). Macaron ruft Wetter- und Blütenvorhersagen von japanischen meteorologischen APIs ab, vergleicht historische Daten und sagt die Blühtermine für nahegelegene Parks voraus. Anschließend synthetisiert es eine App mit mehreren Modulen: einen Kalenderplaner zum Blockieren von Terminen; einen Routenplaner, der Verkehr und öffentliche Verkehrsmittel berücksichtigt; einen Budget-Tracker für Picknickbedarf (einschließlich Kakeibo-Kategorien); und einen kulturellen Knigge, der die Benutzer an die Müllentsorgung und Parkregeln erinnert. Durch verstärkendes Lernen werden die Vorschläge personalisiert: Wenn die Familie ältere Mitglieder hat, priorisiert der Agent Parks mit barrierefreien Wegen; wenn sie Kinder haben, empfiehlt er familienfreundliche Attraktionen. Die App generiert auch zweisprachige Einladungen, damit Freunde, die nur Koreanisch oder Englisch sprechen, teilnehmen können, und demonstriert Macarons sprachübergreifende Fähigkeiten.
Der K‑pop Fan Manager Fall richtet sich an koreanische Nutzer, die mehreren Musikgruppen folgen. Ein Nutzer könnte sagen: „다음 커백 스케줄과 팬미팅 일정 관리 앱을 만들어줘“ (Erstelle eine App, um kommende Comeback-Pläne und Fanmeeting-Termine zu verwalten). Der Agent zieht Veröffentlichungstermine aus den APIs von Unterhaltungsunternehmen, berechnet Streaming-Ziele basierend auf Chart-Algorithmen und zeigt Countdown-Widgets an. Module umfassen einen Ticket-Kauf-Assistenten (Überprüfung lokaler Gesetze für den Weiterverkauf), ein digitales Sammelalbum zum Sammeln von Fotokarten und ein soziales Modul zur Koordination von Fanprojekten. Um den Nutzer nicht mit Benachrichtigungen zu überladen, balanciert das RL-Belohnungsmodell Dringlichkeit (z.B. Fristen für Fanmeeting-Tickets) mit kognitiver Belastung. Cross-linguale Funktionen kommen zum Einsatz, wenn Fans mit japanischen Freunden koordinieren: Die App übersetzt automatisch Zeitpläne und Nachrichten ins Japanische und Englische, und Memory-Tags sorgen dafür, dass der Kontext sprachübergreifend erhalten bleibt. Diese Fallstudien zeigen Macarons Fähigkeit, lokale Kultur, regulatorisches Bewusstsein und technische Raffinesse in maßgeschneiderte Werkzeuge zu integrieren.
Das Generieren großer Programme im Handumdrehen bringt technische Herausforderungen mit sich. Gleichzeitigkeit entsteht, wenn Mini-Apps mehrere Aufgaben gleichzeitig ausführen müssen, wie z. B. Daten abrufen und gleichzeitig die Benutzeroberfläche aktualisieren. Macarons Code-Generator erstellt gerichtete azyklische Graphen (DAGs), die Abhängigkeitsbeziehungen definieren, und verwendet asynchrone Programmierkonstrukte (z. B. JavaScript-Promises oder Python asyncio), um blockierende Operationen zu vermeiden. Versionierung wird entscheidend, weil sich die Modullibrary von Macaron ständig weiterentwickelt. Generierte Apps enthalten Manifestdateien, die Modulversionen aufzeichnen; wenn ein Update verfügbar ist, vergleicht Macaron die Versionen und fordert die Nutzer auf, ein Upgrade durchzuführen oder bei einer bekannten stabilen Version zu bleiben. Debugging ist vielleicht die größte Herausforderung: Automatisch generierter Code kann subtile Fehler oder Randfälle enthalten. Macaron begegnet dem mit eigenschaftsbasierter Tests—zufällige Eingaben generierend, um Programmeigenschaften zu testen—und symbolischer Ausführung, um Ausführungspfade zu erkunden. Wenn in der Praxis Bugs auftreten, sammelt der Agent anonymisierte Fehlerspuren und wendet Programmkorrekturtechniken an, um die Korrekturen in zukünftige Synthesen zu integrieren. Diese technischen Praktiken gewährleisten, dass das Versprechen der No-Code-Programmierung in zuverlässige, wartbare Mini-Apps umgesetzt wird.