Autor: Boxu Li 

Introducción

Una de las características más sorprendentes de Macaron AI es su capacidad para generar miniaplicaciones personalizadas al instante. Durante una conversación ordinaria, un usuario puede describir una necesidad—rastrear un presupuesto familiar, planificar un itinerario de festival, aprender un nuevo idioma—y Macaron ensamblará una herramienta completa en minutos. Algunas de estas miniaplicaciones superan las 100,000 líneas de código, y se generan sin intervención humana. Para los usuarios japoneses y coreanos, esto significa recibir herramientas personalizadas adaptadas a las costumbres y regulaciones locales. Este blog analiza la tubería de síntesis de código autónoma que impulsa las miniaplicaciones de Macaron, cubriendo comprensión de intenciones, síntesis de programas, ejecución en sandbox, manejo de errores y medidas de seguridad. Examinamos cómo el sistema gestiona la complejidad, se integra con APIs externas, respeta las leyes regionales y utiliza el aprendizaje por refuerzo para perfeccionar sus resultados.

1 De lenguaje natural a especificación de programas

1.1 Análisis de intenciones y extracción de ranuras

Cuando un usuario solicita una aplicación, Macaron primero analiza la entrada de lenguaje natural para construir una especificación de intención estructurada. Esto implica identificar ranuras como el dominio (finanzas, educación, cocina), características deseadas (categorías de presupuesto, alertas), restricciones (moneda, idioma) y cronograma. Para los idiomas japonés y coreano, el analizador maneja honoríficos y elipsis. Por ejemplo, una solicitud japonesa como "家計簿を作りたいんだけど、食費を細かく分けて" (Quiero crear un libro de contabilidad del hogar con gastos detallados de alimentos) produce el dominio "presupuesto," la característica "categorías detalladas de alimentos," y la restricción "yen japonés." Una solicitud coreana "가족 여행 일정을 계획해줘, 한식 식당 추천도" (Planifica un horario de viaje familiar y recomienda restaurantes coreanos) produce el dominio "planificación de viajes," la característica "recomendaciones de restaurantes," y una restricción cultural.

Macaron utiliza una arquitectura de codificador dual: un codificador procesa la conversación actual y otro procesa la memoria del usuario. Los dos vectores se combinan mediante atención para producir una representación unificada de la intención. El aprendizaje por refuerzo ajusta el analizador para extraer las ranuras correctas. La retroalimentación proviene de si la miniaplicación resultante cumple con las expectativas del usuario; si no, se actualizan los parámetros del analizador.

1.2 Síntesis de programas con bibliotecas de dominio y plantillas

Una vez que la intención está estructurada, el motor de síntesis de Macaron genera código componiendo funciones de una biblioteca de módulos específicos de dominio. Los módulos incluyen funciones de presupuesto (calcular gastos, generar gráficos), funciones de programación (integración de calendarios, resolución de conflictos), algoritmos de aprendizaje de idiomas (repetición espaciada), y asistencia culinaria (conversión de ingredientes, análisis nutricional). El motor selecciona módulos, los configura y los une en un programa coherente. Las plantillas contienen estructuras gráficas (DAGs) que definen el flujo de datos entre módulos, permitiendo operaciones concurrentes y asíncronas. Por ejemplo, una app de presupuesto en japonés podría ejecutar tareas de resumen mensual y alertas semanales en paralelo.

El motor de síntesis utiliza modelos de síntesis de programas neuronales entrenados con código de fuente abierta y ejemplos propietarios. También aprovecha el razonamiento simbólico: las restricciones como "No gastar más del presupuesto total" se representan como desigualdades lineales y se introducen en un solucionador de restricciones. Este enfoque híbrido mejora la fiabilidad en comparación con la generación puramente neuronal. El aprendizaje por refuerzo supervisa la satisfacción del usuario y las tasas de error para ajustar la selección y el orden de los módulos.

1.3 Requisitos localizados y restricciones regulatorias

Las regulaciones japonesas y coreanas imponen requisitos específicos para el manejo de datos financieros y personales. Por ejemplo, la ley de privacidad de Japón exige que los datos contables del hogar no se transmitan a terceros sin consentimiento. La Ley de Protección de Información Personal de Corea tiene estrictos requisitos sobre la anonimización de datos. Al generar una herramienta de presupuesto, Macaron consulta sus reglas de vinculación de políticas para asegurar que los datos sensibles se almacenen localmente y nunca se envíen a servidores externos. El generador de código inserta llamadas a bibliotecas de cifrado y deshabilita el acceso a la red por defecto. Para las aplicaciones de salud, Macaron verifica con la Ley de Marco de IA para asegurarse de que las decisiones que implican orientación médica estén acompañadas de supervisión humana.

2 Entorno de Ejecución Seguro

2.1 Sandbox y límites de recursos

La ejecución de código arbitrario generado bajo demanda conlleva riesgos significativos de seguridad. Por lo tanto, Macaron ejecuta miniaplicaciones dentro de un entorno aislado que recuerda a los intérpretes de código modernos. El entorno aislado restringe el acceso al sistema de archivos a un directorio virtual, limita el uso de CPU y memoria, y bloquea las conexiones de red a menos que se permita explícitamente. Los programas se ejecutan dentro de contenedores con imágenes base de solo lectura. Cuando una aplicación de cocina coreana solicita obtener datos nutricionales, la solicitud se enruta a través de un proxy que verifica los dominios permitidos. Si el programa intenta acceder a un sitio externo sin permiso, el entorno aislado termina la operación y devuelve un mensaje de error al usuario.

2.2 Análisis estático y verificación de tipos

Antes de la ejecución, Macaron realiza un análisis estático del código sintetizado para detectar vulnerabilidades como bucles infinitos, ataques de inyección y llamadas no autorizadas al sistema. Un verificador de tipos asegura que los módulos estén compuestos correctamente: una función que devuelve un número no puede conectarse a un módulo de procesamiento de texto. El verificador también verifica el cumplimiento con los tipos de datos locales; por ejemplo, los valores de moneda se representan utilizando tipos decimales para evitar errores de coma flotante. Si el análisis estático falla, Macaron ofrece simplificar las características solicitadas o sugiere dividir la aplicación en módulos más pequeños.

2.3 Monitoreo en tiempo de ejecución y auto-recuperación

Durante la ejecución, Macaron supervisa métricas de rendimiento (uso de CPU, huella de memoria), corrección funcional (casos de prueba, afirmaciones) e interacciones del usuario (clics, tiempo de uso). Si el programa se desvía del comportamiento esperado, como exceder los límites de tiempo o lanzar excepciones, el módulo de auto‑reparación de Macaron interviene. Puede retroceder al último estado estable, aplicar un parche generado al instante o degradar funcionalidad de manera controlada. Por ejemplo, si falla la API del clima en una aplicación de jardinería japonesa, el programa puede cambiar a una fuente de datos de respaldo o informar al usuario sobre la interrupción temporal.

3 Aprendizaje por Refuerzo y Mejora Continua

3.1 Señales de recompensa a partir de comentarios de los usuarios y éxito en las tareas

Cada sesión de mini‑app proporciona una gran cantidad de comentarios. Los usuarios indican implícitamente su satisfacción al seguir usando la aplicación o califican explícitamente la experiencia. Macaron agrega estas señales en una función de recompensa que guía la generación futura de código. La recompensa penaliza errores, interfaces confusas y bajo rendimiento, mientras premia la fiabilidad, la adecuación cultural y la novedad. Con el tiempo, el motor de síntesis aprende que los usuarios japoneses valoran el minimalismo y la facilidad de uso, mientras que los usuarios coreanos pueden apreciar opciones de personalización y gráficos vibrantes. Estas preferencias se codifican en la política de RL que selecciona módulos y patrones de interfaz de usuario.

3.2 Aprendizaje curricular y meta‑aprendizaje

Para manejar la creciente complejidad de las solicitudes de los usuarios, Macaron emplea aprendizaje por currículo: el motor de síntesis comienza generando programas simples (por ejemplo, calculadoras, listas de tareas) y gradualmente aborda tareas más complejas (por ejemplo, plataformas de presupuesto para múltiples usuarios). A medida que el sistema encuentra nuevos dominios, utiliza metaaprendizaje para acelerar la adaptación. Cuando el motor recibe solicitudes similares de usuarios japoneses y coreanos, como planificar eventos escolares o gestionar el cuidado de ancianos, puede generalizar las tareas. El metaaprendizaje también ayuda al agente a adaptarse a cambios en la ley o la cultura; si la Ley de Promoción de IA introduce nuevos requisitos de cumplimiento, Macaron los integra rápidamente en sus plantillas de código.

3.3 Contribuciones de la comunidad y mercado de módulos

Macaron fomenta la participación de la comunidad. Los desarrolladores pueden contribuir con nuevos módulos a un mercado. Los módulos son evaluados en cuanto a seguridad y cumplimiento antes de su inclusión. Esto fomenta un ecosistema local: los desarrolladores japoneses podrían crear módulos para la programación de ceremonias de té o recomendaciones de anime, mientras que los desarrolladores coreanos podrían contribuir con módulos para aprender coreografías de K-pop o gestionar ceremonias familiares. Los contribuyentes son recompensados con Almonds (la moneda dentro de la aplicación de Macaron), incentivando la mejora continua de la plataforma.

4 Integración con APIs y Servicios Externos

4.1 Localización de fuentes de datos

Los usuarios japoneses y coreanos dependen de diferentes proveedores de datos. Macaron se integra con APIs bancarias japonesas (por ejemplo, a través de J‑Debit) para aplicaciones financieras, calendarios japoneses para días festivos (Semana Dorada, Obon) y fuentes de noticias locales para la planificación de eventos. En Corea, el agente se conecta a APIs de acciones de KOSPI, al servicio meteorológico de Naver y a la API de mensajería de KakaoTalk. Cada integración se encapsula en un módulo que aplica limitación de tasa, almacenamiento en caché y manejo de errores. El generador de código inserta automáticamente estos módulos cuando es relevante.

4.2 Interfaz de lenguaje natural para la configuración de API

En lugar de requerir que los usuarios ingresen las claves de API manualmente, Macaron los guía a través de una conversación. Si un usuario japonés quiere importar transacciones de su banco, el agente explica el proceso de consentimiento, obtiene los tokens necesarios y los almacena de forma segura. De manera similar, un usuario coreano podría pedir a Macaron que se conecte al horario escolar de su hijo; el agente utiliza OAuth para autorizar el acceso y asegura que la aplicación solo lea los datos necesarios. Estas interacciones se registran y pueden ser revisadas, alineándose con el principio de transparencia diferenciada.

4.3 Computación en el borde y soporte sin conexión

En muchas partes de Japón y Corea, los usuarios esperan fiabilidad incluso con conectividad intermitente. Las miniaplicaciones de Macaron admiten edge computing, ejecutando cálculos localmente cuando es posible. El agente puede generar aplicaciones web progresivas (PWAs) que almacenan datos en caché y se sincronizan con los servidores cuando la red está disponible. Por ejemplo, un excursionista coreano que utiliza un planificador de rutas de montaña puede seguir rastreando rutas sin conexión y sincronizarse con la nube después de descender. La capacidad sin conexión es especialmente importante para la privacidad; los datos sensibles permanecen en el dispositivo hasta que el usuario decide compartirlos.

5 Seguridad, Cumplimiento y Sensibilidad Cultural

5.1 Alineación regulatoria en la generación de código

Las miniaplicaciones deben respetar las regulaciones locales. La Ley de Promoción de la IA de Japón enfatiza la transparencia; por lo tanto, las aplicaciones de presupuestos incluyen registros claros de los flujos de datos y proporcionan a los usuarios una explicación de cómo se categorizan los gastos. Las regulaciones de IA en Corea requieren supervisión humana para decisiones de alto impacto; por lo tanto, las aplicaciones relacionadas con la salud solicitan a los usuarios consultar a profesionales antes de actuar según el consejo. El generador de código de Macaron inserta advertencias y obtiene consentimiento explícito para operaciones sensibles. Si un usuario intenta generar una aplicación de declaración de impuestos, Macaron les recuerda las actualizaciones de la ley fiscal local y sugiere consultar a un contador certificado.

5.2 Normas culturales y localización de la UI

La estética cultural influye en el diseño de interfaces de usuario. En Japón, se valora el minimalismo y el respeto por el espacio en blanco; por lo tanto, Macaron utiliza colores sutiles e iconos simples para los usuarios japoneses. Las interfaces coreanas pueden ser más vibrantes e incluir animaciones. Los módulos de la IU de Macaron adaptan estos estilos automáticamente según las preferencias del usuario determinadas durante el proceso de incorporación. El agente también adapta los mensajes de ayuda a las normas culturales: las pantallas de ayuda japonesas pueden incluir explicaciones contextuales, mientras que las coreanas podrían enfatizar instrucciones paso a paso.

5.3 Resiliencia ante desastres y consideraciones éticas

Japón y Corea son propensos a desastres naturales como terremotos y tifones. Los agentes personales que generan aplicaciones de respuesta a emergencias deben ser confiables. Macaron incluye un módulo de resiliencia ante desastres que se integra con los sistemas de alerta gubernamentales y asegura que las instrucciones de emergencia estén actualizadas. Éticamente, el sistema evita diseños manipulativos como los "patrones oscuros" en herramientas financieras y se adhiere a las pautas de equidad. Al recomendar restaurantes, por ejemplo, el agente considera las restricciones dietéticas y evita el sesgo hacia ciertas regiones o cadenas a menos que el usuario exprese una preferencia.

5.4 Estudios de caso: Planificador de Hanami y gestor de fans de K‑pop

Dos estudios de caso destacan el poder y la sutileza de la síntesis de código de Macaron. Hanami Planner es una aplicación estacional solicitada por familias japonesas que desean experimentar el avistamiento de cerezos en flor. El usuario pregunta: 「桜の見頃と混雑を避けるプランを作って」 (Crear un plan para ver los cerezos en plena floración mientras se evitan las multitudes). Macaron recupera pronósticos de clima y floración de APIs meteorológicas japonesas, cruza referencias con datos históricos y predice las fechas de floración máxima para parques cercanos. Luego, sintetiza una aplicación de múltiples módulos: un calendario planificador para bloquear fechas; un planificador de rutas que considera el tráfico y el transporte público; un rastreador de presupuesto para suministros de picnic (incorporando categorías de kakeibo); y una guía de etiqueta cultural que recuerda a los usuarios sobre la disposición de basura y las normas del parque. El aprendizaje por refuerzo personaliza las sugerencias: si la familia tiene miembros mayores, el agente prioriza parques con caminos accesibles; si tienen niños, recomienda atracciones adecuadas para familias. La aplicación también genera invitaciones bilingües para que amigos que solo hablan coreano o inglés puedan unirse, mostrando las capacidades multilingües de Macaron.

El caso del Gestor de Fans de K-pop se dirige a usuarios coreanos que siguen múltiples grupos musicales. Un usuario podría decir: "다음 커백 스케줄과 팬미팅 일정 관리 앱을 만들어줘" (Haz una app para gestionar los horarios de los próximos regresos y las reuniones de fans). El agente extrae los horarios de lanzamiento de las API de las compañías de entretenimiento, calcula las metas de streaming basadas en algoritmos de gráficos y muestra widgets de cuenta regresiva. Los módulos incluyen un asistente de compra de entradas (verificando las leyes locales para la reventa), un álbum digital para coleccionar tarjetas de fotos, y un módulo social para coordinar proyectos de fans. Para evitar sobrecargar al usuario con notificaciones, el modelo de recompensa RL equilibra la urgencia (por ejemplo, las fechas límite para las entradas de reuniones de fans) con la carga cognitiva. Las funciones interlingüísticas entran en juego cuando los fans se coordinan con amigos japoneses: la app traduce automáticamente los horarios y mensajes al japonés e inglés, y las etiquetas de memoria aseguran que el contexto se mantenga a través de los idiomas. Estos estudios de caso demuestran la capacidad de Macaron para entrelazar la cultura local, la conciencia regulatoria y la sofisticación técnica en herramientas personalizadas.

5.5 Desafíos técnicos: concurrencia, versionado y depuración

Generar programas grandes sobre la marcha introduce desafíos de ingeniería. La concurrencia surge cuando las miniaplicaciones necesitan realizar múltiples tareas simultáneamente, como obtener datos mientras actualizan la interfaz de usuario. El generador de código de Macaron construye gráficos acíclicos dirigidos (DAGs) que definen relaciones de dependencia y utiliza construcciones de programación asíncrona (por ejemplo, promesas de JavaScript o asyncio de Python) para evitar operaciones bloqueantes. La versionado se vuelve crítico porque la biblioteca de módulos de Macaron evoluciona constantemente. Las aplicaciones generadas incluyen archivos manifiesto que registran las versiones de los módulos; cuando hay una actualización disponible, Macaron compara las versiones y solicita a los usuarios que actualicen o se mantengan en una versión estable conocida. La depuración es quizás lo más desafiante: el código generado automáticamente puede contener errores sutiles o casos límite. Macaron aborda esto con pruebas basadas en propiedades, generando entradas aleatorias para probar invariantes del programa, y ejecución simbólica para explorar rutas de ejecución. Cuando surgen errores en el campo, el agente recopila trazas de error anonimizadas y aplica técnicas de reparación de programas, incorporando las correcciones en futuras síntesis. Estas prácticas de ingeniería aseguran que la promesa de la programación sin código se traduzca en miniaplicaciones confiables y mantenibles.

Boxu obtuvo su Licenciatura en la Universidad de Emory, especializándose en Economía Cuantitativa. Antes de unirse a Macaron, Boxu pasó la mayor parte de su carrera en el ámbito del capital privado y el capital de riesgo en los EE.UU. Ahora es Jefe de Personal y VP de Marketing en Macaron AI, gestionando finanzas, logística y operaciones, y supervisando el marketing.

Aplicar para convertirse Los primeros amigos de Macaron