Autor: Boxu Li 

Introdução

Uma das características mais impressionantes do Macaron AI é sua capacidade de gerar miniaplicativos personalizados instantaneamente. Durante uma conversa comum, o usuário pode descrever uma necessidade—como controlar um orçamento familiar, planejar um itinerário de festival ou aprender um novo idioma—e o Macaron montará uma ferramenta completa em minutos. Alguns desses miniaplicativos ultrapassam 100.000 linhas de código, mas são gerados sem intervenção humana. Para usuários japoneses e coreanos, isso significa receber ferramentas personalizadas ajustadas aos costumes e regulamentações locais. Este blog analisa o pipeline de síntese de código autônomo que alimenta os miniaplicativos do Macaron, abordando compreensão de intenções, síntese de programas, execução em sandbox, tratamento de erros e medidas de segurança. Examinamos como o sistema gerencia a complexidade, integra-se com APIs externas, respeita leis regionais e utiliza aprendizado por reforço para aprimorar seus resultados.

1 De Linguagem Natural a Especificação de Programa

1.1 Análise de intenção e extração de slots

Quando um usuário solicita um aplicativo, o Macaron primeiro analisa a entrada de linguagem natural para construir uma especificação de intenção estruturada. Isso envolve identificar slots como o domínio (finanças, educação, culinária), recursos desejados (categorias de orçamento, alertas), restrições (moeda, idioma) e cronograma. Para os idiomas japonês e coreano, o analisador lida com honoríficos e reticências. Por exemplo, um pedido em japonês como "家計簿を作りたいんだけど、食費を細かく分けて" (Quero criar um livro-caixa doméstico com despesas alimentares detalhadas) resulta no domínio "orçamento," o recurso "categorias alimentares detalhadas," e a restrição "iene japonês." Um pedido em coreano "가족 여행 일정을 계획해줘, 한식 식당 추천도" (Planeje um cronograma de viagem em família e recomende restaurantes coreanos) resulta no domínio "planejamento de viagens," o recurso "recomendações de restaurantes," e uma restrição cultural.

O Macaron usa uma arquitetura de codificador duplo: um codificador processa a conversa atual e outro processa a memória do usuário. Os dois vetores são combinados via atenção para produzir uma representação unificada da intenção. O aprendizado por reforço ajusta o analisador para extrair os slots corretos. O feedback vem de saber se o miniaplicativo resultante atende às expectativas do usuário; caso contrário, os parâmetros do analisador são atualizados.

1.2 Síntese de programas com bibliotecas de domínio e modelos

Assim que a intenção é estruturada, o motor de síntese do Macaron gera código compondo funções de uma biblioteca de módulos específicos de domínio. Os módulos incluem funções de orçamento (cálculo de despesas, geração de gráficos), funções de agendamento (integração de calendário, resolução de conflitos), algoritmos de aprendizado de línguas (repetição espaçada) e assistência culinária (conversão de ingredientes, análise nutricional). O motor seleciona módulos, os configura e os costura em um programa coerente. Os modelos contêm estruturas de grafo (DAGs) que definem o fluxo de dados entre módulos, permitindo operações simultâneas e assíncronas. Por exemplo, um aplicativo de orçamento japonês pode executar tarefas de sumarização mensal e alertas semanais em paralelo.

O motor de síntese usa modelos de síntese de programas neurais treinados em código de código aberto e exemplos proprietários. Ele também utiliza raciocínio simbólico: restrições como "Não exceder o orçamento total" são representadas como desigualdades lineares e alimentadas em um solucionador de restrições. Esta abordagem híbrida melhora a confiabilidade em comparação com a geração neural pura. O aprendizado por reforço monitora a satisfação do usuário e as taxas de erro para ajustar a seleção e a ordenação dos módulos.

1.3 Requisitos localizados e restrições regulatórias

Regulamentos japoneses e coreanos impõem requisitos específicos no manuseio de dados financeiros e pessoais. Por exemplo, a lei de privacidade do Japão exige que dados de contabilidade doméstica não sejam transmitidos a terceiros sem consentimento. A Lei de Proteção de Informações Pessoais da Coreia possui requisitos rigorosos sobre a anonimização de dados. Ao gerar uma ferramenta de orçamento, Macaron consulta suas regras de vinculação de políticas para garantir que dados sensíveis sejam armazenados localmente e nunca enviados para servidores externos. O gerador de código insere chamadas para bibliotecas de criptografia e desativa o acesso à rede por padrão. Para aplicativos de saúde, Macaron verifica com a Lei do Quadro de IA para assegurar que decisões envolvendo orientação médica sejam acompanhadas por supervisão humana.

2 Ambiente de Execução Seguro

2.1 Sandboxing e limites de recursos

Executar código arbitrário gerado sob demanda apresenta riscos significativos de segurança. O Macaron, portanto, executa mini-apps dentro de um ambiente sandbox que lembra os interpretadores de código modernos. A sandbox restringe o acesso ao sistema de arquivos a um diretório virtual, limita o uso de CPU e memória, e bloqueia conexões de rede, a menos que sejam explicitamente permitidas. Os programas são executados dentro de contêineres com imagens base somente leitura. Quando um aplicativo de culinária coreana solicita buscar dados nutricionais, a solicitação é roteada por meio de um proxy que verifica os domínios permitidos. Se o programa tentar acessar um site externo sem permissão, a sandbox encerra a operação e retorna uma mensagem de erro ao usuário.

2.2 Análise estática e verificação de tipos

Antes da execução, o Macaron realiza uma análise estática no código sintetizado para detectar vulnerabilidades como loops infinitos, ataques de injeção e chamadas de sistema não autorizadas. Um verificador de tipos garante que os módulos sejam compostos corretamente: uma função que retorna um número não pode ser conectada a um módulo de processamento de texto. O verificador também verifica a conformidade com os tipos de dados locais; por exemplo, valores monetários são representados usando tipos decimais para evitar erros de ponto flutuante. Se a análise estática falhar, o Macaron oferece simplificar os recursos solicitados ou sugere dividir o aplicativo em módulos menores.

2.3 Monitoramento em tempo real e auto-recuperação

Durante a execução, o Macaron monitora métricas de desempenho (uso da CPU, pegada de memória), correção funcional (casos de teste, asserções) e interações do usuário (cliques, tempo gasto). Se o programa se desviar do comportamento esperado — como exceder limites de tempo ou lançar exceções — o módulo de auto‑correção do Macaron intervém. Ele pode reverter para o último estado estável, aplicar um patch gerado em tempo real ou degradar a funcionalidade de forma graciosa. Por exemplo, se a API de clima de um aplicativo de jardinagem japonês falhar, o programa pode alternar para uma fonte de dados de backup ou informar o usuário sobre a interrupção temporária.

3 Aprendizado por Reforço e Melhoria Contínua

3.1 Sinais de recompensa a partir do feedback do usuário e sucesso da tarefa

Cada sessão de mini-app fornece uma riqueza de feedback. Os usuários sinalizam implicitamente a satisfação ao continuar usando o app ou avaliam explicitamente a experiência. O Macaron agrega esses sinais em uma função de recompensa que guia a geração de código futuro. A recompensa penaliza bugs, interfaces confusas e desempenho lento, enquanto recompensa confiabilidade, adequação cultural e novidade. Com o tempo, o motor de síntese aprende que os usuários japoneses valorizam o minimalismo e a facilidade de uso, enquanto usuários coreanos podem apreciar opções de personalização e visuais vibrantes. Essas preferências são codificadas na política de RL que seleciona módulos e padrões de interface do usuário.

3.2 Aprendizado de currículo e meta-aprendizado

Para lidar com a complexidade crescente das solicitações dos usuários, o Macaron emprega aprendizado de currículo: o motor de síntese começa gerando programas simples (por exemplo, calculadoras, listas de tarefas) e gradualmente enfrenta tarefas mais complexas (por exemplo, plataformas de orçamento para múltiplos usuários). À medida que o sistema encontra novos domínios, ele usa meta-aprendizado para acelerar a adaptação. Quando o motor vê solicitações semelhantes de usuários japoneses e coreanos—por exemplo, planejando eventos escolares ou gerenciando cuidados de idosos—ele pode generalizar entre tarefas. O meta-aprendizado também ajuda o agente a se adaptar a mudanças na lei ou cultura; se a Lei de Promoção de IA introduzir novos requisitos de conformidade, o Macaron rapidamente os integra em seus modelos de código.

3.3 Contribuições da comunidade e mercado de módulos

O Macaron incentiva a participação da comunidade. Os desenvolvedores podem contribuir com novos módulos para um mercado. Os módulos são avaliados quanto à segurança e conformidade antes da inclusão. Isso fomenta um ecossistema local: desenvolvedores japoneses podem criar módulos para agendamento de cerimônias de chá ou recomendação de anime, enquanto desenvolvedores coreanos podem contribuir com módulos para aprender coreografias de K-pop ou gerenciar cerimônias familiares. Os colaboradores são recompensados com Amêndoas (a moeda do aplicativo do Macaron), incentivando a melhoria contínua da plataforma.

4 Integração com APIs e Serviços Externos

4.1 Localização de fontes de dados

Usuários japoneses e coreanos dependem de diferentes provedores de dados. O Macaron integra-se com APIs bancárias japonesas (por exemplo, via J‑Debit) para aplicativos financeiros, calendários japoneses para feriados públicos (Golden Week, Obon) e fontes de notícias locais para planejamento de eventos. Na Coreia, o agente conecta-se a APIs de ações KOSPI, ao serviço meteorológico da Naver e à API de mensagens da KakaoTalk. Cada integração é envolvida em um módulo que aplica limitação de taxa, cache e tratamento de erros. O gerador de código insere automaticamente esses módulos quando relevante.

4.2 Interface de linguagem natural para configuração de API

Em vez de exigir que os usuários insiram manualmente as chaves de API, o Macaron os guia através de uma conversa. Se um usuário japonês quiser importar transações de seu banco, o agente explica o processo de consentimento, obtém os tokens necessários e os armazena com segurança. Da mesma forma, um usuário coreano pode pedir ao Macaron para conectar-se ao cronograma escolar de um filho; o agente usa OAuth para autorizar o acesso e garante que o aplicativo leia apenas os dados necessários. Essas interações são registradas e podem ser revisadas, alinhando-se ao princípio de transparência diferenciada.

4.3 Computação de borda e suporte offline

Em muitas partes do Japão e da Coreia, os usuários esperam confiabilidade mesmo com conectividade intermitente. Os miniapps do Macaron suportam computação de borda, executando cálculos localmente sempre que possível. O agente pode gerar aplicativos web progressivos (PWAs) que armazenam dados em cache e sincronizam com servidores quando a rede fica disponível. Por exemplo, um caminhante coreano usando um planejador de trilhas de montanha pode continuar rastreando rotas offline e sincronizar com a nuvem após descer. A capacidade offline é particularmente importante para a privacidade; dados sensíveis permanecem no dispositivo até que o usuário opte por compartilhá-los.

5 Segurança, Conformidade e Sensibilidade Cultural

5.1 Alinhamento regulatório na geração de código

Os miniapps devem respeitar as regulamentações locais. A Lei de Promoção de IA do Japão enfatiza a transparência; portanto, os aplicativos de orçamento incluem registros claros de fluxos de dados e fornecem aos usuários uma explicação de como as despesas são categorizadas. As regulamentações de IA da Coreia exigem supervisão humana para decisões de alto impacto; assim, aplicativos relacionados à saúde solicitam que os usuários consultem profissionais antes de agir com base em conselhos. O gerador de código do Macaron insere avisos e obtém consentimento explícito para operações sensíveis. Se um usuário tentar gerar um aplicativo de declaração de impostos, o Macaron os lembra das atualizações das leis fiscais locais e sugere consultar um contador certificado.

5.2 Normas culturais e localização da UI

A estética cultural influencia o design da interface do usuário. No Japão, o minimalismo e o respeito pelo espaço em branco são valorizados; portanto, a Macaron usa cores sutis e ícones simples para os usuários japoneses. As interfaces coreanas podem ser mais vibrantes e incluir animações. Os módulos de UI da Macaron adaptam esses estilos automaticamente com base nas preferências do usuário determinadas durante a integração. O agente também adapta as mensagens de ajuda às normas culturais: telas de ajuda japonesas podem incluir explicações contextuais, enquanto as coreanas podem enfatizar instruções passo a passo.

5.3 Resiliência a desastres e considerações éticas

O Japão e a Coreia são propensos a desastres naturais como terremotos e tufões. Agentes pessoais que geram aplicativos de resposta a emergências devem ser confiáveis. A Macaron inclui um módulo de resiliência a desastres que se integra com sistemas de alerta governamentais e garante que as instruções de emergência estejam atualizadas. Eticamente, o sistema evita designs manipulativos, como "padrões escuros" em ferramentas financeiras, e adere a diretrizes de equidade. Ao recomendar restaurantes, por exemplo, o agente considera restrições alimentares e evita preferências por certas regiões ou redes, a menos que o usuário expresse uma preferência.

5.4 Estudos de caso: Planejador Hanami e gerenciador de fãs de K‑pop

Dois estudos de caso destacam o poder e a nuance da síntese de código do Macaron. Hanami Planner é um aplicativo sazonal solicitado por famílias japonesas que desejam vivenciar a observação das flores de cerejeira. O usuário pede: 「桜の見頃と混雑を避けるプランを作って」 (Crie um plano para ver as cerejeiras no auge da floração enquanto evita multidões). O Macaron recupera previsões de tempo e floração de APIs meteorológicas japonesas, cruza dados históricos e prevê datas de floração máxima para parques próximos. Em seguida, sintetiza um aplicativo de múltiplos módulos: um agendador de calendário para bloquear datas; um planejador de rotas que leva em conta o tráfego e o transporte público; um rastreador de orçamento para suprimentos de piquenique (incorporando categorias do kakeibo); e um guia de etiqueta cultural que lembra aos usuários sobre o descarte de lixo e regras do parque. O aprendizado por reforço personaliza as sugestões: se a família tem membros idosos, o agente prioriza parques com caminhos acessíveis; se têm crianças, recomenda atrações familiares. O aplicativo também gera convites bilíngues para que amigos que falam apenas coreano ou inglês possam participar, mostrando as capacidades multilíngues do Macaron.

O caso do Gerenciador de Fãs de K-pop visa usuários coreanos que seguem vários grupos musicais. Um usuário pode dizer: "다음 커백 스케줄과 팬미팅 일정 관리 앱을 만들어줘" (Crie um aplicativo para gerenciar horários de comeback e encontros de fãs). O agente obtém cronogramas de lançamento de APIs de empresas de entretenimento, calcula metas de streaming com base em algoritmos de charts e exibe widgets de contagem regressiva. Os módulos incluem um assistente de compra de ingressos (verificando leis locais para revenda), um álbum digital para colecionar fotocards e um módulo social para coordenar projetos de fãs. Para evitar sobrecarregar o usuário com notificações, o modelo de recompensa RL equilibra urgência (por exemplo, prazos de ingressos para encontros de fãs) com carga cognitiva. Recursos multilíngues são utilizados quando fãs coordenam com amigos japoneses: o aplicativo traduz automaticamente cronogramas e mensagens para japonês e inglês, e tags de memória garantem que o contexto seja preservado entre as línguas. Esses estudos de caso demonstram a capacidade do Macaron de integrar cultura local, consciência regulatória e sofisticação técnica em ferramentas personalizadas.

5.5 Desafios técnicos: concorrência, versionamento e depuração

Gerar programas grandes rapidamente introduz desafios de engenharia. Concorrência surge quando mini-apps precisam realizar várias tarefas simultaneamente, como buscar dados enquanto atualizam a interface do usuário. O gerador de código do Macaron constrói grafos acíclicos direcionados (DAGs) que definem relações de dependência e utiliza construções de programação assíncrona (por exemplo, promessas em JavaScript ou asyncio em Python) para evitar operações que bloqueiam o sistema. Versionamento torna-se crítico porque a biblioteca de módulos do Macaron evolui constantemente. Os aplicativos gerados incluem arquivos manifestos que registram versões de módulos; quando uma atualização está disponível, o Macaron compara versões e sugere aos usuários que atualizem ou permaneçam em uma versão estável conhecida. Depuração é talvez o mais desafiador: o código gerado automaticamente pode conter bugs sutis ou casos extremos. O Macaron aborda isso com testes baseados em propriedades — gerando entradas aleatórias para testar invariantes do programa — e execução simbólica para explorar caminhos de execução. Quando bugs surgem no ambiente real, o agente coleta rastros de erro anonimizados e aplica técnicas de reparo de programas, incorporando as correções em sínteses futuras. Essas práticas de engenharia garantem que a promessa de programação sem código se traduza em mini-apps confiáveis e sustentáveis.

Boxu obteve seu diploma de bacharel na Universidade de Emory, com especialização em Economia Quantitativa. Antes de se juntar à Macaron, Boxu passou a maior parte de sua carreira no espaço de Private Equity e Venture Capital nos EUA. Ele agora é o Chefe de Gabinete e VP de Marketing na Macaron AI, gerenciando finanças, logística e operações, além de supervisionar o marketing.

Candidatar-se para se tornar Os primeiros amigos de Macaron