作者: Boxu Li

簡介

Macaron AI 在 2025 年 8 月首次亮相時,它並未將自己定位為另一個企業助理,而是一個旨在豐富日常生活的 個人夥伴。它的使命本質上是國際化的:從一開始,該平台就支持英語、中文、日語、韓語和西班牙語,這表明其在語言和文化邊界上的運作雄心。對於日本和韓國的用戶來說——這兩個擁有活力但截然不同的數位生態系統的國家——這項多語言承諾不僅僅是一個行銷口號。它引發了技術問題:Macaron 如何處理跨語言對話?它的記憶系統如何應對不同的文字、詞彙和文化參考?是什麼設計選擇使這個單一代理能夠在一刻「思考」平假名,而下一刻又能使用韓文字母?這篇博客探討了 Macaron AI 的跨語言架構以及其讓日本和韓國用戶個性化體驗的機制,同時保持一致的身份。

大規模的個性化需求不僅僅是翻譯。Macaron 的目標是透過日常互動來構建您的個人模型,不僅記住事實,還包括飲食目標和情感高點等細微之處。要在多種語言中實現這一點,需要能夠跨書寫系統捕捉意義、處理語碼轉換並尊重文化規範的數據結構和算法。這篇文章分解了基礎技術:多語言分詞強化引導記憶檢索分布式身份管理文化適應。我們還將討論偏見、隱私和跨區域合規等挑戰,並概述跨語言個人助理的研究方向。

1 多語言架構與分詞

1.1 擁有文字腳本感知的通用詞彙

大型語言模型依賴於分詞器將原始文本分解為模型可以處理的單元。對於像英語和西班牙語這樣的語言,子詞分詞(如 Byte‑Pair Encoding 或 SentencePiece)可以合理地捕捉詞形變化。然而,日語和韓語則帶來了獨特的挑戰。日語混合了三種文字(漢字、平假名和片假名)且沒有空格,而韓語的韓字是一種以音節塊組合的表意字母。Macaron 的工程師因此構建了一個多語言詞彙,其中包含識別文字的子詞單元。每個詞元不僅編碼字符,還包含語言標識符,使模型能夠區分同形異義詞(例如,「ha」可能是韓語音素或日語助詞「は」)。該詞彙包括常見漢字詞組、部首和韓文字母的詞元,讓模型可以有效地表示形態單位並將罕見詞彙分解成有意義的部分。

通過在語言間共享子詞單位,Macaron 利用跨語言轉移。例如,「學習」這個概念在日語中表示為「勉強」(benkyō),在韓語中表示為「공부」(gongbu)。儘管字形和發音不同,代理使用跨語言學習的語義嵌入將這些詞元映射到相似的向量空間。這種統一的表示方式使 Macaron 能夠理解日本用戶對「語言學習」的興趣,並在韓國朋友詢問「공부 계획」(學習計劃)時應用這一知識。沒有統一的詞彙,模型會將這些視為不相關的概念。

1.2 不同文字系統的上下文窗口與對齊

Macaron 的 6710 億參數模型是基於大型多語言語料庫進行訓練的,但對話的序列長度要求高效的上下文窗口。由於動詞和嵌入詞的黏著性,日文和韓文句子可能比英文更長。為了支持長對話,Macaron 採用了層次注意力機制:模型在處理局部窗口(句子或段落)後,將摘要表示傳遞到全局層。這種方法減少了記憶體佔用,同時允許代理在長時間對話中保持上下文。它還支持跨文字對齊,模型在訓練期間通過最小化日文和韓文段落表示之間的距離來學習對應關係(這是從跨語言自然語言處理中借用的技術)。

1.3 運行時語言檢測和代碼切換

日本和韓國用戶經常在對話中混合使用英語或中文術語,特別是在技術領域或流行文化中。Macaron 的推理管道包括一個運行時語言檢測器,該檢測器會為每個進來的語句標記支持語言的概率分數。當一個句子包含多種語言的借詞或短語時,代理會將輸入分成片段,並以適當的語言背景處理每個片段。這確保了語音輸出中正確的發音和對成語的適當處理。記憶子系統將語言標籤附加到檢索的條目上,即使查詢語言與存儲語言不同,Macaron 也能檢索到相關經驗。

2 記憶標記和跨語言檢索

2.1 增強指導的檢索和記憶標記

Macaron 的創新標誌是其 記憶標記,這是一個動態指標,幫助代理決定記住什麼、何時更新記憶,以及如何將這些記憶應用於當前任務。該標記與一個層次化的記憶庫交互:短期情境、中期情節記憶和長期知識。強化學習(RL)訓練代理根據用戶滿意度和任務成功等反饋調整標記。例如,如果一位日本用戶反覆詢問同一列車時刻表,RL 策略會學習將這些細節提升到記憶中。如果一位韓國用戶對過去評論的重現感到不適,策略會學習更快地衰減這些引用。

2.2 分布式身份和領域邊界

Macaron 團隊拒絕單一化的用戶檔案概念;相反,身份被視為從小互動中構建的 新興敘事。記憶按 領域邊界 組織(例如工作、愛好、家庭),並具有 相關性聯盟 機制,允許跨領域檢索。對於日本和韓國用戶,領域邊界還包括 語言領域:一個記憶項目可能被標記為「日語—愛好—音樂」或「韓語—家庭—財務」。當代理接收到韓語查詢時,它首先搜索韓語記憶,但如果語義內容匹配,則可以聯邦檢索到日語記憶。這防止了跨污染,同時實現跨語言連續性。

2.3 多語言環境中的記憶衰減與隱私

不常被訪問的記憶會隨時間衰減,衰減率可能因領域而異。記憶衰減機制減少未使用記憶的權重,確保日本用戶對韓劇的短暫興趣不會永久佔用記憶空間。衰減也有助於隱私;關於家庭或財務的敏感信息可以設定更快的衰減速度。用戶可以明確刪除記憶或標記為機密。Macaron 的政策綁定框架將機器可讀的隱私規則直接附加到數據上,因此帶有「私密—韓國」標籤的記憶可能僅在認證會話期間用該語言訪問。結合差異化透明度,為不同利益相關者提供不同層次的披露,這些機制使 Macaron 能夠在日本的隱私規範和韓國不斷演變的 AI 法規中遊刃有餘。

3 文化適應和個性化定制

3.1 通過個性測試和色彩調色板入門

註冊後,使用者需完成三項人格測試,協助 Macaron 為其匹配個性化的人物角色——包括顏色、溝通風格和語音。在日本,因為重視美學和禮儀,測試可能會強調社交禮節,而韓國的問卷則可能著重於家庭動態和同儕關係。生成的人物角色不僅影響使用者介面,還會影響代理的禮貌程度、語調和文化參考的選擇。日本的人物可能喜歡間接的建議(「下週要不要計劃一次野餐?」),而韓國的人物則可能更喜歡直接的鼓勵(「我們計劃個家庭旅行吧!」)。

3.2 在地化小應用:從家計簿到好習慣

Macaron 按需生成迷你應用程式的能力不限於一般生產力工具。該平台可以生成超過 100,000 行代碼的定制應用程式,例如受日本「家計簿」傳統啟發的預算工具(一種家庭記帳方法)或韓國「戶籍官」計劃應用程式(管理家庭活動和祖先紀念)。用戶只需用自然語言描述他們的需求,代理就會合成一個符合當地習俗的程式。這需要一個特定領域模板的庫以及整合當地日曆、公共假期和金融法規的能力。強化學習通過評估用戶滿意度來優化生成過程:如果日本用戶經常修改家計簿應用程式以添加「お土産」(紀念品)和「お作り」(每月慈善)等類別,生成器會學習在未來的應用程式中自動包含這些分類。

3.3 情感規範和溝通風格

日本和韓國在表達情感方面有不同的規範。日本文化通常重視謙遜和對環境的敏感,而韓國文化則擁抱更具表現力的社交互動。Macaron會根據這些差異調整其回應風格,並依據強調流動身份和用戶賦權的數位人格研究來進行。在實踐中,這意味著該助手在用日語交流時可能會使用敬語和間接表達,而在用韓語交流時則會提供更主動的建議。記憶系統會記錄語氣的反饋,並自適應地調整對話風格。這些調整不是硬性編碼的,而是通過強化學習(RL)自然形成的:如果用戶對某種溝通風格持續給出正面回應,獎勵信號會強化該行為。

4 實施細節:跨語言個人助手的工程

4.1 資料收集和訓練管道

創建一個能用日語和韓語交流的個人代理需要高質量的數據。Macaron 的訓練語料庫包括所有支持語言的授權書籍、新聞文章、博客、轉錄和用戶生成內容。數據經過禮貌性、偏見和領域覆蓋篩選。預訓練階段使用結合多語言數據的掩碼語言建模和下一個詞預測來學習共享表示。微調引入來自人類反饋的強化學習(RLHF):來自東京和首爾的雙語標註者評估回應的文化適切性,使模型能學習何時使用敬語或何時提出澄清問題等微妙線索。額外的對比學習目標鼓勵在語言間對語義等價短語的對齊。

4.2 跨語言記憶索引與向量檢索

Macaron 的記憶庫將嵌入儲存於高維向量空間中。對於每個記憶項目,代理會計算一個能夠捕捉內容和語言的表示。跨語言記憶索引 使用近似最近鄰搜尋來檢索項目,而不受查詢語言的限制。例如,如果一位韓國用戶詢問「피자 만들기 레시피」(披薩食譜),代理可能會找到一個關於「ピザの作り方」(如何製作披薩)的日文記憶,因為這兩者都接近於披薩的概念。在檢索時,代理會根據用戶權限進行過濾,然後使用內建的翻譯器和摘要工具將檢索到的記憶轉換成用戶偏好的語言。這使得跨語言的知識共享成為可能,同時保護隱私界限。

4.3 安全性與偏見緩解

跨語言模型有可能傳播訓練資料中存在的偏見。對於日本和韓國這樣的國家,性別角色和年齡階層在文化中扮演著重要的角色,Macaron 實施了偏見緩解策略。在微調過程中,增強學習的獎勵會對強化刻板印象或違反當地規範的回應進行懲罰(例如,假設只有女性處理家庭財務)。政策綁定系統確保在未經用戶同意的情況下,個人資料不會在語言間翻譯。此外,Macaron 的差異化透明度允許監管機構在不同層次的細節下審核模型行為:日本當局可能會檢查一般使用模式,而韓國監管機構則可以在嚴格保密的情況下檢查原始日誌。

5 個挑戰和研究方向

5.1 處理方言和區域變異

日語和韓語都有區域方言。在日本,關西方言使用的詞彙和語調與標準的東京話不同。韓國的方言如全羅和慶尚也呈現出類似的挑戰。目前的語言檢測器可能會誤分類方言輸入,導致尷尬的回應。未來的研究可以考慮使用訓練於區域語料庫的方言嵌入,使代理能夠識別並以適當的方言回應。用戶甚至可以要求 Macaron 模仿特定的口音,這對角色扮演遊戲或語言學習模組可能具有吸引力。

5.2 跨語言常識推理

雖然當前的模型可以對齊各語言的語義表示,但常識推理仍然受到文化差異的影響。像「積ん読」(tsundoku,購買書籍但不閱讀)或「빵셔틀」(bbang shuttle,指被霸凌者被迫為他人買麵包的俚語)這樣的表達在英語中並沒有直接對應的詞彙。對於跨語言常識知識圖譜的研究可能有助於 Macaron 理解和解釋這些文化特有的概念。與像 ConceptNet 或 ATOMIC 本地化版本這樣的知識庫整合,可以提供結構化的文化知識,補充LLM的統計學習。

5.3 隱私和法規對齊

日本的《AI 促進法》強調透明性,並將 AI 開發與現有法規對齊,而韓國提出的《AI 框架法》則引入了風險管理和人為監督的義務。個人代理在遵守用戶隱私的同時,必須在這些框架中導航。需要研究聯邦學習以將用戶數據保留在設備上,差分隱私以防止跨語言的去識別化,還有能夠解釋日韓語法規文本並將其映射到政策綁定規則的法律合規引擎

5.4 跨模態整合

未來的個人助手將不僅限於文字。Macaron 的願景包括連接物聯網設備、VR 介面和穿戴裝置。跨模態互動在處理多種語言時增加了新的複雜性:例如,一位日本用戶可能會用日語對智慧音箱說話,同時在混合現實頭戴裝置上閱讀韓文字幕。將音頻、文字和視覺資料在不同語言間對齊,將需要能同時處理語音、文字和圖像的多模態轉換器,以及在各模態間進行時間同步

5.5 案例研究:雙語教育應用

為了說明跨語言個性化在實際中的運作,考慮一位想學韓文的日本用戶,他請求 Macaron 建立一個學習應用程式。助手首先會查詢用戶的記憶,以了解其過往的語言學習經驗——或許他們學過英語,因此助手知道他們偏好視覺輔助和間隔重複。意圖解析器會提取像是「目標語言:韓文」、「來源語言:日文」、「學習重點:文法和詞彙」以及「每日學習時間:20 分鐘」等槽位。Macaron 的程式合成引擎接著組裝模組:一個韓文字形分析器、一個日語字幕的句子分割模組、一個間隔重複排程器,以及一個結合用戶興趣(例如韓劇或 J-pop 歌詞)的測驗生成器

生成的應用程式展示了帶有發音、例句和文化註解的詞彙卡。雙向翻譯層將韓語詞彙與相應的日語短語聯繫起來,使用前面描述的跨語言嵌入。強化學習個性化學習順序:如果用戶在動詞變位方面遇到困難,獎勵模型會優先進行語法練習;如果他們喜歡閱讀歌詞,代理會提供更多歌詞翻譯。由於記憶系統對每一課進行語言和領域標記,韓語學習的進展可以在日後為用戶的日語創意寫作提供資訊,促進語言之間的遷移學習。用戶可以在 Macaron 社群中分享他們的雙語學習計劃,代理會監控反饋以完善模組庫。

5.6 跨語言身份的哲學反思

在多語言中操作的能力引發了關於數位身份更深層的問題。Macaron 的自我模型將身份視為從互動中建立的漸進敘事。當這些互動以多種語言發生時,敘事變得更加流動。詞語帶有文化內涵:日文的 kokoro 和韓文的 마음 都翻譯為「心/心靈」,但卻引發不同的細微差別。當 Macaron 在多種語言中編織用戶的記憶時,必須決定在提及感受或記憶時使用哪個詞彙。這個選擇塑造了用戶對自身的認知。語言哲學家認為,思想受我們使用的詞語影響;Macaron 通過根據上下文和期望的情感基調選擇語言來實現這一理念。

跨語言身份也涉及數位人格的概念。用戶可能在日語和韓語情境中維持不同的角色——在工作中正式且拘謹,在粉絲社群中隨性且富於表達。Macaron 尊重這些界限,保持獨立的記憶群集,同時允許有意的交叉交流。隨著時間的推移,用戶可能選擇融合其身份的各個方面,發現其日語和韓語生活中的共同點。Macaron 通過突出顯示兩組記憶中相似的價值觀、習慣和願望,協助用戶在跨文化中塑造一個連貫的個人故事。

Boxu 在埃默里大學獲得了定量經濟學專業的學士學位。在加入 Macaron 之前,Boxu 的職業生涯大部分時間都在美國的私募股權和風險投資領域度過。他現在是 Macaron AI 的首席參謀和市場營銷副總裁,負責管理財務、物流和運營,並監督市場營銷。

申請成為 Macaron 的第一批朋友