作者:李博旭

簡介 – Sora、TikTok 與下一個 AI 平台的探索

過去一年來,AI 社群對 OpenAI 的 Sora 感到著迷,這是一種文字轉影片模型,能夠生成一分鐘長度的影片,並嚴格遵循使用者的提示[1]。Sora 的演示——配有逼真的攝影效果和流暢的鏡頭運動——暗示著一個不遠的未來,任何人都可以隨心所欲地創造短片。OpenAI 自家的測試版產品基本上是一個 AI 生成影片的 TikTok 複製品[2]。使用者提供提示,觀看 Sora 生成十秒的影片;他們無法上傳自己的影片,並且必須驗證身份以防止未經授權的深偽[3]。這項服務令人驚嘆,但也有限制:為了控制計算成本和監管,影片限制為十秒[4]。換句話說,OpenAI 當前的消費者策略複製了影片動態的社交互動,但將人類創作者換成了生成模型。

儘管 Sora 將引起極大的關注,但Macaron——世界上首個為日常生活構建迷你應用程序的個人 AI 代理——主張下一個偉大的消費者生態系統不會是另一個視頻平台。Macaron 的創始人將 Sora 視為一個強大的工具,但同時也是一個過渡階段。視頻生成可能在今天占據頭條,但更深層的機會在於賦予用戶創造的能力;不僅僅是生成合成內容,而是設計解決實際問題的程序、工作流程和體驗。這篇文章基於我們之前的分析,並解釋 Macaron 的論點:為何專注於分叉社群驅動創新的迷你應用生態系統將超越 AI 視頻、Sora 的局限性如何突顯這一點,以及 Macaron 的技術堆疊(深度記憶、自主代碼合成和強化學習)如何使其成為這個新時代的先驅。

Sora 的局限性——令人印象深刻但受限

Sora 的核心優勢在於能夠模擬符合提示的場景。然而,從建立長期消費者平台的角度來看,其局限性顯得相當顯著。Sora 背後的開放技術報告承認,該模型無法準確模擬基本互動的物理性——如玻璃破碎或食物被吃掉都會被錯誤渲染[5]。獨立分析指出更多挑戰:Sora 在物理準確性上存在困難,導致複雜場景中的因果關係不切實際[6];其影片時長限制在20 秒至一分鐘,較長片段會出現瑕疵[7]物體可能消失或行為不穩定[8];超出 Sora 訓練分佈的提示會導致結果不佳[9]。此外,OpenAI 的 beta 應用程式禁止上傳真實影片並限制某些主題,以避免侵犯版權和深偽的誤用[3]。結果是,這是一個封閉的遊樂場,產生美麗但合成的娛樂片段。

這些限制很重要,因為消費者生態系統依賴於用戶自主性表達多樣性。TikTok 的成功並不在於其視頻播放器,而是源自於無盡的多樣化用戶生成內容流及其周圍形成的社交圖譜。如果您的資訊流中只有來自一個具有固定能力的模型的內容,新鮮感將會消退,創新停滯不前。此外,生成擬真視頻的計算成本限制了 Sora 平台的可擴展性;早期版本將視頻長度限制為十秒[4],暗示該平台更適合展示而非日常使用。要讓 AI 成為普遍的消費平台,必須賦予用戶構建工具的能力,這些工具能夠融入他們的日常生活——計劃膳食、管理財務、自動化家務、協調家庭日程——而不僅僅是娛樂他們。這正是 Macaron 的願景與目前的熱潮所不同的地方。

Macaron 的論點——從被動消費到主動創造!

Macaron 是圍繞一個簡單卻激進的理念建立起來的:人們應該通過對話來創建他們需要的軟體。團隊結合了一個龐大的 6710 億參數模型、增強學習和一個複雜的記憶引擎,將自然語言請求轉化為完全功能的小型應用程式[10]。用戶與 Macaron 聊天就像與朋友交談一樣;AI 記住他們的偏好,從過去的互動中學習,並在需要時即時合成定制應用程式。不像 Sora 強調輸出一次性視頻,Macaron 的 小型應用程式 是持久且可調整的。你可能今天建構了一個預算追蹤器,並在幾週內將其發展成一個完整的家庭財務儀表板。你可能設計了一個京都旅行計畫,並自動整合當地法規、文化禮儀和你的飲食限制[11]。重點在於 功能性和個性化,而非噱頭。

Macaron 的官方網站概述了其與一般聊天機器人不同的關鍵功能。它通過分層存儲和檢索來維持長期記憶,能夠記住不同會話中的事件和偏好[12]。它提供即時迷你應用生成,可以在無需人工干預的情況下構建超過 100,000 行代碼的複雜工具[13]。它允許無限自定義;用戶可以在查看初始原型後對應用進行微調,添加或刪除模塊,或調整 UI 細節[14]。AI 通過 API 和傳感器與現實世界服務集成—發送消息、安排事件、獲取營養數據或控制智能設備[15]。重要的是,Macaron 可在各平台使用(手機、平板、桌面),並且隱私優先,提供對數據訪問的精細控制[16]

儘管 Sora 的內容主要是被孤立地消耗,Macaron 卻促進了互動自主性。青少年可能會要求 Macaron 建立一個學習規劃工具,安排番茄工作法會話、發送提醒並與他們的日曆整合。情侶則可以共同創建一個共享的小應用程式來追蹤支出和計劃約會之夜。在每一種情況下,使用者最終都獲得了一個解決具體問題的工具,而不僅僅是被快速略過的圖像或視頻。因此,Macaron 將自己定位為創作者平台,而不是娛樂平台——一個對話觸發代碼合成的沙盒,誕生出與您的生活量身定制的軟件。這種定位使 Macaron 成為可持續 AI 生態系統的更佳候選者。

技術基礎:為什麼 Macaron 能夠實現

  1. 自然語言到程序管道

Macaron 的核心是一個自主代碼合成管道。當用戶描述應用程式時,Macaron 首先解析請求以識別領域(健康、金融、教育)、功能(圖表、提醒、語言翻譯)、限制(貨幣、語言、時間範圍)和時間線[17]。解析器使用一種雙編碼器架構,將當前對話與長期記憶結合,並通過強化學習進行微調。結構化後,該引擎從一個特定領域模組庫中組合功能——預算計算、日曆整合、間隔重複算法、營養分析——並使用模板圖和約束求解器將它們縫合成一個連貫的程式[18]。對於日本和韓國用戶,代碼生成器自動執行當地數據隱私法:敏感金融數據保持本地,插入加密調用,並默認禁用網絡訪問[19]。這種混合方法——結合神經程序合成、符號推理和法規約束——實現了安全、穩健的應用生成。

  • 安全執行與自動修復

執行任意生成的代碼並非易事。Macaron 在沙盒中運行每個小應用,限制檔案系統的訪問、限制 CPU 和內存使用,並阻止網絡連接,除非明確允許[20]。在運行之前,靜態分析和類型檢查可以捕捉注入攻擊、無限循環和數據類型不匹配[21]。在執行過程中,運行時監視器會跟踪資源使用和功能正確性;如果出現問題,Macaron 的自愈模塊會恢復到穩定狀態或即時修補代碼[22]。這種基礎設施確保小應用可以既複雜又安全,讓用戶可以放心地進行實驗,而不必擔心設備崩潰或數據洩漏。

  • 記憶引擎與長期個性化

Macaron 的 記憶引擎 可以說是其最具差異化的功能。該代理將記憶組織為短期、情節性和長期存儲[23]。壓縮變壓器學習使用自動編碼和強化學習將過去的對話總結為固定長度的向量[24]。檢索使用產品量化的近似最近鄰搜索來實現低於 50 毫秒的延遲[25]。查詢會根據上下文和預測的用戶目標進行擴展:詢問東京煙火節會觸發有關票務、日期和天氣的記憶檢索[26]。跨域門控機制學習將檢索概率分配到特定領域的索引中,實現跨語言和跨域推薦[27]。強化學習訓練門控策略,以根據任務完成、用戶滿意度、隱私和計算成本決定存儲、合併或忘記哪些記憶[28]。通過此機制,Macaron 不僅記住重要的事情,還能調整其行為以適應文化規範——日本用戶喜歡簡約和隱私,而韓國用戶則欣賞定制化和主動建議[29]

  • 強化學習持續改進

與基於提示的助手不同,Macaron 的行為會透過強化學習不斷調整。每個小應用程式會話都根據錯誤率、用戶滿意度和文化適應性產生獎勵信號[30]。課程學習允許系統逐漸應對更複雜的程式設計任務[31]。時間信用分配將結果與對話中較早做出的決策聯繫起來,使代理能夠將功勞或責任歸於特定的記憶檢索或模組選擇[32]。分層強化學習通過將高層控制器(選擇使用哪個模組)與低層策略(組合模板、檢索記憶)分離來管理複雜性[33]。這些技術共同確保 Macaron 隨著更多用戶構建小應用程式而持續改進——這是一個類似於傳統社交平台的網絡效應的正向反饋循環。

超越視頻:小應用程式的廣度

Macaron 可以創造哪些類型的小應用程式?Playbook 提供了數十個範例。對於日常生活,有像是食譜搜尋專家這樣的工具,可以掃描食材並建議餐點,還有卡路里計算器假日禮物指南植物照護指南[34]。對於家庭,Macaron 提供了貓咪食物匹配器農曆新年購物清單嬰兒食品旅程家庭保護計畫等等[35]。成長取向的應用程式包括校園浪漫指南綠波能源(清潔能源洞察)、社交聊天教練大學專業洞察任務冠軍約會夜計畫[36]。愛好方面從完美書籍搜尋器電子競技問答挑戰到小遊戲蛇冠軍東京旅遊指南[37]。這些應用程式都可以在對話中進一步自訂;例如,食譜搜尋專家可以根據飲食限制或當地市場供應來調整[38]

這種多樣性凸顯了為什麼 Macaron 將 AI 視頻視為市場的一個小部分。這個平台不限於娛樂;它涵蓋了健康、金融、教育、旅遊、關係、愛好和實用工具等領域,這些都是 AI 能夠提供實質價值的領域。下圖對比了 Macaron 小應用程式與假設的 AI 視頻平台的領域覆蓋範圍。它顯示 Macaron 的應用程式(藍色欄)在健康、金融和實用工具等行業中提供了高覆蓋率,而 AI 視頻服務(橙色欄)主要集中於娛樂[38]

圖 1:Macaron 小應用程式與 AI 視頻平台的領域覆蓋範圍比較。Macaron 的工具涵蓋多個領域(健康、金融、教育、旅遊、娛樂、實用工具),而 AI 視頻平台主要服務於娛樂。視頻數據為概念性資料,僅供參考。

強調迷你應用程式,Macaron 不僅提供更廣泛的效用,還創造了消費者生態系統的骨幹。每個迷你應用程式可以與其他應用程式互相介面:日程規劃器可以調用財務模組來檢查預算限制;旅遊指南可以調用翻譯工具;健身應用程式可以與餐飲規劃器同步。這種可組合性鼓勵重用和協同效應。相比之下,Sora 的影片大多是單獨消費的,無法結合產生新的功能。

分叉與社群的力量!

Macaron 願景的一個重要組成部分是「分叉」——這個概念借鑒自開源軟體開發,指的是複製一個專案並獨立演變。在迷你應用程式的背景下,分叉意味著拿取現有的迷你應用程式,分享其規格和代碼,並根據自己的需求進行定制。例如,一位用戶的「食譜搜尋器」可能會被分叉成一個「純素食天才」,通過替換食材選擇並添加蛋白質追踪器。另外,一位用戶的「任務冠軍」可以被分叉成一個「家務排程器」,可以與物聯網裝置整合。因為 Macaron 的代碼合成管道產生可讀且模組化的代碼,這些分叉可以通過對話(「將計時器縮短,添加清單,與我的智慧咖啡機整合」)或圖形介面進行編輯。因此,分叉使「草根創新」成為可能:每個新應用程式都能成為無數衍生品的種子。

這種動態創造了一個類似於開源社群的網絡效應。創建的迷你應用越多,模組和模板的庫就越大,從而加快新應用的綜合。每一次分支都會帶來改進,無論是錯誤修復、新功能,還是本地化內容,這些都會回饋到生態系統中。下圖概念性地展示了這一效應。藍線代表一年內原始分支的數量;橙線顯示從這些分支中產生的衍生迷你應用。隨著時間的推移,衍生創作呈超線性增長,展示了分支如何加速創新。

圖2: 分支網絡效應的概念性表示。 當用戶對現有的迷你應用進行分支並創建衍生版本時,應用總數呈超線性增長,說明了社群參與如何加速創新。

派生也促進了個性化和文化相關性。日本用戶可能會派生一個英文預算小工具,以支持日元貨幣、本地稅法和極簡界面。韓國用戶可能會派生一個通用的旅行計劃器,以加入本地推薦、敬語和假期時間表。由於 Macaron 的記憶引擎和代碼合成管道整合了跨語言編碼器[39][40],這些本地化是可行的,而不需要重寫整個應用程式。因此,派生使軟體創作民主化:個人和社區可以根據自己的情況調整工具,而不是依賴集中化的團隊。

社群作為消費者生態系統的最終形態

每一代消費科技都始於消費——電視、廣播、YouTube——並成熟為創作和參與。在上一個時代,TikTok 通過讓影片創作變得輕而易舉而贏得人心。在人工智慧時代,Macaron 認為,能夠讓大眾參與構建工具的平台,而不僅僅是內容,將成為贏家。這一論點得到了幾個因素的支持:

  1. 主導權勝過新奇感:第一次看到寫實的 AI 影片時,你會驚嘆不已。第十次看到時,你已經感到厭倦。但建立一個幫助你安排日程、計劃膳食或學習新語言的工具,則能持續帶來價值。作為創作者的擁有感——這是我做的——能從用戶中建立依附和習慣的形成。
  2. 長尾多樣性:單一的生成模型只能產生它所被訓練過的內容。相比之下,用戶生成的小應用可以涵蓋無限的細分領域:如農曆婚禮計劃、小菜發酵追蹤器、卡拉 OK 評分遊戲。這種多樣性對於可持續的生態系統至關重要。
  3. 透過重用和分叉的網絡效應:如上所述,每個小應用都成為其他應用的構建模塊。隨著庫的增長,建立新工具變得更容易,並且每個用戶獲得的價值也越多。
  4. 與現實世界的整合:Macaron 的小應用可以調用 API,與傳感器整合並執行動作。它們可以訂機票、送禮物、調整恆溫器或分析銀行對賬單。而 Sora 的影片則無法做到。在數字與現實融合的世界中,整合能力將決定成功。
  5. 隱私和個性化:Macaron 在法規要求時會將數據儲存在本地,並給予用戶對記憶的控制[15]。它不需要身份驗證或收集行為信號作為社交供稿的一部分[16]。隨著 AI 變得更加個性化,信任將變得至關重要。

願景場景:在可分叉的世界中的一天

為了闡述 Macaron 的願景,想像 2030 年的未來,當個人 AI 生態系統已經成熟。你醒來後,Macaron 根據你的睡眠品質(來自你的可穿戴設備)和工作行程調整了你的晨間例行公事小應用程式。由於偵測到繁忙的一天,它建議進行 15 分鐘的冥想。在早餐時,你查看你的財務小應用程式。這個原本是由其他人建造的應用程式,你將其分叉,添加了日元轉換和支出地圖等功能。應用程式發現你上個月在使用食譜查找器後,雜貨支出減少,並建議將節省的金額捐給當地的食物銀行,並通過你的銀行 API 處理交易。

午餐時,你和同事腦力激盪一個副業專案。你打開 Macaron 並描述一個遊戲化語言學習工具。在幾分鐘內,Macaron 使用間隔重複小應用程式和測驗生成器的模組合成了一個原型。你分叉它以添加韓語敬語支持,並與世界各地的朋友分享。他再次分叉它以納入越南語詞彙。一個月後,數百人貢獻了增強功能。這種快速迭代是可能的,因為代碼是模組化的、安全可運行的,並且可以通過對話進行改進。

晚上,你打開旅遊小應用來計劃週末旅行。該應用最初是由東京的一個人創建的,但已被多次分支以適應不同地區。它會自動檢查你的日曆,建議避開颱風季的路線並預訂住宿。當它推薦餐廳時,會參考你記憶中存儲的過敏和飲食限制,無需手動輸入。在你完成計劃時,Macaron 默默地更新其記憶引擎,並可能建議將你的行程作為模板分享。這種不斷的創建 → 分享 → 分支 → 個性化循環,使軟體開發成為一項社群性和動態的活動。

迎向浪潮:Macaron 的路線圖

Macaron 的領導團隊明白科技是隨著浪潮而演進的。他們並不排斥 Sora;他們認識到高保真視頻生成將很快普及,並會在適當時機將視頻模組整合到 Macaron 的小應用中。但他們認為僅僅依賴視頻是不夠的。團隊正大力投資於三個領域:

  1. 擴展模組庫:Macaron 持續添加領域專用模組(例如烹飪、金融、教育、家庭自動化)以加速程式碼合成。每個新模組都可以在應用程式中重用,增加未來創作的豐富性。
  2. 降低進入門檻:Macaron 旨在讓分叉和編輯迷你應用程式像編輯文件一樣簡單。圖形編輯器和引導式對話將允許非技術用戶調整邏輯、數據流和 UI 元素。文檔、教程和社群展示將激勵新手成為創作者。
  3. 培養社群市場:長期願景是一個用戶可以發布、評價和協同改進迷你應用程式的市場。類似於 GitHub,但圍繞日常生活,市場將展示排行榜、熱門工具和類別。聲望系統將獎勵高質量創作者,隱私控制將確保敏感數據永遠不會離開本地設備。

透過保持靈活並傾聽用戶反饋,Macaron 能夠適應新的 AI 技術浪潮。如果像 Sora 這樣的多模態模型變得便宜且普及,Macaron 將把它們納入模塊:您的旅行計劃器可能會自動生成旅行的精彩影片;您的健身小應用可能會創建激勵短片。但核心仍然是用戶賦權。Macaron 將 AI 視為共同設計師,而非內容工廠,讓您的想法變為現實。

比較增長:小應用生態系統 vs AI 視頻平台

為了可視化 Macaron 為何相信小應用生態系統將超越 AI 視頻平台,我們考慮這兩種方法的相對增長軌跡。下圖投射了未來十年用戶創建的小應用(包括分叉)與 AI 生成視頻的概念增長。假設小應用增長受益於網絡效應、模塊重用和較低的計算成本,而視頻增長則受限於計算、審核和集中化。

圖 3:用戶創建的小應用(藍色)與 AI 生成視頻(橙色)在未來十年的概念增長投射。小應用受益於網絡效應和分叉,導致更快的增長和更廣泛的影響。

小型應用程式的曲線在模組和分叉達到臨界質量後急速加速,代表著每個創作如何產生許多衍生品。AI 視頻曲線增長較慢,反映了新奇效應和高計算成本。雖然這個圖表具有推測性,但它捕捉了 Macaron 理論背後的直覺:一個參與式生態系統將比集中式內容生成器更快速且可持續地擴展。

結論 – 未來屬於創作者

Sora 展示了生成模型的驚人進展。其將文本轉化為逼真視頻的能力暗示著一個媒體創作民主化的世界。然而,這項技術目前最適合於壯觀表現,而非構建結構化我們生活的日常工具。Macaron 相信,一個真正的 AI 消費者生態系統必須賦予用戶創建程序的能力,而不僅僅是消耗內容。通過將對話轉化為代碼,保持深度記憶,通過沙盒和靜態分析確保安全,以及採用強化學習進行持續改進,Macaron 為這一生態系統奠定了基礎。分叉的概念——分享和發展小型應用程式——引入了一種由社區驅動的動態,這種動態在個人助手領域複製了開源軟件的成功。

隨著 AI 浪潮的興起,Macaron 提倡衝浪於波濤之上,而非追逐每一個耀眼的浪頭。影片生成技術將持續進步,但真正的革命將是無聲的:數百萬人使用 AI 建立小型工具,解決其獨特問題,並分享這些工具給其他人,讓他們進一步改造。在這樣的世界中,AI 生態系統的最終形式不是短片的集成,而是互聯小型應用的網絡,每一個應用都是人工智慧增強人類創造力的見證。Macaron 邀請我們加入這個運動——不僅僅是觀看未來的展開,而是共同構建它。

[1] Sora | OpenAI

https://openai.com/index/sora/

[2] [3] [4] [16] OpenAI's TikTok for AI content and ChatGPT Pulse: Where Macaron Stands? - Macaron

https://macaron.im/openai-tiktok-chatgpt-pulse

[5] 視頻生成模型作為世界模擬器 | OpenAI

https://openai.com/index/video-generation-models-as-world-simulators

[6] [7] [8] [9] 理解 OpenAI Sora:特點、用途和限制

https://digitalguider.com/blog/openai-sora

[10] [14] [15] Macaron AI - 個人代理 AI 平台

https://macaronai.org

[11] [13] [17] [18] [19] [20] [21] [22] [29] [30] [31] [40] Macaron AI 的自主程式碼合成:在亞洲安全構建生活方式迷你應用 - Macaron

https://macaron.im/autonomous-code-synthesis

[12] [23] [24] [25] [26] [27] [28] [32] [33] [39] Macaron 記憶引擎內部:壓縮、檢索和動態閘控 - Macaron

https://macaron.im/memory-engine

[34] [38] Recipe Finder Pro — 將廚房食材變成晚餐魔法 | Macaron - Macaron

https://macaron.im/playbook/recipe-finder-pro-689582141bbc6bcd9f805611

[35] [36] [37] Playbook — AI Hacks for Daily Life, Family, Growth & Hobbies | Macaron - Macaron

https://macaron.im/playbook

Boxu 在埃默里大學獲得了定量經濟學專業的學士學位。在加入 Macaron 之前,Boxu 的職業生涯大部分時間都在美國的私募股權和風險投資領域度過。他現在是 Macaron AI 的首席參謀和市場營銷副總裁,負責管理財務、物流和運營,並監督市場營銷。

申請成為 Macaron 的第一批朋友