作者:Boxu Li
當 OpenAI 於 2024 年 2 月推出 Sora 時,生成式 AI 社群一片譁然。這是一個能將文字提示轉化為具有動態鏡頭移動和一致性物件的電影級影片的模型。2025 年 9 月,隨著 Sora 2 的推出,增加了真實的物理效果、同步音訊和一個鼓勵用戶互相重新剪輯影片的社交應用,這股熱潮進一步加劇。短片按需創作的想法一夜之間不再像科幻小說,更像是即將實現的現實。昨日,OpenAI 推出了這款社交應用,旨在讓用戶在平台上分享自己的 AI 生成內容。
Macaron 歡迎這一進步,但我們的觀點很明確:Sora 不會是 AI 消費者生態系統的最終形態。在 ChatGPT 席捲互聯網之前,TikTok 是互聯網上最成功的消費者生態系統平台。AI 時代的下一波浪潮不會是另一個視頻生成/內容分享平台。AI 將能夠賦予用戶更多功能。視頻生成很重要,但一個繁榮的生態系統應該賦予用戶創造、協作和超越被動觀看的能力。
在本文中,我們探索 Sora 的能力,分析其反響,並討論為何 Macaron 認為一個更加豐富、更加參與、更加強大的平台將定義消費者 AI 生態系統。
Sora 的底層擴散變壓器架構經過訓練,將視頻序列建模為連續的三維過程。在預訓練期間,它學習了物體恆常性、3D 一致性和長距離連貫性。當提示描述「一個人正在畫肖像」時,Sora 理解畫筆的筆觸在後續畫面中應保持可見,而且畫家不應在場景中瞬間移動。這種突現的世界建模是對早期逐幀生成模型的一個顯著進步。
在 Sora 1 中,用戶可以生成 20 秒長的 1080p 解析度片段,通過故事板拼接多個場景,甚至將靜態圖像轉換為動畫片段。他們可以重混或延伸現有視頻,應用風格預設(例如動漫、電影感或復古風),循環特定片段,並將不同提示中的元素結合起來。這些功能為市場營銷團隊、教育者和愛好者解鎖了新的創造形式。
OpenAI 在 2025 年 9 月的更新推出了一個能更忠實模擬物理現象的模型。在 Sora 1 中,如果籃球手投籃失誤,球可能會神奇地瞬間進筐;而在 Sora 2 中,球會真實地從籃板反彈。這個模型能處理如奧林匹克體操動作、槳板上的後空翻以及頭上頂著寵物進行三周跳的花樣滑冰等複雜技能。它還引入了同步的對話和音效,創造出身臨其境的視聽體驗。多鏡頭指令允許用戶在多個鏡頭中指定攝像機移動、場景切換和角色動作,同時保持世界狀態的一致性。
另一個亮點功能是客串。通過錄製短視頻和音頻驗證,用戶可以將自己的形象或朋友的形象注入到任何 Sora 生成的環境中。這意味著你可以在自己的科幻冒險中擔任主角,或在奇幻世界中出現為一個角色。OpenAI 的 Sora 應用利用這一功能創建了一個新型社交網絡,讓用戶重新混合彼此的視頻,並在一個重視創造過於被動消費的動態中分享。
主流媒體稱頌 Sora 為即將到來的革命。《自由新聞日報》稱 Sora 2 是「改變遊戲規則者」,因為它能模擬物理、整合音頻並支持客串;該出版物預測,超現實的 AI 視頻可能會「媲美專業製作工具」,降低內容創作者的門檻。在娛樂領域,有人對於不再需要昂貴的佈景或外景拍攝表達了興奮:電影製片人泰勒·派瑞承認他在看到 Sora 的潛力後停止了 8 億美元的工作室擴建,並指出他現在可以虛擬創建場景。
然而,隨著熱潮的增長,懷疑也開始增加。美國律師協會對 Sora 可能民主化深偽製作、促進偽造證據和非自願色情製品表達了警惕。一些業界觀察家警告說,近乎完美的 AI 視頻可能會加劇錯誤信息的傳播。內容創作者和版權持有者對 OpenAI 允許基於「版權材料」的 AI 生成視頻表示關注,除非所有者選擇退出——這一政策引起了好萊塢的關注。
雖然 Sora 2 大幅提升了真實感,但仍然會出錯。OpenAI 的技術報告承認,該模型在面對複雜物理時可能會有困難,有時會錯誤地表現因果關係。獨立評論指出,水可能表現得不夠逼真,或者物體可能不自然地融合在一起。由於計算限制,該模型也僅限於短時間(數十秒)和 1080p 的解析度。專業電影製作人仍依賴非線性編輯器進行幀準確的編輯、精確的對嘴同步和高品質音頻混合。
OpenAI 強調負責任的部署。每個 Sora 視頻都包含可見的浮水印和 C2PA 中繼資料以證明來源。客串演出需要用戶同意且可以撤回,並且對未成年人有更嚴格的保護措施,例如限制他們的內容曝光,阻止成年人發送消息給他們。提示和輸出經過過濾,以阻止色情、恐怖主義或自殘內容。然而,沒有技術解決方案可以完全防止濫用。深偽檢測仍然是一場軍備競賽,數據使用於訓練模型的權利管理尚未解決。
Sora 進入了一個擁擠的視頻平台市場。TikTok,這款稱霸上一個用戶生成內容時代的短視頻應用,圍繞人類創造力和算法推薦構建了一個令人上癮的資訊流。相比之下,Sora 以 AI 生成內容 為主打。用戶可能最初會對生成超現實場景或在自己的 AI 電影中出演感到興奮,但這種新奇感能否維持一個社交網絡?《耶路撒冷郵報》指出,Sora 是一個可在 iOS 上使用的 新社交應用,即使是真人出演的每一個帖子也是由 AI 生成的。問題在於觀眾是否會像對人類創作的影片一樣,與 AI 創作的影片形成情感連結。
TikTok 成功的一部分在於其真實性;普通用戶分享真實而雜亂的瞬間。Sora 則顛覆了這個公式,讓人們可以大規模製作精緻的小電影。雖然這使得電影製作變得普及,但也可能導致一些評論家稱為「AI 垃圾」的合成內容泛濫。缺乏清晰的來源和背景,可能讓觀眾難以信任所見內容。除非平台保持透明度和道德標準,否則這種信任缺失可能會限制 AI 生成影片的文化影響。
Macaron 欣賞 Sora 背後的工程技術,但我們認為僅圍繞 AI 生成影片來構建 未來的 AI 消費者生態系統 是目光短淺的。創建內容只是讓平台吸引人的一部分;分享、協作和互動體驗同樣重要。Sora 對預生成片段和客串混音的重視可能無法發揮用戶創意的全部潛力。如果我們只是 在一個視頻製作應用與另一個之間跳躍,我們可能會重複舊的模式,而不是創造新的模式。
歷史上,消費者生態系統在提供開放式創作工具時蓬勃發展。TikTok 的成功不是因為其技術有多突破,而是因為它賦予用戶創作短小且具表現力的影片、通過雙人合拍進行協作並回應潮流的能力。相比之下,早期生成靜態圖片的 AI 藝術平台未能形成持久的社群,因為用戶對生成過程缺乏控制權。要在 AI 時代超越 TikTok,平台必須能夠 不僅僅是觀看;它應該讓人們構建、玩樂、混音和創造反映其想法的 迷你應用程式 和體驗。
最近的分析支持我們的觀點,即下一波的 AI 採用將優先考慮參與式共同創作,而非被動消費。AlixPartners 的 2025 媒體與娛樂預測報告主張,AI 將提升人類創造力而非取代,並預測能夠利用 AI 工具的創意人才將出現短缺。報告指出,成功採用需要將 AI 整合到生產工作流程中,訓練團隊並尊重知識產權,而非讓 AI 完全自動化內容。同樣地,Skywork.ai 的分析解釋說,視頻編輯者並未消失,而是轉向像提示導演、AI 合規負責人和流程整合師等角色。這些角色專注於協調 AI 能力,並確保輸出符合品牌和道德標準。
《Free Press Journal》指出,Sora 2 的客串和混音文化鼓勵社交分享與合作。然而,它仍然強調視頻消費。Sora 中沒有構建遊戲或互動故事的途徑。在 Macaron,我們提議解鎖一個創作的光譜——從靜態圖像和視頻到互動迷你應用和動態模擬。用戶可以通過直觀的界面和自然語言提示,結合 LLMs 進行對話、擴散模型創建視覺效果,以及強化學習設計遊戲邏輯。
圍繞 Sora 的興奮顯示人們渴望新的敘事方式。但隨著 Sora 2 推出,關於其局限性和需要更深入互動的討論隨之而來。一些分析師甚至質疑 AI 是否能夠顛覆 TikTok。從 Macaron 的角度來看,這是個錯誤的問題。正確的問題是:AI 如何賦能用戶做的不僅僅是觀看?真正的參與來自於參與,這需要創造可以讓人們玩、探索和構建的體驗的工具。
Google 的 E‑E‑A‑T 指南(專業知識、經驗、權威性和可信賴性)同樣適用於 AI 平台。建立在 AI 生成內容之上的社交生態系統必須展示證據(來源元數據)、經驗(用戶能夠有意義地影響結果)、權威(明確的政策和道德保障)和信任(關於 AI 角色的透明性)。Sora 通過浮水印和元數據解決證據問題,而 Macaron 則旨在通過邀請用戶參與創意過程和保持嚴格的同意和內容審核,在四個領域中均表現出色。
Sora 的短片和解析度限制源於模擬複雜物理和高保真視覺效果的計算成本。隨著硬體的改進和新架構的出現,生成模型將能產生更長、更清晰且更易控制的內容。但僅僅提高能力並不能保證一個有活力的生態系統。在數位攝影的早期,高像素數曾被讚譽為突破;然而贏得消費者心的智能手機是那些擁有直覺應用、濾鏡和共享功能的,將照片轉化為社交貨幣。同樣,生成視頻模型必須嵌入在通過協作和用戶賦能來發揮其功能的平台中。
保護未成年人、尊重肖像權和避免有害內容的需求不應被視為負擔,而是設計機會。通過讓用戶控制誰可以使用他們的特寫,讓他們設置外觀偏好(例如,總是戴帽子)和啟用撤回功能,OpenAI 為同意管理樹立了榜樣。Macaron 計劃將這一理念擴展到迷你應用程序:創作者可以為他們的互動體驗指定許可條款,選擇是否允許他人改編他們的作品,並從衍生創作中分享收益。
Macaron 正在設計一個AI 增強的創作者平台,具備以下功能:
這個路線圖將消費者生態系統從一個視頻流轉變為一個創作引擎。用戶不再只是瀏覽 AI 生成的剪輯,他們積極地構建、分享和玩弄互動創作。每個小型應用都成為一個對話的開端,邀請反饋、協作和迭代。
結合文字、圖像、視頻、音頻、邏輯和互動的創作平台比僅限視頻的應用提供更豐富的體驗。例如:
隨著越來越多用戶創建和分享迷你應用,Macaron 將深入了解用戶真正想要什麼。在 Sora 的早期,我們從人們如何製作視頻提示和協作演出中學習。有了迷你應用,我們將看到哪些類型引起共鳴,哪些互動模式受歡迎,以及在哪裡出現摩擦。這些洞察將引導模型改進和平台功能。Macaron 的策略是隨時準備好擁抱技術浪潮,隨著生成模型的發展快速迭代。
當用戶掌控創作過程時,他們成為利益相關者而非消費者。他們學習新技能,表達獨特想法,並圍繞共同興趣建立社群。Macaron 的平台旨在讓非技術用戶也能夠輕鬆使用複雜的 AI 功能,讓他們利用自然語言設計出精緻的體驗。
啟用用戶生成應用的平台歷來創造了新的經濟體。Apple App Store 催生了整個行業——從手機遊戲到共乘服務。Roblox 擁有數百萬個用戶創建的遊戲,開發者賺取了數百萬美元。Macaron 的市場同樣可以支持提示工程師、AI 設計師和微型企業家,他們可以銷售迷你應用或提供定制創建服務。
AI 生成的視頻可能令人印象深刻,但往往缺乏人類創作內容的深度和獨特性。通過讓用戶構建和迭代,Macaron 促進了文化多樣性。來自不同背景的人將講述故事、設計遊戲並創建反映其經驗的教育工具。這種多樣性豐富了生態系統,確保 AI 滿足多樣化的人類需求。
互動生態系統可能比被動視頻源更能抵禦錯誤信息。當用戶參與構建和遊玩時,他們會發展批判性思維能力和主動性。他們不太可能盲目接受 AI 生成的敘述,並更可能對來源進行仔細審查。此外,在迷你應用中追溯來源和設置同意的能力有助於保持信任和問責。
在 Macaron,我們設想一個用戶不僅僅是被動生成影片,而是積極創造互動體驗的生態系統。想像一下,寫一個提示詞來生成不僅僅是一個場景,而是一個迷你遊戲。你可以說:「創建一個合作解謎遊戲,玩家一起使用不同的工具修復太空船。」Macaron 的 AI 將生成遊戲機制、圖形和規則。用戶可以調整元素、添加敘事層或與朋友分享他們的創作以獲得反饋和改進。這樣的環境促進了共同創作而非單向消費。
想像一個迷你應用,一位新進音樂家請 AI 生成一個虛擬演唱會場地。AI 可以模擬舞台燈光、觀眾反應和聲音動態,讓音樂家可以排練,並最終與其粉絲群分享互動表演。另一位用戶可能設計一個教育模擬,通過沉浸式互動故事解釋量子物理學。這些體驗不僅僅是觀看 AI 生成的影片;它們邀請參與、學習和社群互動。
我們的信念是由用戶創新的軌跡所支撐的。早期的互聯網因混搭而蓬勃發展——這些網站基於其他網站的 API 建立,將地圖與房地產列表或犯罪統計數據結合起來。iOS 和 Android 生態系統之所以繁榮,是因為用戶可以構建解決問題或提供娛樂的應用程式。像 Roblox 和 Minecraft 這樣的工具賦予社群創建和盈利他們自己的遊戲的能力。Macaron 的使命是將這種創客精神延伸到 AI 時代:用戶應能夠在最少阻力下提示、設計、測試和分發他們自己的 AI 驅動的小型應用程式。
Sora 是一項了不起的成就。它證明了大型擴散變壓器可以模擬物理、保持物體持久性並生成合理的音頻——所有這些都不需要明確的人類編程。這無疑會激勵藝術家、廣告商和教育工作者。然而,Macaron 認為未來的 AI 消費者生態系統需要的不僅僅是 AI 生成的影片。我們預見一個用戶利用 AI 創建遊戲、模擬、教育工具和藝術體驗的世界——這些小型應用程式邀請合作和對話。
Sora 的推出引起了關注和熱潮。它加速了公眾的想像力,展示了 AI 生成內容可以是美麗且引人注目的。然而,這不是終點。Macaron 正在打造一個讓用戶從觀看轉向創作的平台,從消費轉向共同創造。在這個新時代,AI 的價值不再以影片的觀看次數來衡量,而是看有多少人因此能夠實現他們的想法。我們邀請您加入我們的旅程。
[1] [16] 視頻生成模型作為世界模擬器 | OpenAI
https://openai.com/index/video-generation-models-as-world-simulators/
[2] [3] [6] [7] [8] [9] [10] [11] [24] Sora 2 登場 | OpenAI
https://openai.com/index/sora-2/
[4] Sora 登場 | OpenAI
https://openai.com/index/sora-is-here/
[5] 了解 OpenAI Sora:特點、用途和限制
https://digitalguider.com/blog/openai-sora/
[12] [15] [28] OpenAI 推出 Sora 2 AI 文本轉視頻應用:顛覆視頻創作的 5 個理由
[13] Tyler Perry 因 AI 衝擊而暫停 8 億美元的工作室擴建|人工智慧 (AI)|衛報
[14] 探索 OpenAI 的 Sora:熱潮、希望與潛在危機 | Built In
https://builtin.com/articles/navigating-hype-hope-and-doom-openai-sora
[17] [18] [19] [27] 2025 年的編輯與生成:OpenAI Sora 2 對比專業影片編輯
https://skywork.ai/blog/sora-2-vs-traditional-video-editing-2025/
[20] [21] [22] [23] 負責任地推出Sora | OpenAI
https://openai.com/index/launching-sora-responsibly/