著者: Boxu Li
人工知能は研究室から消費者生活の中心へと移行しました。ChatGPTのようなプラットフォームは、大規模言語モデルが質問に答え、エッセイを作成し、旅行を計画できることを示しました。現在、ChatGPTの背後にある会社OpenAIは、「Sora 2」で動くTikTokスタイルのアプリと、「ChatGPT Pulse」というパーソナライズされた日報といった野心的な製品で、さらなる消費者領域への進出を図っています。これらの実験は、AI企業が私たちの注意をどのようにしてより多く引きつけ、生成モデルを中心としたより粘り強いエコシステムを構築しようとしているのかを明らかにしています。日常生活に焦点を当てた機敏なAIアシスタントであるMacaronにとって、これらの動きを理解することは、自身の道を描く上で重要です。
この記事では、OpenAI の新しい消費者向け製品について、学術的かつ証拠に基づいた分析を提供します。Sora の動画生成技術と Pulse のプロアクティブなリサーチの技術的能力を検証し、OpenAI が構築しているより広範な消費者エコシステムを探ります。そして、これらの発見を Macaron の新たな戦略に結びつけます。各製品を現在の市場および財政の現実に位置付けることで、Macaron の日常生活に焦点を当てたアプローチが、信頼できる AI コンパニオンを求めるユーザーに最終的により深く共鳴する可能性がある理由についての洞察を提供します。

OpenAIのSora 2は、テキストプロンプトに基づいてリアルなクリップを生成するために設計されたアップグレードされたビデオ生成モデルです。この技術をAPIやプロフェッショナルツールを通じて提供するだけでなく、OpenAIはTikTokの縦型フィードを模倣したアプリでリリースする予定です。内部文書に基づいたEngadgetの報告によれば、アプリはスワイプでスクロールする縦型ビデオストリームを備えるとのことです。ユーザーはカメラロールから映像をアップロードできず、フィード内のすべてのビデオはAI自身によって生成されます。
この動きは、AIをオンデマンドツールからコンテンツクリエイターとしてのAIへと転換することを示しています。OpenAIは動画の供給を管理することで、合成クリエイティビティに満ちた全く新しいメディアを確立しようとしています。各クリップは10秒に制限されており、これは計算コストを管理し、手軽なエンターテインメントを維持するための制約と考えられます[1]。ユーザーはこれらのクリップに「いいね」やコメントをしたり、リミックスしたりすることができ、アプリには推薦アルゴリズムによって駆動される「For You」ページも含まれています[1]。本質的に、これはTikTokの社会的ダイナミクスを再現し、ユーザー生成コンテンツを機械生成ビジュアルに置き換えています。
AIが人間のためにAI生成コンテンツを作成しています。このビジュアルは、新しいアプリのAI専用の性質を示唆するものであり、すべてのクリップがカメラではなくプロンプトから生まれることを伝えています。
Soraアプリの最も革新的な側面の1つは、その身元確認システムです。生成された動画に自分の肖像を登場させる前に、ユーザーは顔スキャンを通じて身元を確認する必要があります。確認が完了すると、Soraはそのユーザーをフィーチャーしたクリップを生成でき、他のユーザーはそのクリップをリミックスできます。誰かの肖像が使用されるたびに、彼らは通知を受け取ります。このアプローチは、パーソナライズされたコンテンツを許可しつつ、無許可のディープフェイクを防ぐという生成動画の中心的なジレンマに対処しようとしています。
OpenAIは著作権保護も組み込んでいます。ロイターによると、権利者は自分のコンテンツがトレーニングや生成に使用されることを望まない場合、オプトアウトする必要があります[3]。アプリは、プロンプトが著作権または安全フィルターをトリガーすると、動画の生成を拒否します[4]。さらに、許可がない限り、公人の画像や動画を生成することはありません[3]。これらの安全策は創造的な可能性をいくらか制限するかもしれませんが、ディープフェイク技術にまつわる法的および倫理的な問題を避けるために不可欠です。
Soraアプリはまだ一般公開されていませんが、内部テストでは熱狂的な反応が見られました。Wiredによれば、OpenAIの社員はこのツールをあまりにも頻繁に使用しており、一部の管理者は生産性に影響を及ぼす可能性があると冗談を言うほどです。これほどの使用頻度はAI生成エンターテインメントの中毒性を示唆していますが、同時に疑問も生じます。機械生成の動画が無限に流れることで、ユーザーの生活を豊かにするのか、それとも単なる注意散漫を引き起こすのか?TikTokとは異なり、Soraのアプリには人間の創造性や予測不可能なコンテンツが欠如しており、動画が繰り返しに感じられ始めるとその持続力が制限される可能性があります。
OpenAIがTikTokを模倣する決定は孤立して行われたものではありません。Metaの「Vibes」フィードやGoogleがYouTubeにVeo 3モデルを組み込んだことは、主要なテックプレイヤーがAI生成動画をソーシャル体験に統合しようと競争していることを示しています。OpenAIはTikTokがアメリカで規制の圧力に直面している間に迅速に動いているようです。もし立法者がバイトダンスにアメリカ事業の売却を強制した場合、AIのみのフィードが一部のユーザーを引きつけるかもしれません。しかし、人間のクリエイターがいないことは、アプリが観客の関心を維持するためにAIの新規性と品質に完全に依存しなければならないことを意味します。
OpenAIのSora戦略は、AIビデオ生成を責任を持ってスケールさせることの複雑さを強調しています。同社の権利者向けのオプトアウトポリシーは、既存の法律に準拠しているかもしれませんが、AIモデルから自らの作品を除外する責任をクリエイターに転嫁しています。同時に、10秒クリップの制限は、より長いビデオが計算的に高コストであることを示唆しています。完全なソーシャルプラットフォームをサポートするには、OpenAIは巨大なGPUリソースを必要とし、同社の既に非常に高い消耗率に寄与します。
モデレーションももう一つの障害です。TikTokはコンテンツモデレーションに数十億を費やしており、それでも有害なビデオをフィルタリングできないことへの批判に直面しています。AIのみの環境では、モデレーションはユーザーコメントだけでなく、モデル自体の出力も対象にしなければなりません。OpenAIは、暴力、誤情報、虐待的なコンテンツの生成を防ぐために高度なフィルターを必要とします。したがって、Soraアプリの成功は、モデルの創造性だけでなく、そのガードレールの堅牢性にもかかっています。

OpenAIの2回目の主要な消費者向け実験は、ユーザーに個別の更新セットを積極的に提供する機能、ChatGPT Pulseです。Pulseは、ユーザーのチャット履歴、メモリ、GmailやGoogleカレンダーのようなサービスへのオプション接続を分析します。毎晩、モデルは非同期リサーチを行い、ユーザーが関心を持つトピックに関するニュース、リマインダー、要約を収集します[7]。翌朝、それを視覚カードのシリーズとして提示し、完全な会話に展開することができます[8]。
Pulseは意図的に有限です。無限スクロールを促すソーシャルフィードとは異なり、Pulseは1日1回更新され、保存されない限りカードは消えます[9]。ユーザーはカードに対していいねや良くないねのフィードバックを提供し、「キュレート」ボタンを使って将来の更新を形作ることができます[7]。このデザインは、中毒性のあるループを作らずに実行可能な情報を提供することを目指しています。
OpenAIの幹部は、PulseをエージェントAIへの第一歩として位置づけています。従来、ChatGPTは反応的で、ユーザーが質問をし、それに対する答えを得るものでした。Pulseはこの動的を変え、モデルがユーザーのニーズを予測するようにします。VentureBeatによれば、PulseはOpenAIの以前の「タスク」機能の延長であり、ユーザーが特定のアクションをスケジュールすることを可能にしました。Pulseはそのコンセプトを自動化し、アシスタントが独立して情報を収集します。企業は、将来的に調査、計画、アクションを明確な指示を待たずに実行できるエージェントを想定しています。
ユーザーエクスペリエンスの観点から見ると、PulseはAppleのSiriの提案やGoogle Now、さらにはFlipboardのようなニュース集約アプリに似ています。Tom's Guideは、Pulseがあなたの目標や習慣に合わせた朝のブリーフィングを提供し、レストランのおすすめ、会議のアジェンダ、関連ニュースを提供すると述べています [12]。これは既存のルーチンに組み込まれるように設計されており、朝一番にChatGPTを確認することを促します。
現在、PulseはChatGPT Proのサブスクライバーのみが利用可能で、月額約200米ドルを支払っています[13]。OpenAIは、Plusティアユーザーへの拡大、そして最終的には無料ユーザーへの提供を行う前にフィードバックを集めることを目指しています。この価格設定は排他的な障壁を作り出します。企業顧客やパワーユーザーは便利さを評価するかもしれませんが、高コストが機能の普及を制限しています。さらに、Pulseが個人データに基づくため、プライバシーの懸念が生じます。一部の早期観察者は、エコーチェンバーやAIによるフィルターバブルの可能性を心配しています[14]。より広い消費者層をターゲットとするMacaronにとって、このような障壁は、高価なティアの背後に機能を閉じ込めることなく、積極的な支援を提供する機会を強調しています。
Sora、Pulse、音声アシスタント、カスタムGPT、GPTストアの間で、OpenAIは包括的な消費者向けプラットフォームを構築しています。2024年1月にローンチされたGPTストアは、パートナーやコミュニティによって作成されたミニアプリのマーケットプレイスを提供しています。OpenAIは、ユーザーが300万以上のカスタムGPTを作成し、ストアには執筆や研究からプログラミングやライフスタイルまでのカテゴリが含まれると発表しました。しかし、このストアはChatGPTインターフェースを通じてアクセスされ、成熟したアプリストアの専用の発見ツールが欠けています。多くのユーザーにとって、ChatGPTはまずチャットインターフェースであり、アプリエコシステムは二の次です。
OpenAIの多様化は高価です。業界分析によると、同社は2024年に37億米ドルの収益に対して約50億米ドルの損失を出し、2025年には80億米ドルを費やすと予測されています[16]。2025年に年間経常収益が120億米ドルに達したにもかかわらず、OpenAIは2029年までキャッシュフローがプラスになることを見込んでおらず、その年に約20億米ドルの現金を生み出すことを目指しています[16]。Business Insiderはさらに、内部予測によると2023年から2028年の間に累積損失が440億米ドルに達すると報じています[17]。この支出の多くは、GPT-4やSoraのようなモデルを運用するために必要なコンピュートおよびデータセンターへの投資に向けられています。
SoraアプリとPulseの両方が暗黙の目標を示しています: ユーザーの時間をより多く確保すること。競争の激しい注意経済において、ユーザーの関心を引き続き引くプラットフォームは、サブスクリプション、アップセル、広告を通じて収益化できます。しかし、エンゲージメントと信頼の間には緊張があります。例えば、Pulseのユーザーデータへの依存は、新たなプライバシーの懸念を生む可能性があります。一方、SoraのAIのみのフィードは、真の表現というよりも合成的な娯楽と見なされるかもしれません。マカロンの課題と機会は、有用な支援を提供しつつ、操作や監視に陥らないバランスを取ることです。
マカロンは「何でもプラットフォーム」になろうとしているわけではありません。その代わりに、日常生活のサポートにおいて卓越することを目指しています。具体的には、食事プランニング、買い物の管理、家族のスケジュール、地元のおすすめなど。このフォーカスにより、食事制限、家庭の予算、個人の好みを理解する専門モデルが可能になります。これに対して、OpenAIのジェネラリストモデルは広範なタスクに最適化されています。彼らはレシピを生成したりスケジュールを提案したりすることができますが、文脈に適した、文化的に適切なアドバイスを提供するために必要な微調整が欠けているかもしれません。
OpenAI の製品群がユーザーにチャット、音声、ビデオ、ミニアプリを行き来させるのに対し、Macaron は日常のルーティンに基づいた単一の統一インターフェースを提供できます。ChatGPT、Sora、GPT ストア、さまざまなコネクターの間を行き来する認知的負担は、ユーザーを苛立たせる可能性があります。Macaron は、コア機能を中心に据え、すべてのインタラクションが日常生活に価値を加えるようにすることで、その複雑さを回避できます。
小規模な会社として、Macaron はユーザーフィードバックに基づいて迅速に反復することができます。OpenAI は規制の制約、ブランドリスク、企業パートナーの要求を考慮しなければなりません。それに対して、Macaron は、機能が響かない場合やユーザーが新たなニーズを表明した場合にすぐに方向転換できます。この機動力は、生成AIの能力が急速に進化する中で特に価値があります。
Macaronは、データ収集を最小限に抑えることで差別化できます。Pulseは、関連するカードを提供するためにユーザーのメールとカレンダーのデータへのアクセスが必要です[7]。Soraのフィードは、いいね、コメント、視聴時間を通じて行動シグナルを収集します。Macaronは、サービスを提供するために必要な情報のみを求め、データを削除する明確なオプションを提供することで、プライバシー優先の姿勢を取ることができます。AIブームのこの段階で信頼を築くことは、新しい機能を市場に出すことよりも価値があるかもしれません。
消費者AI市場はまだ不安定です。OpenAIは先行しているものの、定着する製品を見つけるためにまだ試行錯誤しています。Soraの10秒動画制限やPulseのプロティア独占性は、これらの製品がまだ大量市場向けではないことを示しています。Macaronは、数年先のロードマップを待たずに、幅広いオーディエンスに即時かつ具体的な価値を提供するこの瞬間を捉えることができます。基本的なタスクに焦点を当て、日々ユーザーを喜ばせることで、AIフィードが飽和する前に忠実なユーザーベースを確保できます。
OpenAI の TikTok のような Sora アプリと ChatGPT Pulse は、消費者 AI 分野を支配しようとする同社の野心を示しています。Sora は、最先端のビデオ生成とソーシャルメディアのメカニズムを組み合わせた、AI のみのエンターテイメントにおける大胆な実験を提示します。Pulse は、ChatGPT を積極的な支援へと押し進め、日々の要約を提供し、ユーザーをより主体的な AI との関係に導きます。しかし、これらの革新は、コンテンツのモデレーション、著作権、プライバシー、注意経済における AI の役割についての難しい質問も浮き彫りにします。
Macaron の戦略は日常生活に焦点を当てることで異なります。広大なエコシステムを構築するのではなく、料理、買い物、スケジュール管理を簡単にする 信頼できるコンパニオン になることを目指しています。この焦点は、ドメイン専門知識、インターフェースのシンプルさ、機敏性、プライバシーにおいて利点をもたらします。AI の状況が成熟するにつれて、ユーザーはすべての余暇を争うプラットフォームよりも、役に立ち控えめに感じられるアシスタントに引き寄せられるかもしれません。
Macaronのようなスタートアップが10億ドルの評価額に到達する道は、OpenAIの規模を模倣することではありません。それは、日常の人々に一貫した、信頼できる価値を提供することから生まれます。OpenAIの実験から学び、その落とし穴を避けることで、MacaronはAIが私たちのデジタル生活のあらゆる面に浸透していく中で、関連性を保つニッチを切り開くことができます。
[1] [2] [4] [6] OpenAIは、Sora 2と並んでTikTok風のソーシャルアプリをリリースする予定と報じられています。
[3] OpenAIの新しいSoraビデオジェネレーターは著作権者にオプトアウトを求める必要があるとWSJが報じる | ロイター
[5] OpenAIはAI生成動画向けのソーシャルアプリを準備中 | WIRED
https://www.wired.com/story/openai-launches-sora-2-tiktok-like-app/
[7] [8] [11] [13] ChatGPT Pulseはチャット履歴に基づいて朝の更新を届けます - Ars Technica
[9] [12] ChatGPT PulseはGoogleニュースやFlipboardに挑戦状を叩きつけます — AIがチャットを開始し、あなたのフィードをキュレーションします | Tom's Guide
https://www.tomsguide.com/ai/chatgpt-pulse-is-here-now-ai-starts-the-chat-and-curates-your-feed
[10] ChatGPT Pulseは、AIを反応的から能動的に移行させるために、日々のパーソナライズされた研究を提供します | VentureBeat
[14] OpenAIは、本当に本当にChatGPT Pulseであなたの一日を始めてほしいと思っています | The Verge
[15] GPTストアを紹介します | OpenAI
https://openai.com/index/introducing-the-gpt-store/
[16] OpenAIが年間収益120億ドルを突破:ソフトウェアのスケーリングで可能性を再定義した3年間のスプリント | SaaStr
[17] OpenAIがすぐに利益を上げることは期待できない - ビジネスインサイダー
https://www.businessinsider.com/openai-profit-funding-ai-microsoft-chatgpt-revenue-2024-10