Autor: Boxu Li
Cuando OpenAI presentó Sora en febrero de 2024, la comunidad de inteligencia artificial generativa estalló. Aquí estaba un modelo que podía traducir un texto en un video cinematográfico con movimientos de cámara dinámicos y objetos consistentes. El entusiasmo se intensificó en septiembre de 2025 con Sora 2, que añadió física realista, audio sincronizado y una aplicación social que anima a los usuarios a remezclar los clips de otros. De la noche a la mañana, la idea de crear cortometrajes a demanda se sintió menos como ciencia ficción y más como una realidad inminente. Ayer, OpenAI lanzó la aplicación social destinada a que los usuarios compartan su propio contenido generado por IA en la plataforma.
Macaron da la bienvenida a este progreso, pero nuestra perspectiva es clara: Sora no será la forma final del ecosistema de consumo de IA. Antes de que ChatGPT irrumpiera en internet, TikTok era la plataforma de ecosistema de consumo más exitosa en internet. La próxima ola en la era de la IA no será otra plataforma de generación de videos/compartición de contenido. La IA podrá empoderar a los usuarios para hacer mucho más. La generación de videos es importante, pero un ecosistema próspero debería permitir a los usuarios crear, colaborar y construir más allá de la visualización pasiva.
En este artículo exploramos las capacidades de Sora, analizamos su recepción y discutimos por qué Macaron cree que una plataforma más rica, participativa y poderosa definirá el ecosistema de IA para el consumidor.
La arquitectura transformadora de difusión subyacente de Sora está entrenada para modelar secuencias de video como procesos tridimensionales continuos. Durante el preentrenamiento, aprende la permanencia de objetos, la consistencia 3D y la coherencia a largo plazo. Cuando un aviso describe "una persona pintando un retrato", Sora entiende que las pinceladas deben permanecer visibles en los fotogramas posteriores y que el pintor no debe teletransportarse por la escena. Este modelado emergente del mundo es un avance significativo sobre los modelos generativos anteriores cuadro por cuadro.
En Sora 1, los usuarios podían generar clips de 20 segundos a una resolución de 1080p, unir múltiples escenas mediante storyboards e incluso convertir imágenes estáticas en metraje animado. Podían remezclar o extender videos existentes, aplicar preajustes de estilo (por ejemplo, anime, cinematográfico o vintage), repetir segmentos específicos y combinar elementos de diferentes avisos. Estas características desbloquearon nuevas formas de creatividad para equipos de marketing, educadores y aficionados.
La actualización de septiembre de 2025 de OpenAI presentó un modelo que puede simular la física con mayor fidelidad. En Sora 1, si un jugador de baloncesto fallaba un tiro, la pelota podía teletransportarse mágicamente al aro; en Sora 2, rebota de manera realista en el tablero. El modelo puede manejar hazañas complejas como rutinas de gimnasia olímpica, volteretas hacia atrás en tablas de remo y patinadores artísticos realizando triples axeles con mascotas en la cabeza. También introduce diálogos y efectos de sonido sincronizados, creando experiencias audiovisuales inmersivas. Las instrucciones de múltiples tomas permiten a los usuarios especificar movimientos de cámara, transiciones de escena y acciones de personajes a lo largo de varias tomas mientras mantienen el estado del mundo consistente.
Otra característica destacada son los cameos. Al grabar un video corto y una verificación de audio, los usuarios pueden inyectar su propia imagen o la de amigos en cualquier entorno generado por Sora. Esto significa que puedes protagonizar tu propia aventura de ciencia ficción o aparecer como un personaje en un mundo de fantasía. La aplicación Sora de OpenAI aprovecha esta característica para crear una nueva red social donde los usuarios mezclan los videos de otros y los comparten en un feed diseñado para priorizar la creación sobre el consumo pasivo.
La prensa convencional aclamó a Sora como una revolución inminente. El Free Press Journal calificó a Sora 2 como un «cambio de juego» debido a su capacidad para simular física, integrar audio y admitir cameos; la publicación predijo que los videos de IA hiperrealistas podrían rivalizar con las herramientas de producción profesionales, reduciendo las barreras para los creadores de contenido. En el entretenimiento, algunos mostraron entusiasmo por la eliminación de costosos sets o rodajes en locaciones: el cineasta Tyler Perry admitió que detuvo una expansión de estudio de 800 millones de dólares después de ver el potencial de Sora, señalando que ahora podía crear escenas virtualmente.
Sin embargo, el escepticismo creció junto con el entusiasmo. La American Bar Association levantó alarmas de que Sora podría democratizar la producción de deepfakes, permitiendo la creación de pruebas fabricadas y pornografía no consensuada. Algunos observadores de la industria advirtieron que los videos de IA casi perfectos podrían amplificar la desinformación. Los creadores de contenido y los titulares de derechos expresaron preocupaciones sobre que OpenAI permita videos generados por IA basados en material protegido por derechos de autor a menos que los propietarios se excluyan, una política que atrajo la atención de Hollywood.
Aunque Sora 2 mejora significativamente el realismo, todavía comete errores. El propio informe técnico de OpenAI reconoce que el modelo puede tener dificultades con la física compleja y, a veces, representar incorrectamente las relaciones de causa-efecto. Revisores independientes señalan que el agua puede no comportarse de manera convincente o que los objetos podrían fusionarse de manera antinatural. El modelo también está limitado a duraciones cortas (decenas de segundos) y resolución de 1080p debido a restricciones computacionales. Los cineastas profesionales aún dependen de editores no lineales para ediciones exactas por cuadro, sincronización precisa de labios y mezcla de audio de alta calidad.
OpenAI enfatiza el despliegue responsable. Cada video de Sora incluye marcas de agua visibles y metadatos C2PA para la procedencia. Las apariciones requieren el consentimiento del usuario y pueden ser revocadas, y existen protecciones más estrictas para los menores, como limitar su exposición a contenido y evitar que los adultos les envíen mensajes. Los prompts y resultados se filtran para bloquear contenido sexual, terrorista o de autolesión. Sin embargo, ninguna solución técnica puede prevenir totalmente el mal uso. La detección de deepfakes sigue siendo una carrera armamentista, y la gestión de derechos para los datos utilizados en el entrenamiento de modelos sigue sin resolverse.
Sora ingresa en un paisaje abarrotado de plataformas de video. TikTok, la aplicación de videos cortos que dominó la última era de contenido generado por usuarios, creó un feed adictivo en torno a la creatividad humana y las recomendaciones algorítmicas. Sora, por el contrario, destaca el contenido generado por IA. Los usuarios pueden encontrar inicialmente emocionante generar escenas surrealistas o protagonizar sus propias películas de IA, pero ¿será esta novedad suficiente para mantener una red social? El Jerusalem Post señala que Sora está disponible en iOS como una nueva aplicación social donde cada publicación, incluso con personas reales, es generada por IA. La pregunta es si los espectadores formarán conexiones emocionales con los videos hechos por IA como lo hacen con los creados por humanos.
Parte del éxito de TikTok es su autenticidad; los usuarios cotidianos comparten momentos reales y desordenados. Sora invierte la ecuación al permitir mini-películas pulidas a gran escala. Si bien esto democratiza la producción cinematográfica, también podría llevar a una avalancha de contenido sintético que algunos críticos llaman "basura de IA". Sin una procedencia y contexto claros, los espectadores podrían tener dificultades para confiar en lo que ven. Este déficit de confianza podría limitar el impacto cultural de los videos generados por IA a menos que las plataformas mantengan estándares de transparencia y ética.
Macaron admira la ingeniería detrás de Sora, pero creemos que construir el ecosistema de consumo de IA del futuro únicamente alrededor de videos generados por IA es miope. Crear contenido es solo una parte de lo que hace que una plataforma sea atractiva; el compartir, la colaboración y las experiencias interactivas son igualmente importantes. El énfasis de Sora en el consumo de clips pre-generados y remixes cameo puede no desbloquear todo el potencial de la creatividad del usuario. Si simplemente saltamos de una aplicación de creación de videos a otra, corremos el riesgo de repetir patrones antiguos en lugar de inventar nuevos.
Históricamente, los ecosistemas de consumo prosperan cuando ofrecen herramientas de creación abiertas. TikTok tuvo éxito no porque su tecnología fuera revolucionaria, sino porque empoderó a los usuarios para producir videos cortos y expresivos, colaborar a través de duetos y responder a tendencias. En contraste, las primeras plataformas de arte de IA que generaban imágenes estáticas no lograron formar comunidades duraderas porque los usuarios tenían poco control sobre el proceso generativo. Para superar a TikTok en la era de la IA, una plataforma debe permitir más que ver; debería dejar que las personas construyan, jueguen, hagan remixes e inventen mini-aplicaciones y experiencias que reflejen sus ideas.
Un análisis reciente respalda nuestra visión de que la próxima ola de adopción de IA priorizará la co-creación participativa en lugar del consumo pasivo. El Informe de Predicciones de Medios y Entretenimiento 2025 de AlixPartners sostiene que la IA potenciará la creatividad humana en lugar de reemplazarla, pronosticando una escasez de creativos que puedan aprovechar las herramientas de IA. El informe señala que la adopción exitosa requiere integrar la IA en los flujos de trabajo de producción, capacitar a los equipos y respetar la propiedad intelectual, en lugar de permitir que la IA automatice completamente el contenido. De manera similar, un análisis de Skywork.ai explica que los editores de video no están desapareciendo, sino que se están desplazando hacia roles como directores de indicaciones, líderes de cumplimiento de IA e integradores de flujos de trabajo. Estos roles se centran en orquestar las capacidades de la IA y garantizar que los resultados se alineen con los estándares de marca y éticos.
El Free Press Journal señala que el cameo y la cultura del remix de Sora 2 fomentan el intercambio social y la colaboración. Sin embargo, todavía se enfatiza el consumo de videos. No hay una vía para construir un juego o una historia interactiva dentro de Sora. En Macaron proponemos desbloquear un espectro de creación, desde imágenes estáticas y videos hasta miniaplicaciones interactivas y simulaciones dinámicas. Los usuarios podrían combinar LLMs para el diálogo, modelos de difusión para los visuales y aprendizaje por refuerzo para la lógica de los juegos, todo a través de interfaces intuitivas y comandos en lenguaje natural.
La emoción alrededor de Sora muestra que la gente anhela nuevas formas de contar historias. Pero tan pronto como Sora 2 se lanzó, surgieron discusiones sobre sus limitaciones y la necesidad de una interacción más profunda. Algunos analistas incluso se preguntaron si la IA podría derrocar a TikTok. Desde la perspectiva de Macaron, esta es la pregunta equivocada. La pregunta correcta es: ¿cómo puede la IA empoderar a los usuarios para hacer más que solo mirar? La verdadera participación viene de la participación, y eso requiere herramientas para crear experiencias que la gente pueda jugar, explorar y desarrollar.
Las directrices E‑E‑A‑T de Google (Experiencia, Experiencia, Autoridad y Confiabilidad) también se aplican a las plataformas de IA. Un ecosistema social basado en contenido generado por IA debe demostrar evidencia (metadatos de procedencia), experiencia (capacidad de los usuarios para dar forma significativa a los resultados), autoridad (políticas claras y salvaguardias éticas) y confianza (transparencia sobre el papel de la IA). Sora aborda la evidencia a través de marcas de agua y metadatos, pero Macaron aspira a sobresalir en las cuatro áreas al invitar a los usuarios al proceso creativo y mantener un consentimiento y moderación de contenido rigurosos.
Los clips cortos y los límites de resolución de Sora se deben al costo computacional de simular física compleja y visuales de alta fidelidad. A medida que el hardware mejora y surgen nuevas arquitecturas, los modelos generativos producirán contenido más largo, nítido y controlable. Pero aumentar la capacidad por sí sola no garantiza un ecosistema vibrante. En los primeros días de la fotografía digital, se consideraban los conteos de megapíxeles más altos como avances; sin embargo, los smartphones que conquistaron a los consumidores fueron aquellos con aplicaciones intuitivas, filtros y funciones para compartir que convertían las fotos en moneda social. De manera similar, los modelos de video generativo deben integrarse en plataformas que aprovechen sus capacidades a través de colaboración y empoderamiento del usuario.
La necesidad de proteger a los menores, respetar los derechos de imagen y evitar contenido dañino no es una carga, sino una oportunidad de diseño. Al dar a los usuarios control sobre quién puede usar su cameo, permitiéndoles establecer preferencias sobre cómo aparecen (por ejemplo, siempre usando un sombrero) y habilitando la revocación, OpenAI establece un precedente para la gestión del consentimiento. Macaron planea extender esta filosofía a las mini apps: los creadores podrían especificar términos de licencia para sus experiencias interactivas, elegir si otros pueden remezclar su trabajo y compartir ingresos de creaciones derivadas.
Macaron está diseñando una plataforma de creadores aumentada con IA con las siguientes características:
Esta hoja de ruta transforma el ecosistema de consumidores de un feed de video en un motor creativo. En lugar de que los usuarios desplacen clips generados por IA, participan activamente en la creación, compartición y juego con creaciones interactivas. Cada mini aplicación se convierte en un iniciador de conversaciones, invitando a la retroalimentación, la colaboración y la iteración.
Una plataforma de creación que combina texto, imágenes, video, audio, lógica e interactividad ofrece experiencias más ricas que una aplicación solo de video. Por ejemplo:
A medida que más usuarios crean y comparten mini aplicaciones, Macaron obtendrá información sobre lo que los usuarios realmente quieren. En los primeros días de Sora, aprendemos de cómo las personas elaboran indicaciones de video y colaboran en cameos. Con las mini aplicaciones, veremos qué géneros resuenan, qué patrones de interacción son populares y dónde surgen fricciones. Estos conocimientos guiarán las mejoras del modelo y las características de la plataforma. La estrategia de Macaron es estar preparado y abrazar las olas de la tecnología, iterando rápidamente a medida que los modelos generativos evolucionan.
Cuando los usuarios controlan el proceso creativo, se convierten en partes interesadas en lugar de consumidores. Aprenden nuevas habilidades, expresan ideas únicas y construyen comunidades en torno a intereses compartidos. La plataforma de Macaron tiene como objetivo hacer que las capacidades complejas de IA sean accesibles para usuarios no técnicos, permitiéndoles aprovechar el lenguaje natural para diseñar experiencias sofisticadas.
Las plataformas que permiten aplicaciones generadas por usuarios han creado históricamente nuevas economías. La App Store de Apple dio lugar a industrias enteras, desde los juegos móviles hasta el uso compartido de vehículos. Roblox alberga millones de juegos creados por usuarios, con desarrolladores que ganan millones de dólares. El mercado de Macaron podría apoyar de manera similar a ingenieros de prompts, diseñadores de IA y microemprendedores que venden mini aplicaciones u ofrecen servicios de creación personalizados.
Los videos generados por IA pueden ser impresionantes, pero a menudo carecen de la profundidad e idiosincrasia del contenido creado por humanos. Al dar a los usuarios la capacidad de construir e iterar, Macaron fomenta la diversidad cultural. Personas de diferentes orígenes contarán historias, diseñarán juegos y crearán herramientas educativas que reflejen sus experiencias. Esta diversidad enriquece el ecosistema y asegura que la IA sirva a las variadas necesidades humanas.
Un ecosistema interactivo puede ser más resiliente a la desinformación que un feed de video pasivo. Cuando los usuarios participan en la construcción y el juego, desarrollan habilidades de pensamiento crítico y un sentido de responsabilidad. Es menos probable que acepten narrativas generadas por IA sin cuestionarlas y más probable que examinen las fuentes. Además, la capacidad de rastrear el origen y establecer el consentimiento dentro de las mini aplicaciones ayuda a mantener la confianza y la responsabilidad.
En Macaron, imaginamos un ecosistema donde los usuarios van más allá de la generación pasiva de videos y crean experiencias interactivas de manera activa. Imagina escribir un comando para generar no solo una escena, sino un mini juego. Podrías decir: "Crea un rompecabezas cooperativo donde los jugadores trabajen juntos para reparar una nave espacial usando diferentes herramientas". La IA de Macaron generaría la mecánica del juego, los gráficos y las reglas. Los usuarios podrían ajustar elementos, añadir capas narrativas o compartir sus creaciones con amigos para recibir comentarios y mejorar. Un entorno así fomenta la co-creación en lugar del consumo unidireccional.
Considera una mini-aplicación donde un músico en ciernes le pide a la IA que genere un lugar de concierto virtual. La IA podría simular la iluminación del escenario, las reacciones del público y la dinámica de sonido, permitiendo al músico ensayar y eventualmente compartir actuaciones interactivas con su base de fans. Otro usuario podría diseñar una simulación educativa que explique la física cuántica a través de una historia inmersiva e interactiva. Estas experiencias van más allá de ver un video generado por IA; invitan a la participación, el aprendizaje y la comunidad.
Nuestra convicción está respaldada por la trayectoria de la innovación de los usuarios. El internet temprano prosperó con los mashups: sitios web construidos sobre las APIs de otros sitios, combinando mapas con listados de bienes raíces o estadísticas de criminalidad. Los ecosistemas de iOS y Android florecieron porque los usuarios podían crear aplicaciones que resolvían problemas o entretenían. Herramientas como Roblox y Minecraft empoderan a las comunidades para crear y monetizar sus propios juegos. La misión de Macaron es extender este espíritu creador a la era de la IA: los usuarios deberían poder solicitar, diseñar, probar y distribuir sus propias mini aplicaciones impulsadas por IA con mínima fricción.
Sora es un logro notable. Demuestra que los grandes transformadores de difusión pueden simular física, mantener la permanencia de los objetos y producir audio plausible, todo sin programación humana explícita. Sin duda, inspirará a artistas, anunciantes y educadores. Sin embargo, Macaron cree que el ecosistema de consumidores de IA del futuro exige más que videos generados por IA. Prevemos un mundo donde los usuarios aprovechen la IA para crear juegos, simulaciones, herramientas educativas y experiencias artísticas: mini aplicaciones que inviten a la colaboración y la conversación.
El lanzamiento de Sora ha captado la atención y generado olas de calor. Ha acelerado la imaginación del público y demostrado que el contenido generado por IA puede ser hermoso y cautivador. Sin embargo, esto no es el final. Macaron está construyendo una plataforma donde los usuarios pasan de ser espectadores a creadores, de consumir a co-crear. En esta nueva era, el valor de la IA se medirá no por cuántas vistas tiene un video, sino por cuántas personas empodera para dar vida a sus ideas. Te invitamos a unirte a nosotros en este viaje.
[1] [16] Modelos de generación de video como simuladores del mundo | OpenAI
https://openai.com/index/video-generation-models-as-world-simulators/
[2] [3] [6] [7] [8] [9] [10] [11] [24] Sora 2 está aquí | OpenAI
https://openai.com/index/sora-2/
[4] Sora está aquí | OpenAI
https://openai.com/index/sora-is-here/
[5] Entendiendo OpenAI Sora: Características, Usos y Limitaciones
https://digitalguider.com/blog/openai-sora/
[12] [15] [28] OpenAI lanza la aplicación de texto a video Sora 2: 5 razones por las que es un cambio de juego en la creación de videos
[13] Tyler Perry detiene la expansión de su estudio de $800 millones después de quedar sorprendido por la IA | Inteligencia artificial (IA) | The Guardian
[14] Navegando el Hype, la Esperanza y el Apocalipsis de Sora de OpenAI | Built In
https://builtin.com/articles/navigating-hype-hope-and-doom-openai-sora
[17] [18] [19] [27] Edición vs Generación en 2025: OpenAI Sora 2 vs Edición de Video Profesional
https://skywork.ai/blog/sora-2-vs-traditional-video-editing-2025/
[20] [21] [22] [23] Lanzamiento responsable de Sora | OpenAI
https://openai.com/index/launching-sora-responsibly/
[25] [26] IA en Industrias Creativas: Mejorando, en lugar de reemplazar, la creatividad humana en TV y cine | AlixPartners