Bastantes usuarios por la red han comentado que sucede que los videos promocionales son de videos cortos escenas y con pocos actores u objetos, por lo cual los resultados son muy buenos, pero cuando necesitas algo con narrativa, transición de escenas, buena animación, buena voz, efectos de sonido, etc., son más limitados.
Esto puede deberse a las limitaciones de los modelos de video generativo, que tienen muchas restricciones: continuidad visual entre fotogramas, coherencia en personajes, movimientos naturales, luz y sombras, expresiones faciales, audio sincronizado. No es sencillo generar largos vídeos con calidad cinematográfica. Muchos videos solo llegan a resoluciones medias y duraciones cortas. Para mantener alta calidad, tendrían que usar muchos recursos: GPU potentes, buena infraestructura, etc. Cuando muchos usuarios usan la plataforma, para mantener tiempos de generación razonables, pueden aplicar una disminución en la calidad que reduce fidelidad. Además, dependiendo de las políticas de contenido, de uso, de derechos de autor, etc., algunos prompts o escenas son rechazados, se censuran, o ciertos efectos no están permitidos. También depende mucho de qué tan bien construyas el prompt, cuántas iteraciones hagas, y cuánto ajustes manuales efectúes después.