En resumen
- Gemini Omni Flash es el nuevo modelo multimodal de Google para la generación de video, pero está lleno de limitaciones que no se comunican claramente.
- El costo efectivo por clip de video utilizable puede acercarse a los 6 dólares por 10 segundos, no 1 dólar como sugiere la hoja de precios.
- El modelo aún está en vista previa pública, y las señales de la comunidad son claras: esto no está listo para una producción seria todavía.
Un hilo de discusión en Product Hunt sobre Gemini Omni Flash está comenzando a atraer atención en el submundo de la IA, y las señales son dignas de mención ANTES de que esto llegue a la prensa tecnológica general.
Google ha posicionado a Omni Flash como un modelo rápido y multimodal que puede generar y editar videos a través de una interfaz conversacional. Suena prometedor, y algunos casos de uso realmente funcionan bien. Pero hay una lista bastante larga de problemas prácticos que muchos usuarios encuentran solo después de haber pagado.
El problema más concreto se refiere al precio versus la realidad. El modelo cuesta aproximadamente 0,10 dólares por segundo de salida, lo que aparentemente produce un clip de 10 segundos por 1 dólar. Técnicamente, eso es correcto. Pero debido a que la calidad fluctúa y a menudo se necesitan 4-6 intentos por clip utilizable, el costo real se acerca a los 6 dólares por clip que realmente puedes usar para algo. Además, los usuarios con planes más económicos (20 dólares/mes) informan que alcanzan los límites diarios después de solo 3-5 videos.
Más allá del precio, existen debilidades técnicas que también generan ruido. La renderización de texto en los videos es deficiente: letreros, subtítulos y etiquetas se degradan considerablemente. Después de tres o cuatro rondas de edición en una sesión conversacional, los personajes y las escenas comienzan a perder consistencia. Y el audio se limita a la narración en off; no hay música de fondo, ni efectos de sonido.

Cabe mencionar: las señales de investigación indican que Gemini 3 Flash (un pariente cercano) mostró una tasa de alucinación del 91% en un benchmark. Es una cifra alarmante, y aunque Omni Flash es una variante diferente, es razonable ser escéptico sobre la precisión fáctica en la salida de la familia Flash en general.
¿Qué significa esto? En primer lugar, esto sigue siendo una vista previa pública, y Google es abierto sobre el hecho de que vendrán clips más largos y mejoras. Ya han duplicado los límites de video para los suscriptores Ultra después de que un error consumiera demasiados créditos. Así que hay señales de que están escuchando.
En segundo lugar, esta es una señal de advertencia temprana para cualquiera que esté considerando Omni Flash para flujos de trabajo creativos en 2026: incorpore un sólido colchón en el presupuesto y el cronograma. El modelo es interesante como dirección tecnológica —la edición de video conversacional es genuinamente emocionante— pero no está listo para la producción de nada que requiera consistencia, texto en la imagen o más de unos pocos clips por día.
Estén atentos. Estas son señales tempranas de la comunidad, no un veredicto final.
