¿Cómo usar la IA generativa ComfyUI y LTX-2 en PC con NVIDIA RTX?

ComfyUI está teniendo un gran impacto en la generación de contenido por IA y con una NVIDIA RTX es más fácil crear.
Actualmente los modelos de imagen ahora ofrecen resultados fotorrealistas de forma consistente, los modelos de video pueden generar clips largos y coherentes, y ambos pueden seguir directrices creativas.
Los creadores ejecutan cada vez más estos flujos de trabajo de forma local en PCs para mantener los activos bajo control directo, eliminar los costos de los servicios en la nube y eliminar la fricción de la iteración, lo que facilita el perfeccionamiento de los resultados al ritmo que exigen los proyectos creativos reales.
Desde su creación, las PCs con NVIDIA RTX son el sistema elegido para ejecutar la IA creativa debido a su alto rendimiento, que reduce el tiempo de iteración, y el hecho de que los usuarios pueden ejecutar modelos en ellas de forma gratuita, lo que elimina la ansiedad por los tokens.
Con las recientes optimizaciones de RTX y los nuevos modelos de open-weight presentados en CES a principios de este mes, los creativos pueden trabajar más rápido, de manera más eficiente y con un control creativo mucho mayor.
Cómo empezar a usar ComfyIU con NVIDIA RTX

Empezar a utilizar la IA generativa visual puede parecer complejo y limitante. Los generadores de IA en línea son fáciles de usar, pero ofrecen un control limitado.
Las herramientas de código abierto de la comunidad, como ComfyUI, simplifican la configuración de flujos de trabajo creativos avanzados y son fáciles de instalar. También proporcionan una forma sencilla de descargar los últimos y mejores modelos, como FLUX.2 y LTX-2, así como los mejores flujos de trabajo de la comunidad.
A continuación, se explica cómo empezar a utilizar la IA generativa visual de forma local en PCs con RTX utilizando ComfyUI y modelos populares:
- Visita comfy.org para descargar e instalar ComfyUI para Windows.
- Inicia ComfyUI.
Crea una imagen inicial usando la plantilla de inicio:
- Haz clic en el botón “Plantillas”, luego en “Introducción” y selecciona “1.1 Inicio: texto a imagen”.
- Conecta el modelo “Nodo” al “Nodo Guardar imagen”. Los nodos funcionan en una cadena para generar contenido utilizando IA.
- Presiona el botón azul “Ejecutar” y observa cómo se resalta el “Nodo” verde mientras la PC con tecnología RTX genera su primera imagen.
- Cambia el mensaje y vuelve a ejecutarlo para adentrarse más profundamente en el mundo creativo de la IA generativa visual.
Cómo mejorar la calidad de la generación de imágenes con FLUX.2-Dev:
En la sección “Plantillas” de ComfyUI, haz clic en “Todas las plantillas” y buscar “FLUX.2 Dev Text to Image”. Selecciónalo y ComfyUI cargará la colección de nodos conectados, o “Flujo de trabajo”.
Consejos para FLUX.2-Dev:
Comienza con descripciones claras y concretas del tema, el escenario, el estilo y el ambiente, por ejemplo: “Primer plano cinematográfico de un coche de carreras antiguo bajo la lluvia, reflejos de neón sobre el asfalto mojado, alto contraste, fotografía de 35 mm”. Las indicaciones cortas o medianas, de una o dos frases concisas, suelen ser más fáciles de controlar que las indicaciones largas, similares a una historia, especialmente al principio.
Agrega restricciones para garantizar la coherencia y la calidad. Especifica aspectos como:
- Encuadre (“plano general” o “retrato”)
- Nivel de detalle (“alto nivel de detalle, enfoque nítido”)
- Realismo (“fotorrealista” o “ilustración estilizada”)
Si los resultados son demasiado recargados, elimina adjetivos en lugar de agregar más.
Evita las indicaciones negativas; limítate a indicar lo que deseas.
Utiliza correctamente LTX-2

LTX-2 de Lightrick es un modelo avanzado de audio y video diseñado para la generación de video controlables, al estilo de un guion gráfico, en ComfyUI. Una vez descargadala plantilla LTX-2 Image to Video y los weights del modelo, comienza por tratar la sugerencia como una breve descripción de la toma, en lugar de como el guion completo de una película.
A diferencia de las dos primeras plantillas, LTX-2 Image to Video combina una imagen y un mensaje de texto para generar video.
Los usuarios pueden tomar una de las imágenes generadas en FLUX.2-Dev y agregar una indicación de texto para darle vida.
Consejos para las indicaciones de LTX-2:
Para obtener los mejores resultados en ComfyUI, escribe un único párrafo fluido en tiempo presente o utiliza un formato sencillo, similar al de un guion, con títulos de escena (sluglines), acción, nombres de personajes y diálogos. Intente escribir entre cuatro y seis frases descriptivas que cubran todos los aspectos clave:
- Establece la toma y la escena (plano general/medio/primer plano, iluminación, color, texturas, atmósfera).
- Describe la acción como una secuencia clara, define a los personajes con rasgos visibles y lenguaje corporal, y especifica los movimientos de cámara.
- Por último, agrega audio, como sonido ambiental, música y diálogos, utilizando comillas.
- Adapta el nivel de detalle a la escala de la toma. Por ejemplo, los primeros planos necesitan más detalles precisos sobre los personajes y las texturas que los planos generales. Sé claro sobre cómo se relaciona la cámara con el sujeto, no solo sobre dónde se mueve.
Detalles adicionales que se pueden agregar a las indicaciones:
- Lenguaje de movimiento de la cámara: especifica direcciones como “travelling lento”, “seguimiento con cámara en mano”, “toma por encima del hombro”, “panorámica”, “inclinación hacia arriba”, “acercamiento”, “alejamiento” o “fotograma estático”.
- Tipos de toma: especifica planos generales, medios o primeros planos con una iluminación cuidadosa, poca profundidad de campo y movimiento natural.
- Ritmo: Indica si deseas cámara lenta, time-lapses, tomas prolongadas, tomas continuas, fotogramas congelados o transiciones fluidas que den forma al ritmo y al tono.
- Atmósfera: agrega detalles como niebla, bruma, lluvia, luz dorada, reflejos y texturas ricas en la superficie que den solidez a la escena.
- Estilo: al principio de la indicación, especifica estilos como pictórico, cine negro, película analógica, stop-motion, bordes pixelados, editorial de moda o surrealista.
- Iluminación: Indica la iluminación de fondo, paletas de colores específicas, luz de contorno suave, destellos de lente u otros detalles de iluminación utilizando un lenguaje específico.
- Emociones: concéntrate en solicitar interpretaciones de un solo personaje con expresiones faciales claras y pequeños gestos.
- Voz y audio: pide a los personajes que hablen o canten en diferentes idiomas, con el apoyo de descripciones claras del sonido ambiental.
Más sobre NVIDIA y Tecnología. No te pierdas de nuestras noticias en Google News.
Redacción TechGames
Amamos la tecnología, nos divierten los videojuegos y de paso el ocio digital. Todo el equipo de TechGames apoya en estas notas.