IA Generativas

Entradas

HunyuanVideo-Avatar - Vídeo digital controlado por voz humana

HunyuanVideo-Avatar - Vídeo digital controlado por voz humana 28 de julio de 2025 En los últimos años se ha presenciado un progreso significativo en la animación humana basada en audio. Sin embargo, persisten desafíos críticos en (i) generar videos altamente dinámicos mientras se preserva la consistencia del personaje, (ii) lograr una alineación precisa de las emociones entre los personajes y el audio, y (iii) habilitar la animación basada en audio de múltiples personajes. Para abordar estos desafíos, proponemos HunyuanVideo-Avatar, un modelo basado en transformador de difusión multimodal (MM-DiT) capaz de generar simultáneamente videos dinámicos, controlables por emociones y con diálogos de múltiples personajes. Concretamente, HunyuanVideo-Avatar introduce tres innovaciones clave: (i) Un módulo de inyección de imágenes de personajes está diseñado para reemplazar el esquema convencional de condicionamiento de personajes basado en la adición, eliminando el desajuste de condiciones inher...

Weavy - Flujo de trabajo con imágenes y videos

Weavy - Flujo de trabajo con imágenes y videos 28 de julio de 2025 Convierte tu visión creativa en flujos de trabajo escalables. Accede a todos los modelos de IA y herramientas de edición profesionales en una única plataforma basada en nodos. ¿Qué es Weavy? Plataforma multimodelo con flujos de trabajo creativos basados en nodos. Ingresa a Weavy y crea un flujo de trabajo, generando imágenes y videos con los mejores modelos existentes. Con Weavy pues: Crear imágenes con GPT Image 1, Imagen 3 y 4 de Google, Flux Pro 1.1, Recraft V3, Ideogram V3 y otros modelos mas. Editar imágenes con Flux Kontext, Gemini 2.0, Runwat, entre otros. Crear videos con Veo 3, Seedance, Pixverse, Kling 1.6, Minima Hailuo y otro más. Crear imágenes 3D con Trellis, Rodin; Hunyuan 3D o Meshy. ¿Cómo funciona? Observa este video: Ejemplo En el video, hemos creado una imagen con el siguiente prompt: " Una encantadora joven bruja de larga cabellera suelta, con un elegante sombrero moderno, sent...

Julio 2025: Un mes lleno de creatividad e innovación con nuevas herramientas de IA en Proyecto Descartes

🌟 Julio 2025: Un mes lleno de creatividad e innovación con nuevas herramientas de IA en Proyecto Descartes 24 de julio de 2025 La inteligencia artificial sigue transformando la forma en que aprendemos, creamos y compartimos contenidos. Durante el mes de julio de 2025 , Proyecto Descartes ha lanzado un conjunto de herramientas que combinan entretenimiento, creatividad, reflexión crítica y recursos educativos interactivos. Te contamos qué trae cada una y por qué vale la pena probarlas. 🐱 CatGPT Meme Generator (23 de julio 2025) ¿Te gustan los memes con gatos? Esta herramienta permite generar viñetas tipo cómic protagonizadas por un gato sarcástico y algo impertinente. Solo debes escribir un tema o pregunta y CatGPT responde con su toque irónico, creando un meme en segundos. ✅ Basado en GPT‑Image‑1 y Pollinations. 🎨 No requiere registro ni descarga. 😂 Perfecto para compartir en redes sociales o en presentaciones divertidas. 🔗 Prueba CatGPT aquí: Enlace directo ...

Diseñando imágenes y videos ilimitados con RoboNeo

Diseñando imágenes y videos ilimitados con RoboNeo 23 de julio de 2025 El día 22 de julio de 2025 RoboNeo , de la compañía china Xiamen Meitu Technology, presenta su última actualización. En esta entrada presentamos algunos ejercicios realizados con esta herramienta. Diseño de imágenes Es importante, si no sabes chino, que cambies el idioma a ingles haciendo clic sobre tu perfil y seleccionando "System Settings". A continuación, presentamos las acciones que hemos realizado y los resultados obtenidos. Prompt . Dibuja una linda bruja tomando café en París Con la herramienta AI editing cambiamos el color del sombrero, haciendo inpainting sobre el sombrero y luego escrubiendo "Sombrero azul". Prompt . Crea dos imágenes de una linda bruja en una calle de México Seleccionamos la segunda y con la herramienta "Add to Chat" le pedimos "Haz esta imagen estilo realista" Con AI Extender ampliamos la segunda bruja Creando videos Prompt . Haz un video de...

Qwen3-Coder: un modelo de codificación de código abierto con 480 mil millones de parámetros

Qwen3-Coder: un modelo de codificación de código abierto con 480 mil millones de parámetros 23 de julio de 2025 Hoy anunciamos Qwen3-Coder, nuestro modelo de código más agente hasta la fecha. Qwen3-Coder está disponible en varios tamaños, pero nos complace presentar primero su variante más potente: Qwen3-Coder-480B-A35B-Instruct. Este modelo de mezcla de expertos con 480 B de parámetros y 35 B de parámetros activos admite la longitud de contexto de 256 K tokens de forma nativa y 1 M de tokens con métodos de extrapolación, ofreciendo un rendimiento excepcional tanto en tareas de codificación como de agente. Qwen3-Coder-480B-A35B-Instruct establece nuevos resultados de vanguardia entre los modelos abiertos en codificación, uso del navegador y uso de herramientas, comparables a los de Claude Sonnet 4 ( Qwen ). Además del modelo, también estamos publicando una herramienta de línea de comandos para programación agentística: Qwen Code. Bifurcado de Gemini Code, Qwen Code se ha adaptado...

Desde China, imágenes y videos gratis e ilimitados con el agente Qingyan

Desde China, imágenes y videos gratis e ilimitados con el agente Qingyan 20 de julio de 2025 IA China que podemos usar de manera totalmente gratuita y sin límites, para la aplicación de efectos con inteligencia artificial en imágenes para que cobren vida y las conviertan en animaciones de gran calidad. Incluye una chatbot, un buscador en la web, un generador de imágenes en alta resolución, un generados de videos hiperrealistas, entre otras herramientas. Ingreso a la plataforma El ingreso se hace a través de la plataforma de ChatGLM , cuyo ingreso se hace con un número telefónico. Si no quieres usar tu número personal, puedes generar un número de teléfono móvil en este enlace , en el cual seleccionas un país (Estado Unidado, por ejemplo) y un número activo. Con el número de teléfono ingresado solicitas que generer un código de verificación, que debes obtener actualizando el SMS en el enlace anterior. Un vez hayas ingresado, procede a traducir la página a español. Generación de imág...

Raphael AI: Una inteligencia artificial que transforma ideas en arte y conocimiento - gratuito e ilimitado

✨ Raphael AI: Una inteligencia artificial que transforma ideas en arte y conocimiento - gratuito e ilimitado 19 de julio de 2025 En un mundo donde la creatividad digital y la inteligencia artificial convergen cada vez más, surge Raphael AI como una propuesta innovadora que redefine lo que podemos crear y explorar. En raphaelai.org , los usuarios encuentran mucho más que una simple herramienta: es un laboratorio creativo impulsado por IA que permite convertir conceptos, textos o imágenes en auténticas obras de arte, simulaciones visuales y contenidos educativos interactivos. ¿Por qué Raphael AI? Acceso gratuito e ilimitado . Disfrute de generaciones de imágenes ilimitadas, sin registro, sin costos ocultos. Múltiples estilos y modos . Elija entre una amplia gama de estilos artísticos, que incluyen fotorrealismo, acuarela, abstracto, fantasía y más para que coincida con su visión. Totalmente personalizable . Ajusta los colores, la iluminación y la composición para crear la imagen per...

Nuevo modelo LTXV que genera videos hasta 60 segundos

Nuevo modelo LTXV que genera videos hasta 60 segundos 17 de junio de 2025 Lightricks ha lanzdo una actualización de su modelo LTXV de pesos abiertos, que ahora permite generaciones de imágenes a videos de más de 60 segundos de duración, transmitidas en tiempo real, con control de indicaciones en vivo y un rendimiento eficiente en las GPU de consumo. Detalles: El modelo transmite video en vivo a medida que lo genera, devolviendo el primer segundo instantáneamente mientras construye escenas de forma continua sin cortes. Los usuarios pueden aplicar entradas de control durante la generación, ajustando poses, profundidad y estilo a mitad de camino para una evolución dinámica de la escena. LTXV está entrenado con datos con licencia completa, con integración directa con la suite de producción de LTX Studio y la capacidad de ejecutarse de manera eficiente en dispositivos de consumo. El modelo de código abierto tiene versiones de parámetros 13B y 2B compatibles con dispositivos móviles, d...

Mistral AI desata Voxtral: ¡El fin de las limitaciones en la voz con la IA de código abierto más potente y accesible!

Mistral AI desata Voxtral: ¡El fin de las limitaciones en la voz con la IA de código abierto más potente y accesible! Mistral presentó Voxtral, una familia de modelos de comprensión de voz de código abierto y de bajo costo que combina la transcripción con capacidades nativas de preguntas y respuestas. 16 de julio de 2025 La interacción por voz ha sido la interfaz original de la humanidad, mucho antes de la escritura o la mecanografía, permitiéndonos compartir ideas, coordinar trabajos y construir relaciones. A medida que los sistemas digitales se vuelven más capaces, la voz resurge como nuestra forma más natural de interacción humano-computadora. Sin embargo, los sistemas actuales suelen ser poco fiables, propietarios y demasiado frágiles para su uso en el mundo real. Mistral AI ha llegado para cerrar esta brecha con Voxtral, un nuevo conjunto de modelos de código abierto que no solo es una alternativa, sino el nuevo estándar en la comprensión del habla. ¿Qué hace a Voxtral una r...

Kimi K2: ¿El Fin de los Gigantes de la IA? El Modelo de Código Abierto que lo Cambia Todo

Kimi K2: ¿El Fin de los Gigantes de la IA? El Modelo de Código Abierto que lo Cambia Todo Kimi K2 es el modelo más reciente de Mezcla de Expertos, con 32 mil millones de parámetros activados y un billón de parámetros totales. Logra un rendimiento de vanguardia en conocimiento de frontera, matemáticas y codificación entre modelos no pensantes. 15 de julio de 2025 "Espera... ¿esto es de código abierto?" Esa fue la reacción al ver a Kimi K2 generar una simulación 3D interactiva de la Tierra en tiempo real. No es solo una teoría o un render, sino una construcción funcional entregada de una sola vez. Prepárense para la era de la IA de código abierto con Kimi K2. Desarrollado por la compañía china Moonshot, Kimi K2 no es solo una nueva entrada en la carrera de los modelos de lenguaje grandes (LLM); podría ser el lanzamiento de código abierto más significativo en la historia de la IA. Porque Kimi K2 no está aquí solo para chatear, ¡está aquí para construir y solucionar problemas! ...

Vheer - Generador de imágenes de IA en línea gratuito e ilimitado

Vheer - Generador de imágenes de IA en línea gratuito e ilimitado Convierte texto simple o fotos comunes en impresionantes obras maestras con nuestros generadores de imágenes con IA online gratuitos. ¡Genera obras de arte con IA al instante, como un profesional! 13 de julio de 2025 Desata tu creatividad con la tecnología de generación de imágenes con IA de Vheer ! Crea imágenes impactantes en segundos con solo describir lo que quieres o personalizar tus preferencias. Ya sea que diseñes avatares de anime únicos, mejores fotos existentes o generes escenas realistas, nuestra IA generativa puede dar vida a tus ideas. Con la generación de imágenes con IA, todos pueden producir imágenes originales de alta calidad para cualquier proyecto o propósito. Texto a imagen en línea, gratuito e ilimitado Crea imágenes impactantes con el generador de texto a imagen Vheer Al. Introduce una descripción y deja que Al haga su magia. Es importante que tu prompt esté en inglés; por ejemplo, "A pretty ...