IA Generativas

Entradas

GLM-4.5: La Nueva Frontera de la Inteligencia Artificial Abierta y Accesible de Z.ai

GLM-4.5: La Nueva Frontera de la Inteligencia Artificial Abierta y Accesible de Z.ai 29 de julio de 2025 El panorama de la inteligencia artificial evoluciona a un ritmo vertiginoso, y un actor clave está redefiniendo lo que es posible en el campo de los modelos de lenguaje a gran escala: Z.ai . Recientemente, el lunes 28 de julio de 2025, la startup china Zhipu AI lanzó su nuevo modelo insignia, GLM-4.5 , y su serie asociada, marcando un avance técnico significativo al integrar capacidades avanzadas de razonamiento, generación de código e interacción con agentes . Un Vistazo Profundo al GLM-4.5: Arquitectura y Capacidades Los modelos GLM-4.5 y GLM-4.5-Air son los buques insignia más recientes de Z.ai, diseñados específicamente como modelos fundacionales para aplicaciones orientadas a agentes . Ambos aprovechan una arquitectura de Mezcla de Expertos (MoE) . El GLM-4.5 cuenta con un total de 355 mil millones de parámetros , con 32 mil millones de parámetros activos por pasada de ...

Wan2.2: ¡La IA que Pone el Cine en tus Manos, Gratis!

Wan2.2: ¡La IA que Pone el Cine en tus Manos, Gratis! 29 de julio de 2025 ¡Prepárense para la revolución en la creación de videos con IA! Alibaba ha lanzado Wan2.2 , un modelo de inteligencia artificial gratuito y de código abierto que promete calidad cinematográfica y accesibilidad para todos los creadores. Desarrollado por el laboratorio Tongyi Lab de Alibaba, Wan2.2 es una mejora significativa sobre su predecesor, Wan2.1, ofreciendo capacidades avanzadas para generar videos a partir de texto o imágenes. Con licencia Apache 2.0 , esta herramienta es completamente gratuita y de código abierto, lo que la convierte en una opción potente tanto para creadores independientes como para investigadores y empresas. Aquí te presentamos las novedades e innovaciones que hacen de Wan2.2 una herramienta revolucionaria: Arquitectura Mixture-of-Experts (MoE) Efectiva : Wan2.2 introduce la arquitectura MoE en los modelos de difusión de video. Esto significa que el trabajo del modelo se reparte e...

HunyuanVideo-Avatar - Vídeo digital controlado por voz humana

HunyuanVideo-Avatar - Vídeo digital controlado por voz humana 28 de julio de 2025 En los últimos años se ha presenciado un progreso significativo en la animación humana basada en audio. Sin embargo, persisten desafíos críticos en (i) generar videos altamente dinámicos mientras se preserva la consistencia del personaje, (ii) lograr una alineación precisa de las emociones entre los personajes y el audio, y (iii) habilitar la animación basada en audio de múltiples personajes. Para abordar estos desafíos, proponemos HunyuanVideo-Avatar, un modelo basado en transformador de difusión multimodal (MM-DiT) capaz de generar simultáneamente videos dinámicos, controlables por emociones y con diálogos de múltiples personajes. Concretamente, HunyuanVideo-Avatar introduce tres innovaciones clave: (i) Un módulo de inyección de imágenes de personajes está diseñado para reemplazar el esquema convencional de condicionamiento de personajes basado en la adición, eliminando el desajuste de condiciones inher...

Weavy - Flujo de trabajo con imágenes y videos

Weavy - Flujo de trabajo con imágenes y videos 28 de julio de 2025 Convierte tu visión creativa en flujos de trabajo escalables. Accede a todos los modelos de IA y herramientas de edición profesionales en una única plataforma basada en nodos. ¿Qué es Weavy? Plataforma multimodelo con flujos de trabajo creativos basados en nodos. Ingresa a Weavy y crea un flujo de trabajo, generando imágenes y videos con los mejores modelos existentes. Con Weavy pues: Crear imágenes con GPT Image 1, Imagen 3 y 4 de Google, Flux Pro 1.1, Recraft V3, Ideogram V3 y otros modelos mas. Editar imágenes con Flux Kontext, Gemini 2.0, Runwat, entre otros. Crear videos con Veo 3, Seedance, Pixverse, Kling 1.6, Minima Hailuo y otro más. Crear imágenes 3D con Trellis, Rodin; Hunyuan 3D o Meshy. ¿Cómo funciona? Observa este video: Ejemplo En el video, hemos creado una imagen con el siguiente prompt: " Una encantadora joven bruja de larga cabellera suelta, con un elegante sombrero moderno, sent...

Julio 2025: Un mes lleno de creatividad e innovación con nuevas herramientas de IA en Proyecto Descartes

🌟 Julio 2025: Un mes lleno de creatividad e innovación con nuevas herramientas de IA en Proyecto Descartes 24 de julio de 2025 La inteligencia artificial sigue transformando la forma en que aprendemos, creamos y compartimos contenidos. Durante el mes de julio de 2025 , Proyecto Descartes ha lanzado un conjunto de herramientas que combinan entretenimiento, creatividad, reflexión crítica y recursos educativos interactivos. Te contamos qué trae cada una y por qué vale la pena probarlas. 🐱 CatGPT Meme Generator (23 de julio 2025) ¿Te gustan los memes con gatos? Esta herramienta permite generar viñetas tipo cómic protagonizadas por un gato sarcástico y algo impertinente. Solo debes escribir un tema o pregunta y CatGPT responde con su toque irónico, creando un meme en segundos. ✅ Basado en GPT‑Image‑1 y Pollinations. 🎨 No requiere registro ni descarga. 😂 Perfecto para compartir en redes sociales o en presentaciones divertidas. 🔗 Prueba CatGPT aquí: Enlace directo ...

Diseñando imágenes y videos ilimitados con RoboNeo

Diseñando imágenes y videos ilimitados con RoboNeo 23 de julio de 2025 El día 22 de julio de 2025 RoboNeo , de la compañía china Xiamen Meitu Technology, presenta su última actualización. En esta entrada presentamos algunos ejercicios realizados con esta herramienta. Diseño de imágenes Es importante, si no sabes chino, que cambies el idioma a ingles haciendo clic sobre tu perfil y seleccionando "System Settings". A continuación, presentamos las acciones que hemos realizado y los resultados obtenidos. Prompt . Dibuja una linda bruja tomando café en París Con la herramienta AI editing cambiamos el color del sombrero, haciendo inpainting sobre el sombrero y luego escrubiendo "Sombrero azul". Prompt . Crea dos imágenes de una linda bruja en una calle de México Seleccionamos la segunda y con la herramienta "Add to Chat" le pedimos "Haz esta imagen estilo realista" Con AI Extender ampliamos la segunda bruja Creando videos Prompt . Haz un video de...

Qwen3-Coder: un modelo de codificación de código abierto con 480 mil millones de parámetros

Qwen3-Coder: un modelo de codificación de código abierto con 480 mil millones de parámetros 23 de julio de 2025 Hoy anunciamos Qwen3-Coder, nuestro modelo de código más agente hasta la fecha. Qwen3-Coder está disponible en varios tamaños, pero nos complace presentar primero su variante más potente: Qwen3-Coder-480B-A35B-Instruct. Este modelo de mezcla de expertos con 480 B de parámetros y 35 B de parámetros activos admite la longitud de contexto de 256 K tokens de forma nativa y 1 M de tokens con métodos de extrapolación, ofreciendo un rendimiento excepcional tanto en tareas de codificación como de agente. Qwen3-Coder-480B-A35B-Instruct establece nuevos resultados de vanguardia entre los modelos abiertos en codificación, uso del navegador y uso de herramientas, comparables a los de Claude Sonnet 4 ( Qwen ). Además del modelo, también estamos publicando una herramienta de línea de comandos para programación agentística: Qwen Code. Bifurcado de Gemini Code, Qwen Code se ha adaptado...

Desde China, imágenes y videos gratis e ilimitados con el agente Qingyan

Desde China, imágenes y videos gratis e ilimitados con el agente Qingyan 20 de julio de 2025 IA China que podemos usar de manera totalmente gratuita y sin límites, para la aplicación de efectos con inteligencia artificial en imágenes para que cobren vida y las conviertan en animaciones de gran calidad. Incluye una chatbot, un buscador en la web, un generador de imágenes en alta resolución, un generados de videos hiperrealistas, entre otras herramientas. Ingreso a la plataforma El ingreso se hace a través de la plataforma de ChatGLM , cuyo ingreso se hace con un número telefónico. Si no quieres usar tu número personal, puedes generar un número de teléfono móvil en este enlace , en el cual seleccionas un país (Estado Unidado, por ejemplo) y un número activo. Con el número de teléfono ingresado solicitas que generer un código de verificación, que debes obtener actualizando el SMS en el enlace anterior. Un vez hayas ingresado, procede a traducir la página a español. Generación de imág...

Raphael AI: Una inteligencia artificial que transforma ideas en arte y conocimiento - gratuito e ilimitado

✨ Raphael AI: Una inteligencia artificial que transforma ideas en arte y conocimiento - gratuito e ilimitado 19 de julio de 2025 En un mundo donde la creatividad digital y la inteligencia artificial convergen cada vez más, surge Raphael AI como una propuesta innovadora que redefine lo que podemos crear y explorar. En raphaelai.org , los usuarios encuentran mucho más que una simple herramienta: es un laboratorio creativo impulsado por IA que permite convertir conceptos, textos o imágenes en auténticas obras de arte, simulaciones visuales y contenidos educativos interactivos. ¿Por qué Raphael AI? Acceso gratuito e ilimitado . Disfrute de generaciones de imágenes ilimitadas, sin registro, sin costos ocultos. Múltiples estilos y modos . Elija entre una amplia gama de estilos artísticos, que incluyen fotorrealismo, acuarela, abstracto, fantasía y más para que coincida con su visión. Totalmente personalizable . Ajusta los colores, la iluminación y la composición para crear la imagen per...

Nuevo modelo LTXV que genera videos hasta 60 segundos

Nuevo modelo LTXV que genera videos hasta 60 segundos 17 de junio de 2025 Lightricks ha lanzdo una actualización de su modelo LTXV de pesos abiertos, que ahora permite generaciones de imágenes a videos de más de 60 segundos de duración, transmitidas en tiempo real, con control de indicaciones en vivo y un rendimiento eficiente en las GPU de consumo. Detalles: El modelo transmite video en vivo a medida que lo genera, devolviendo el primer segundo instantáneamente mientras construye escenas de forma continua sin cortes. Los usuarios pueden aplicar entradas de control durante la generación, ajustando poses, profundidad y estilo a mitad de camino para una evolución dinámica de la escena. LTXV está entrenado con datos con licencia completa, con integración directa con la suite de producción de LTX Studio y la capacidad de ejecutarse de manera eficiente en dispositivos de consumo. El modelo de código abierto tiene versiones de parámetros 13B y 2B compatibles con dispositivos móviles, d...

Mistral AI desata Voxtral: ¡El fin de las limitaciones en la voz con la IA de código abierto más potente y accesible!

Mistral AI desata Voxtral: ¡El fin de las limitaciones en la voz con la IA de código abierto más potente y accesible! Mistral presentó Voxtral, una familia de modelos de comprensión de voz de código abierto y de bajo costo que combina la transcripción con capacidades nativas de preguntas y respuestas. 16 de julio de 2025 La interacción por voz ha sido la interfaz original de la humanidad, mucho antes de la escritura o la mecanografía, permitiéndonos compartir ideas, coordinar trabajos y construir relaciones. A medida que los sistemas digitales se vuelven más capaces, la voz resurge como nuestra forma más natural de interacción humano-computadora. Sin embargo, los sistemas actuales suelen ser poco fiables, propietarios y demasiado frágiles para su uso en el mundo real. Mistral AI ha llegado para cerrar esta brecha con Voxtral, un nuevo conjunto de modelos de código abierto que no solo es una alternativa, sino el nuevo estándar en la comprensión del habla. ¿Qué hace a Voxtral una r...