¿Buscas imágenes perfectas? Compara los generadores de IA más populares. Desde Midjourney hasta Stable Diffusion, encuentra el que mejor se adapte a tus necesidades.
¿Cuál es el mejor generador de imágenes por IA? Puede que los generadores de imágenes tengan sólo unos pocos años, pero el mundo de la inteligencia artificial evoluciona rápidamente y las siguientes son nuestras aplicaciones favoritas.
Al igual que los mejores generadores de arte por IA, los generadores de imágenes por IA modernos crean imágenes manipulando el ruido en un proceso llamado difusión. El modelo de IA se entrena con millones o miles de millones de imágenes, cada una de las cuales se deconstruye en ruido almacenado. Cuando un usuario introduce un texto, por ejemplo, «dibújame un gato», el modelo va eliminando este ruido capa a capa, como un escultor que va picando un bloque de mármol. El resultado final es una imagen única de un gato.
La generación de imágenes por IA irrumpió en escena en 2022 con el lanzamiento de Midjourney y Stable Diffusion. Diseñadas específicamente para su uso público por personas no programadoras, acapararon la atención de los medios, los elogios de los consumidores y millones de usuarios. Desde entonces, ha habido una explosión de aplicaciones rivales generadoras de imágenes por IA que prometen la capacidad de crear casi cualquier cosa mediante el poder de las palabras. Pero, ¿cuáles merecen la pena? Hemos puesto a prueba los mejores generadores de imágenes con inteligencia artificial para ver cuál ofrece las imágenes más fotorrealistas, las herramientas de edición más creativas y la mejor relación calidad-precio.
1. Midjourney
Especificaciones
- Plan gratuito: N/A
- Planes de pago: A partir de 10 $/mes
Pros
- Texto en la imagen
- Control granular
- Fotorealismo impresionante
- Interfaz web potente
Contras
- No hay plan gratuito
Aunque Midjourney no tiene la gama de modelos o las capacidades de vídeo de las grandes plataformas como FAL, NightCafe y Leonardo, está probado y comprobado. Es un potente generador de imágenes de inteligencia artificial con altos niveles de realismo y un impresionante grado de control sobre el resultado.
Nos llevó un tiempo familiarizarnos con el gran número de parámetros y funciones disponibles en Midjourney, especialmente cuando aún funcionaba dentro de Discord, pero una vez dominados los fundamentos es una aplicación extraordinaria.
Algunos de los usuarios con más talento son capaces de crear imágenes que parecen sacadas directamente de la cámara de un teléfono. Midjourney fue uno de los primeros en resolver el problema de los dedos y ha conseguido que las personas parezcan reales. Con la versión 6.1, la empresa añadió nuevas texturas de piel para mejorar aún más el realismo humano.
Midjourney suscita cierta polémica por su negativa a revelar el origen de sus datos de entrenamiento. Muchos sospechan que gran parte de ellos proceden de imágenes de dominio público, independientemente de que cuenten con el permiso de sus creadores.
Sin embargo, lo que hace que Midjourney destaque para nosotros es el nivel de control que tienes sobre cada aspecto de la generación. Puedes utilizar comandos de parámetros para hacer referencia al estilo o a un personaje dentro de otra imagen o utilizar otros para cambiar completamente el aspecto de una imagen.
2. Leonardo
Especificaciones
- Plan gratuito: 150 imágenes
- Planes de pago: A partir de 10 $/mes
Pros
- Versión gratuita
- Modo vídeo
- Potente modelo Phoenix
- Control granular sobre la generación de imágenes
Contras
- Interfaz de usuario compleja
Leonardo comenzó su vida como una capa bien hecha para la variedad de modelos de Stable Diffusion, pero se ha convertido en mucho más que eso con la adición del nuevo y potente modelo Phoenix. Sigue contando con los modelos SD, pero los ofrece con estilos personalizados y versiones afinadas de los modelos.
Leonardo también se ha unido a Affinity y ha pasado a formar parte de la familia Canva. Los modelos básicos creados por la startup australiana de imágenes se integrarán probablemente en los productos de Canva y la venta dará a Leonardo los recursos para ampliar y crear funciones de IA generativa más impresionantes.
Ya está a la altura de los mejores. La capacidad de Leonardo para generar imágenes fotorrealistas, gracias al modelo PhotoReal perfeccionado, está casi a la altura de Midjourney y puede crear una gama de estilos con la función Elements.
Estos «elementos» son un modelo afinado que puede aplicarse antes de la generación y que dirigen la imagen que se va a crear con un aspecto determinado, como un boceto o una escultura. También tienes la posibilidad de establecer un estilo como cinematográfico, comida o larga exposición.
Lo que realmente hace que Leonardo destaque para nosotros es la combinación de una interfaz de usuario fácil de usar, mezclada con una increíble cantidad de control. Puedes añadir imágenes de referencia y establecer cómo debe utilizarlas la IA, controlar el tamaño y el diseño, e incluso añadir un fondo transparente.
La mayoría de estas características están disponibles en otras plataformas, pero Leonardo las tiene todas, así como una serie de otras características tales como la ampliación de la imagen, la generación de imágenes en vivo y una de las herramientas más creativas – la capacidad de dibujar un boceto y que la IA lo convierta en una imagen completa.
3. Ideogram
Especificaciones
- Plan gratuito: 25 prompts al día
- Planes de pago: Desde $8/mes
Pros
- Impresionante fotorrealismo
- Excelente adherencia a las instrucciones
- Texto coherente en las imágenes
Contras
- Control de detalle limitado
Ideogram es uno de nuestros generadores de imágenes de IA favoritos para uso personal. La versión 2 nos dio un nuevo conjunto de características que lo ponen a la par con Midjourney, así como algunos no disponibles en otros lugares, tales como paletas de colores y un estilo de «diseño».
Es realmente capaz de seguir instrucciones de forma precisa y de añadir texto como ningún otro modelo. Hemos sido capaces de generar carteles de cine completos, folletos y tarjetas de felicitación con texto preciso.
Con la nueva función de lienzo puedes editar y manipular las imágenes generadas con indicaciones de texto ampliadas. Esto es genial para corregir texto o diseño gráfico.
Se accede a través de un sencillo cuadro de texto, con la opción de mejorar automáticamente el texto para obtener una mejor imagen y, al mismo tiempo, es fácil de usar y potente.
Aunque resulta ideal para añadir texto a las imágenes, también tiene un toque de Midjourney en el estilo de los trabajos que genera. Puedes desactivar Magic Prompt y crear imágenes más artísticamente sencillas, o incluso añadir etiquetas de estilo personalizadas.
Magic Prompt de Ideogram es una función atractiva. Si está activada, un gran modelo lingüístico analizará tu mensaje y lo reescribirá para que sea mucho más descriptivo y se acerque más a tu visión.
Puedes ver tu sugerencia original así como la sugerencia mágica para cualquier imagen, adaptarla o utilizarla para crear una nueva imagen. También puede utilizar cualquier imagen generada como fuente para una nueva imagen.
4. Google Gemini
Especificaciones
- Plan gratuito: Sí
- Plan de pago: Generaciones adicionales por 20 $/mes
Pros
- Fácil edición
- Instrucciones posteriores
- Puede utilizar indicaciones en lenguaje natural
Contras
- Mínimo control sobre las generaciones
Google Gemini ha tenido un camino pedregoso en lo que respecta a la generación de imágenes. Utiliza la familia Imagen, desarrollada por Google DeepMind, de modelos de imagen de IA para crear imágenes con el chatbot Gemini actuando como intermediario, mejorando las indicaciones y realizando cambios.
Esto dio lugar a algunos problemas en los que se generaron imágenes inesperadas de personas. Google impidió durante un tiempo que Gemini creara imágenes de personas, reales o falsas, y limitó el despliegue de la creación de imágenes en todo el mundo hasta que se solucionó el problema.
Con el lanzamiento de Imagen 3 a principios de este año, Gemini recuperó su capacidad de creación de imágenes y, aunque sólo puede hacer fotos de formato cuadrado, sus capacidades de colaboración son lo que la hacen destacar.
Una vez obtenida la primera ronda de imágenes, puedes pedir a Gemini que cambie cualquier aspecto. En una prueba, pudimos pedirle que creara un piano de cola, que añadiera un gato a las teclas y, por último, que lo convirtiera en una banda de música con una jirafa al bajo y un perro como cantante.
5. OpenAI ChatGPT (DALL-E 3)
Especificaciones
- Plan gratuito: N/A
- Plan de pago: 20 $/mes con ChatGPT Plus
Pros
- Texto en imágenes
- Edición basada en mensajes
- Instrucciones en lenguaje natural
Contras
- No hay plan gratuito
- No siempre sigue las instrucciones
DALL-E 3 sólo está disponible en ChatGPT para quienes tengan una cuenta Plus. Hay varias formas de utilizar DALL-E en ChatGPT. Puedes acceder a él a través de la interfaz principal, a través del chatbot personalizado de DALL-E GPT o etiquetando a DALL-E en el chat principal.
El DALL-E original fue una de las primeras herramientas comerciales de IA generativa de imágenes. Inicialmente disponible como API o a través de una página dedicada a DALL-E, OpenAI la ha incluido desde entonces en su chatbot. Este es también su principal atractivo: la capacidad de hablar a través de una imagen.
Todo se basa en instrucciones de texto y utiliza un lenguaje completamente natural para la generación. Por ejemplo, puedes decirle que genere una imagen de un gato y pedirle que añada un sombrero.
Con la actualización más reciente, ahora puedes hacer clic en la imagen y editarla. Esto se hace dibujando sobre la parte que quieres cambiar y diciéndole a ChatGPT cómo cambiarla – una vez más confiando en la naturaleza conversacional del editor.
No creemos que DALL-E sea el mejor generador de imágenes por IA, pero es un buen programa para todo. Puede generar texto, puede crear imágenes fotorrealistas (con un ligero «uncanny valley») y producir obras artísticas, pero la capacidad de razonar y racionalizar sobre la imagen con texto es su gran ventaja.
Le hace falta urgentemente una actualización de la IA de imágenes. Técnicamente, GPT-4o puede crear imágenes por sí mismo sin necesidad de un tercer modelo (del mismo modo que Gemini utiliza Imagen 3 o ChatGPT utiliza actualmente DALL-E 3), pero actualmente no se le permite hacerlo por cuestiones de seguridad.
6. Adobe Firefly
Especificaciones
- Plan gratuito: Gratis con cuenta Adobe
- Plan de pago: 4,99 $/mes
Pros
- Sugerencias
- Controles flexibles
- Imágenes con licencia en los datos de entrenamiento
Contras
- Problemas con el fotorrealismo
Adobe Firefly cuenta con algunas herramientas impresionantes, como sugerencias rápidas, personalizaciones profundas para la generación de imágenes y un conjunto de datos de formación basado casi exclusivamente en imágenes de Adobe Stock.
Este último punto significa que tiene un conjunto de entrenamiento más íntegro que la mayoría de los generadores de imágenes del mercado, lo que incluso ha llevado a Adobe a ofrecer una indemnización económica por reclamaciones de derechos de autor contra imágenes generadas con Firefly.
Firefly recibió recientemente una importante actualización con la llegada del modelo Firefly 3. Con él llegaron unos grados de fotorrealismo impresionantes en comparación con el modelo anterior y unas capacidades artísticas aún mejores, que ya estaban entre las mejores.
Adobe ofrece una serie de funciones de IA generativa, como la generación de vectores, la creación de plantillas y el relleno generativo en Photoshop, todas ellas impulsadas por el modelo Firefly.
Una de las mejores funciones de Firefly es también una de las más recientes. Se llama Referencia estructural y permite trasladar el diseño de una imagen a otra.
Pronto contará incluso con un modelo de vídeo.
7. NightCafe
Especificaciones
- Plan gratuito: 5 créditos diarios gratuitos más créditos por retos y por compartir imágenes
- Plan de pago: A partir de 6 $ al mes por 100 créditos mensuales además de los créditos gratuitos
Pros
- Principiantes y expertos
- Apoyo de la comunidad
- Variedad de modelos
Contras
- Curva de aprendizaje inicial
- Interfaz de usuario liosa
NightCafe fue una de nuestras primeras introducciones al mundo de la IA generativa. Inicialmente se construyó a partir de algunos modelos personalizados y más tarde se amplió para utilizar modelos basados en Stable Diffusion que desde entonces han sido ajustados y personalizados.
Además de ofrecer acceso a una amplia variedad de modelos, como Flux, Imagen 3 de Google, Stable Diffusion, DALL-E 3 de OpenAI y ahora Ideogram, NightCafe hace que sea relativamente fácil ajustar o entrenar tus propios modelos y permite gestionar y compartir fácilmente tus creaciones.
Incluso te permite animar las fotos individuales utilizando Stable Video Diffusion y escalar imágenes utilizando una gama de modelos de escalado. Además, puedes animar con Runway Gen-3 Turbo y Luma Labs Dream Machine dentro de la misma plataforma.
Su comunidad es la verdadera salsa secreta por la que seguimos volviendo a NightCafe una y otra vez, independientemente de los nuevos modelos o servicios que se lancen. Hay concursos regulares, salas de chat y «creator jams» para nuevas ideas.
La empresa trabaja para apoyar a esa comunidad, incluso asociándose con terceras empresas para ofrecer premios y créditos gratuitos.
El sistema de créditos también es especialmente útil. Otros servicios requieren un pago mensual fijo o tienen costosos paquetes de créditos, pero NightCafe te permite comprar lo que necesites.
No es perfecto. La interfaz de usuario puede resultar recargada y el recorrido inicial puede ser desalentador, pero una vez que lo hayas usado un rato, volverás una y otra vez.
8. Freepik
Especificaciones
- Plan gratuito: 20 imágenes/día (modelos restringidos)
- Plan de pago: Desde 7 $/mes (hasta 7000 imágenes al mes)
Pros
- Facilidad de uso
- Prompt Enhancer
- Capacidades adicionales
Contras
- Limitaciones del plan gratuito
Freepik es una plataforma interesante. Originalmente conocida por su biblioteca de imágenes, se ha convertido muy rápidamente en una fuerza importante en el espacio de la inteligencia artificial. Parte de ello se debe a la adquisición de Magnific a principios de este año.
La parte de la plataforma dedicada a la generación de inteligencia artificial es increíblemente fácil de usar e intuitiva. También incluye un potenciador de indicaciones (prompt enhancer) que utiliza un amplio modelo lingüístico para mejorar tus indicaciones simplistas.
Puedes añadir filtros y elementos a la generación de imágenes, como estilos, colores e iluminación personalizados. También puedes especificar el tipo de cámara si estás haciendo una foto. A la hora de exportar dispones de un sencillo botón de ampliación que se produce automáticamente antes de ofrecer la descarga.
El conjunto de funciones va más allá de la simple generación de imágenes. Una de ellas es la mejora de bocetos mediante IA. Puedes garabatear en la pantalla y la IA convertirá tu garabato en una obra de arte o fotografía.
Además de generar, editar y dibujar, también puedes aumentar la escala de imágenes desde fuera de Freepik, ampliar el lienzo de forma similar a Photoshop y utilizar la IA para retocar imágenes existentes.
Freepik se ha convertido en un buen todoterreno de la IA, una forma de jugar con la creación de imágenes, incluso ofreciendo los últimos modelos. Dispone de todas las versiones de la familia de modelos Flux, incluida Flux 1.1 Pro, la nueva versión rápida y realista.
Pero la gran novedad es Mystic, creada por el equipo de Magnific. Se trata de una versión afinada y personalizada de Flux, perfecta para representaciones fotorrealistas de personas.
9. Luma Photon
Especificaciones
- Plan gratuito: Uso limitado, no comercial
- Planes de pago: 9,99 $, 3200 créditos, no comercial
Pros
- Fácil de colaborar con la IA
- Convierte imagen a vídeo
- Múltiples tamaños de imagen
- Instrucciones por chat
Contras
- No comercial en el plan económico
Dream Machine de Luma es más tradicionalmente una plataforma de vídeo IA, al menos así es como empezó. Con su actualización más reciente y la incorporación del modelo de imagen Photon, se ha convertido en uno de los enfoques más innovadores de la creación de IA.
El modelo Photon puede generar imágenes atractivas y es sorprendentemente creativo y personalizable a través de indicaciones complejas. Además, tiene mayor resolución por un precio inferior al de otros modelos de tamaño similar de competidores de Luma. Su gran ventaja es el cumplimiento estricto de las instrucciones y la integración con el nuevo diseño de Dream Machine, que ahora incluye imagen y vídeo.
En Dream Machine, el usuario introduce un mensaje y luego colabora con la plataforma para mejorar el mensaje y adaptar la imagen. Probamos esto en una revisión y descubrimos que la personalización hace que sea muy fácil obtener la imagen exacta que estás buscando.
Una de nuestras características favoritas de Dream Machine es la interfaz. Se parece más a un chatbot que a un generador de imágenes tradicional. Después de introducir tu mensaje obtienes el mensaje completo, así como cuatro imágenes. Las palabras clave se resaltan y se pueden personalizar rápidamente para cambiar elementos específicos de la imagen.
También puedes optar por mostrar más imágenes, hacer una lluvia de ideas, e incluso responder a la respuesta para obtener cambios específicos. Al hacer clic en responder, las imágenes generadas se cargarán en el cuadro de chat como un archivo adjunto, desde donde podrás enviarlas al editor de vídeo o cambiar la imagen con una simple pregunta en lenguaje natural.
Luma Dream Machine funciona creando «tableros» para cada tema. A continuación, puedes repetir la idea, hacer una lluvia de ideas con la IA y mantenerlo todo recopilado en un solo lugar.