Cómo crear imágenes generadas con IA usando Copilot

Cómo crear imágenes generadas con IA usando Copilot

La inteligencia artificial es una de las tendencias más notorias del panorama tecnológico actual. Tenemos IA hasta en la sopa, como se suele decir coloquialmente en estos tiempos que corren. A costa de quitarle un poco de aliciente al tema, hay que decir que, realmente, la IA no es un invento nuevo. Los primeros movimientos en este campo ya tuvieron lugar a mediados del siglo pasado, de la mano de personajes como Alan Turing o Marvin Minsky, que fueron algunos de los llamados padres de la IA.

A modo de curiosidad tipo Trivia, decir que Marvin Minsky fue asesor de Stanley Kubrick para dar forma a la IA HAL 9000. Así que, para que te hagas una idea de lo que pretendían conseguir aquellos primeros padres de la IA, presta atención a la personalidad de HAL 9000 cuando veas esta película de culto de la ciencia ficción, que data del año 1968.

Imagen - Cómo crear imágenes generadas con IA usando Copilot

Lo que ha cambiado ahora frente a los primeros tiempos de la IA, es la potencia de cálculo de los ordenadores actuales. Las redes neuronales, por ejemplo, son un concepto ideado por investigadores como el propio Marvin Minsky. Minsky llegó a la conclusión de que, a partir de redes neuronales únicamente, no se llegarían a desarrollar máquinas inteligentes como el ser humano.

Pero, esto no impide que las redes neuronales tengan aplicaciones interesantes y útiles en campos como el procesamiento del lenguaje o el de imágenes, identificando patrones o encontrando relaciones estadísticas entre miles de millones o incluso billones de elementos.

La era de las IAs generativas

Es lo que hacen básicamente los grandes modelos de lenguaje o LLMs (por sus siglas en inglés Large Language Model), que están detrás del funcionamiento de chatbots que usan estos modelos de lenguaje como base para generar inferencias a partir de las peticiones de los usuarios (a estas peticiones se las denomina prompts).

Algunos modelos de lenguaje conocidos son ChatGPT de la empresa OpenAI en sus variantes GPT 3, GPT 3.5, GPT 4, etcétera), o Gemini de Google, Claude de Anthropic, Falcon 40B del Technology Innovation Institute o Llama de Meta (antes Facebook), por mencionar algunos. No en vano, a las IAs que se sustentan en estos modelos, se las denomina IAs generativas.

Además de los modelos de lenguaje para los chatbots, nos encontramos hoy en día con modelos de difusión, que se emplean para generar imágenes a partir de peticiones basadas en texto (prompts, de nuevo). Estos modelos de difusión se usan en tecnologías de generación de imágenes mediante IA como Stable Diffusion de Stability AI, Midjourney de la empresa homónima o DALL-E de OpenAI.

En este tutorial nos centraremos en la generación de imágenes usando el método más sencillo e inmediato: el de DALL-E a través de su integración en la herramienta Copilot de Microsoft. Stable Diffusion precisa de la instalación del modelo de IA en nuestro propio ordenador, mientras que Midjourney ofrece un modelo de uso monetizado, lo cual añade una complicación burocrática y financiera.

Creando imágenes con IA a través de Copilot de Microsoft

Tras esta introducción a la IA, ahora sí, vamos al grano con la generación de imágenes usando Copilot de Microsoft. Una tarea sencilla, entretenida y útil llegado el caso. La IA hay que manejarla con precaución, en un momento en el que aún no está definida la tecnología completamente, ni los modelos de negocio.

Copilot es la plataforma de IA de Microsoft, con diferentes modalidades de uso. Por un lado, está la versión para usuarios finales, con una modalidad de acceso gratuita (al menos de momento), integrada en el propio sistema operativo o en el navegador web. Será la que usaremos nosotros para el caso que nos ocupa.

Además, hay una versión de pago de Copilot para particulares, que se integra en las herramientas de Microsoft 365. Así como una versión corporativa que se integra en los procesos empresariales de las compañías que contraten el acceso a esta plataforma de IA, basada en la tecnología de OpenAI, la que ha ideado ChatGPT y DALL-E.

Copilot está llamado a ser un componente más de Windows, hasta el punto de que habrá ordenadores que vengan con una tecla Copilot para lanzar esta IA como una herramienta con entidad propia dentro del propio sistema operativo. En España, de momento, podemos acceder a Copilot desde un navegador web, preferentemente, desde el navegador Edge de Microsoft.

Edge es el navegador preferido por Microsoft para que interactuemos con la web y con Copilot. Podemos acceder a Copilot desde cualquier otro navegador, pero nosotros usaremos Microsoft Edge.

  1. Descarga Edge si es que no lo tienes ya instalado en tu equipo. Está disponible tanto para Windows como para Mac y dispositivos móviles.

descarga

  1. En la parte superior derecha de la ventana del navegador encontrarás el icono de Copilot. Cuando lo pulses, se desplegará una barra lateral donde encontramos los elementos de interacción con Copilot, así como con ejemplos de uso ilustrativos.

Imagen - Cómo crear imágenes generadas con IA usando Copilot

  1. La interacción principal se lleva a cabo mediante prompts de texto: peticiones escritas que describen con la mayor precisión posible la inferencia que queremos obtener, o la imagen que queremos generar.
  2. Si no has iniciado sesión en tu cuenta de Microsoft, cuando queramos crear una imagen, escribiendo, por ejemplo, "Crea una imagen de un astronauta a caballo en la superficie de la Luna", aparecerá un mensaje advirtiendo que tenemos que entrar con nuestra identidad de Microsoft.

Imagen - Cómo crear imágenes generadas con IA usando Copilot

  1. Hay un enlace que nos conduce a Image Creator, donde podremos autenticarnos con una cuenta que ya tengamos o crear una nueva. Cuando entremos en Image Creator, usando el navegador Edge, se nos invitará a que nos autentiquemos en el navegador con esas mismas credenciales. Nosotros lo hemos hecho. Facilita la tarea de acceso a todas las funciones de Copilot y de Edge.

Imagen - Cómo crear imágenes generadas con IA usando Copilot

  1. Ahora, podemos volver a la ventana de Copilot y repetir nuestro prompt anterior: "crea una imagen de un astronauta a caballo en la superficie de la Luna". En esta ocasión, la petición se completará y obtendremos una vista previa con cuatro propuestas de imágenes obtenidas a partir de nuestro prompt.

Imagen - Cómo crear imágenes generadas con IA usando Copilot

  1. Si hacemos clic sobre cualquiera de ellas, se mostrarán ampliadas en la ventana del navegador que se abrirá para interaccionar con la herramienta Designer. Las imágenes generadas son rectangulares con una resolución de 1.792 x 1.024 píxeles. Hasta hace poco eran cuadradas, de 1.024 x 1.024 píxeles. Microsoft está haciendo cambios constantes en sus herramientas de IA.
  2. Podemos guardar las imágenes usando el icono que aparece en la esquina derecha superior de cada miniatura. Además, los prompts se van guardando en nuestro historial de peticiones.
  3. La propia IA ofrece sugerencias para hacer que nuestras imágenes sean más refinadas y cercanas a lo que buscamos. También podemos hacer nuestras propias sugerencias, claro. Por ejemplo, podemos escribir: "haz que el astronauta tenga un traje de color rosa y añade unas estrellas al fondo".

Imagen - Cómo crear imágenes generadas con IA usando Copilot

  1. El resultado será más o menos ajustado a nuestra petición. Podemos seguir el proceso de refinamiento o empezar una petición nueva, etcétera. Como muestra, dejamos una de las imágenes generadas.

Imagen - Cómo crear imágenes generadas con IA usando Copilot

  1. Las posibilidades de la generación de imágenes con IA son muy interesantes. Como puedes ver, es un proceso bastante sencillo. Lo más importante es pensar un prompt suficientemente preciso como para que el resultado se acerque lo más posible a lo que queremos.
  2. Hay cursos enteros dedicados a disciplinas tan recientes como la ingeniería de prompts, aunque como punto de partida, baste decir que el secreto de un buen prompt es que esté tan detallado como sea posible. Tenemos un límite de 2.000 caracteres para nuestras descripciones.

Vete acostumbrando a Copilot

Sospechamos que Microsoft va a ser bastante pesadita con Copilot en las semanas y meses que sigan. Los ordenadores con la tecla Copilot llegarán: es una cuestión de tiempo que lo hagan. Tanto para generar imágenes como para generar inferencias de texto.

La inteligencia artificial está aquí para quedarse, al menos durante una larga temporada. Así que no está de más que nos empecemos a llevar bien con ella. No tanto como incondicionales de la misma, pero sí como usuarios conocedores de lo que se puede hacer y no se puede hacer con ella.

Comparativa: ChatGPT vs Gemini vs Copilot (gratis o pagando)

  • Ver Comentarios