La IA de Bing ya no solo entiende texto, ahora también imágenes

La IA de Bing ya no solo entiende texto, ahora también imágenes

La inteligencia artificial de Bing ahora es capaz de interpretar imágenes, una novedad muy interesante que aprovecha el modelo GPT-4 de OpenAI, de manera que se abre un nuevo marco de posibilidades a la hora de que el usuario pueda obtener información muy valiosa con fotos.

Es una nueva característica que ya está implementada e irá siendo mejorada con el paso del tiempo. Bing aumenta sus capacidades de IA y Visual Search será la nueva opción que tendrán los usuarios para subir imágenes y que la tecnología pueda interpretarla para saber responderte.

Consigue el Huawei Watch Fit 3 con un regalo gratis gracias a este cupón: AGRUPOFIT3

Esto es justo lo contrario de lo que hace un bot de WhatsApp, que crea imágenes a partir de descripciones de los usuarios, algo que vimos hace algún tiempo. En vez de generar imágenes desde lo que tú le dices, es capaz de comprender las imágenes y ofrecerte lo que quieras.

El usuario solo se tiene que preocupar de dos cosas, la primera es buscar la imagen en cuestión que quiere subir para que la IA pueda comprenderla y la segunda es pensar en qué va a preguntar sobre esa imagen, puede ser cualquier cosa que se te ocurra y que se muestre en la imagen.

En el ejemplo que pone Microsoft para demostrar las virtudes de Bing con Visual Search, se sube una imagen que muestra una especie de formulario con datos y espacios para rellenar. Utilizando la modalidad “creativa” del buscador en cuanto al tipo de conversación, la respuesta es llamativa.

Se le pregunta que, a partir de la imagen, genera un código HTML con una serie de parámetros muy específicos sobre el formulario que aparece en la fotografía. Tras unos instantes desde la realización de la pregunta, la inteligencia artificial comienza a generar todo ese código.

En apenas unos segundos ha creado el código exacto en HTML del formulario, que no deja de ser una tabla, de lo que se ve en la imagen. El usuario solamente tendría ahora que crear el archivo HTML con ese código y abrirlo en un navegador para comprobar que es correcto.

Esto demuestra de lo que es capaz el nuevo modelo de interpretación de imágenes, al que le puedes preguntar cualquier cosa a partir de una imagen. Otro ejemplo sería que, a partir de una imagen de una iglesia, la IA te dijera cuál es, qué arquitectura utiliza, ideas de viajes, etc.

El abanico de posibilidades de la IA ahora se amplía con esta funcionalidad de entender del contexto de cualquier imagen, sea cual sea. Microsoft menciona que la búsqueda visual o Visual Search estará disponible en la app móvil de Bing y pronto llega a Big Chat Enterprise, probablemente también a Bing en Windows 11, el cual ya dispone de Inteligencia artificial.

Cómo tener ChatGPT en Telegram

En este artículo hay enlaces por los que recibimos una pequeña comisión por cada compra, pero esto no tiene coste extra alguno para ti. Esto no repercute en nuestras recomendaciones, que son siempre independientes y objetivas.
  • Ver Comentarios