Nvidia prepara una auténtica revolución en el campo de las videollamadas por medio de una nueva tecnología que será capaz de comprimirlas para evitar un mayor consumo de ancho de banda, para lo cual aplicará ciertos parámetros gracias a la inteligencia artificial.
Maxine es el nombre de la plataforma de Nvidia en la nube que la compañía ha puesto a disposición de los desarrolladores de aplicaciones de videollamadas para que puedan crear e implementar luego dichas funcionalidades ayudadas por la inteligencia artificial en sus apps.
El resultado final de lo que es capaz de hacer la plataforma Maxine de Nvidia se ha plasmado en un vídeo muy didáctico, en el que se puede observar las posibilidades de la inteligencia artificial en las videollamadas en la nube, las mejoras añadidas son bastante evidentes.
Objetivo: videoconferencias más avanzadas
Hemos visto en más de una ocasión las posibilidades de la inteligencia artificial, así como en el amplio abanico en el que pueden ser utilizada; por ejemplo, los distintos fabricantes de móviles tiran de esta tecnología para mejorar y reforzar ciertos aspectos de los sistemas fotográficos.
Lo que Nvidia pretende con Maxine es mejorar la experiencia de las videollamadas en gran medida, de modo que el usuario perciba o sienta que se trata casi de una llamada totalmente real estando cara a cara con el resto de los participantes de la videollamada.
Se trata de incluir funcionalidades avanzadas con el objetivo de que las videoconferencias sean más "reales" y de gran calidad, sobre todo ahora que forman casi parte diaria de nuestra vida, porque recordemos que las videollamadas es ahora uno de los métodos de comunicación más usado debido a la pandemia del coronavirus.
Una de las características más destacadas es la enorme compresión que sufrirán las videollamadas, en el mismo vídeo que mencionamos arriba se puede ver el gasto de banda ancha realizado en vivo, lo que permitirá que incluso las conexiones más lentas disfruten de una gran calidad en las videoconferencias. No obstante, hay muchas más características que implementará Maxine.
Menos ancho de banda, caras alineadas y más
Si bien de por sí ya las capacidades de la inteligencia artificial utilizadas en la plataforma Maxine son sorprendentes, se verán reforzadas en las GPUs Nvidia cuando las transmisiones de vídeo en directo se hagan desde la nube. Esto es de lo que sería capaz de hacer Maxine:
- Reducción de uso de banda ancha: realizando una comparación con el conocido estándar H.264, la plataforma es capaz de reducir el ancho de banda utilizado por este códec hasta 10 veces más y manteniendo una gran calidad de vídeo también más fluido.
- Realineado de caras: esta innovación de Nvidia es capaz también de incluso realinear las caras de los participantes para que siempre estén mirando de frente a la cámara, tanto en lo que se refiere a la cara como incluso los ojos, para lo que identifica una serie de puntos clave de las caras y los usa en una imagen fija que se reanima a partir de dichos puntos.
- Emojis con nuestro tono: siguiendo un poco el hilo del anterior punto, los desarrolladores podrían también implementar una galería de avatares para que el usuario pudiese elegir el que quisiese y usase su mismo tono de voz en tiempo real mientras se realiza la videollamada, como método de reemplazo de tu cara real.
- Mejora de la calidad: es posible transformar resoluciones de vídeo de baja calidad (360p, por ejemplo) es una calidad superior también en tiempo real, así se reduce el ancho de banda y se mejora al mismo tiempo la experiencia de los usuarios de la videollamada.
- Reducción de ruido, encuadre y más: la misma tecnología impulsada por la inteligencia artificial también ofrece la posibilidad de reducir el ruido de fondo en las videollamadas (algo que ya está implementado Google Meet) e incluso realizar un perfecto encuadre en la cara de la persona, que debería ser la protagonista.
- Servicios complementarios: haciendo uso de Nvidia Jarvis, tecnología de inteligencia artificial de la plataforma Maxine, se pueden integrar asistentes virtual e incluso posibilidad de respuestas con voces naturales en las videoconferencias, todo también en el transcurso de estas. No falta traducción al instante, transcripciones y subtítulos.
Las capacidades de Maxine de Nvidia, impulsadas por la inteligencia artificial, está ya a disposición de los desarrolladores que quieren aprovechar ya de todas sus posibilidades, aunque está por ver cuando los usuarios podríamos comenzar a palpar todas estas grandes mejoras.
Es decir, está por ver quiénes (empresas, creadores de servicios de vídeo y audio, fabricantes de PC, etc.) exprimirán al máximo las bondades de la plataforma Maxine, pueden solicitar un acceso de manera anticipada al servicio para comenzar a trabajar para comenzar a implementar todas las novedades en sus aplicaciones.
- Ver Comentarios