La inteligencia artificial de Nvidia podría solucionar los mayores problemas de las videollamadas

Nvidia ha anunciado una nueva plataforma de videoconferencia para desarrolladores llamado Nvidia Maxine que, se afirma, puede solucionar algunos de los problemas más comunes en las videollamadas.

Maxine procesará llamadas en la nube usando gpu de Nvidia y aumentará la calidad de las llamadas de varias maneras con la ayuda de la inteligencia artificial. Usando la IA, Maxine puede realinear las caras y miradas de las personas que llaman para que siempre estén mirando directamente a su cámara, reducir el requisito de ancho de banda para el video «hasta una décima parte de los requisitos del estándar de compresión de video en streaming H.264» transmitiendo solo «puntos faciales clave» y ampliando la resolución de los videos. Otras características disponibles en Maxine incluyen iluminación facial, traducción y transcripción en tiempo real, y avatares animados.

No todas estas características son nuevas, por supuesto. La compresión de vídeo y la transcripción en tiempo real son bastante comunes, y Microsoft y Apple han introducido la alineación de la mirada en Surface Pro X y FaceTime para garantizar que las personas mantengan contacto vi sual durante las videollamadas (aunque las características de alineación facial de Nvidia parecen una versión mucho más extrema de esto).

Advertisement

Pero Nvidia sin duda espera que su influencia en la computación en la nube y su impresionante trabajo de I+D le ayude a superar a sus competidores. La verdadera prueba, sin embargo, será ver si alguna empresa de videoconferencia establecida realmente adopta la tecnología de Nvidia. Maxine no es una plataforma de consumo, sino un conjunto de herramientas para que las empresas de terceros mejoren su propio software. Hasta ahora, sin embargo, Nvidia sólo ha anunciado una asociación – con la firma de comunicaciones Avaya, que va a utilizar características selectas de Maxine. Como se indica en la imagen de abajo, todos los principales proveedores de nubes están ofreciendo Maxine como parte de sus servicios en la nube de GPU Nvidia.

En una conferencia telefónica con los periodistas, el director general de Nvidia para medios de comunicación y entretenimiento Richard Kerris, describió a Maxine como un «anuncio realmente emocionante y muy oportuno», y destacó su compresión de video impulsada por IA como una característica particularmente útil.

«Todos hemos experimentado tiempos en los que el ancho de banda ha sido una limitación en nuestras conferencias que estamos haciendo a diario en estos días», dijo Kerris. «Si aplicamos la IA a este problema, podemos reconstruir las escenas de diferencia en ambos extremos y transmitir solamente lo que necesita transmitir, y así reducir ese ancho de banda significativamente».

Nvidia dice que su característica de compresión utiliza un método de IA conocido como redes adversarias generativas o GANs para reconstruir parcialmente las caras de los llamadores en la nube. Esta es la misma técnica utilizada en muchos deepfakes. «En lugar de transmitir toda la pantalla de píxeles, el software de IA analiza los puntos faciales clave de cada persona en una llamada y luego reanima inteligentemente la cara en el video en el otro lado», dijo la compañía en una entrada de blog. «Esto hace posible transmitir video con mucho menos datos fluyendo de ida y vuelta a través de Internet».

Como siempre con estos primeros anuncios, necesitaremos ver más de esta tecnología en acción y esperar a cualquier oferta de asociación que Nvidia haga antes de saber cuánto de un efecto tendrá esto en las videollamadas diarias. Pero el anuncio de Nvidia muestra cómo el futuro de la videoconferencia será más artificial que nunca, con IA utilizada para enderezar tu mirada e incluso reconstruir tu cara, todo en nombre de ahorrar ancho de banda.

Navarro G.
Amante de la tecnología, lector impulsivo con más de 5 años de experiencia en programación web. Ingeniero fundador de Catturados Inc y redactor de artículos y estrategias de marketing.