Ir al contenido principal

EMO es la impresionante IA que viene de China: vídeos a partir de una sola imagen y un archivo de voz

EMO es la impresionante IA que viene de China: vídeos a partir de una sola imagen y un archivo de voz

Cada día es una historia nueva con la IA. Si hace unas semanas era Sora, ahora es EMO la inteligencia artificial generativa que nos deja impresionados. Y al contrario de lo que suele ser habitual, en este caso no viene ni de OpenAI ni de Google ni de ninguno de los grandes actores del panorama. La nueva IA viene de China, pues ha sido presentada por Alibaba

Emote Portrait Alive (EMO) es una IA generativa que permite generar vídeos de retratos a partir de una imagen y un archivo de voz. Pero lo más llamativo es el resultado. La sincronización labial es excelente, pero también lo son las expresiones, que se adaptan en función del tono de voz

Como siempre con la IA, más vale ver los ejemplos directamente. En la página del proyecto en Github podéis encontrar múltiples ejemplos. 

Tenemos por ejemplo a Audrey Hepburn cantando Perfect de Ed Sheeran o a la mujer del vídeo de Sora hablando con la voz de Mira Murati, en lo que es claramente una referencia interna entre los equipos que se dedican a la inteligencia artificial. 

EMO ha sido desarrollado por Linrui Tian, Qi Wang, Bang Zhang y Liefeng Bo, del Instituto de Inteligencia Computacional del Grupo Alibaba. Como ocurre con Sora, por el momento se trata de una herramienta dedicada a investigación y no está disponible al público para ser utilizada. Sí comparten múltiples ejemplos con las distintas posibilidades. Además de ver cantar o hablar, también encontramos ejemplos donde a partir de una misma imagen se obtiene un vídeo de la persona enfadada, contenta o reflexiva. 

EMO puede generar vídeos de retrato de distinto tiempo, en función de la duración que tenga el archivo de audio a partir del cual se genera. Según explican los investigadores, la consistencia del personaje se mantiene durante todo el vídeo. 

Viendo los resultados es fácil pensar en el impacto que puede tener para múltiples actores. Durante la huelga se discutió sobre los derechos de imagen, pero EMO también pone el foco en la voz. Una característica igualmente única y a partir de la cual se pueden conseguir efectos impresionantes. 

En Xataka | 19 páginas y servicios para crear imágenes desde cero utilizando inteligencia artificial

-
La noticia EMO es la impresionante IA que viene de China: vídeos a partir de una sola imagen y un archivo de voz fue publicada originalmente en Xataka por Enrique Pérez .



from Xataka https://ift.tt/7ALvkli
via IFTTT

Comentarios

Entradas populares de este blog

Cómo y dónde ver online todo el fútbol 2017-18: comparativa de precios y canales

¿Ya está aquí el fútbol? Sí, ya está aquí el fútbol . El 18 de agosto comienza oficialmente en España LaLiga Santander (o la Liga de Primera División) y la Liga 1|2|3 (Segunda División). A ambas competiciones hay que sumar otras ligas europeas, que también han comenzado ya estos días, y a otras competiciones, que harán lo propio durante las próximas semanas. A continuación recopilamos cómo se distribuyen los derechos de emisión de las principales competiciones de esta temporada, así como las distintas formas de ver el fútbol online desde España . Y ya os damos una pista: por desgracia, no hay demasiadas alternativas... y cada vez son menos. Resumen de canales y derechos para la temporada 2017-2018 Canales de pago: Entre el vaivén de derechos de emisión, exclusividades y distintos canales, el ver al inicio de cada temporada quién emitirá cada competición puede complicarse en exceso. Por eso hemos simplificado al máximo para hacer un resumen de los principales canales y qué ofrecer

Asturias tiene un plan para recuperar viejas minas en desuso: que acojan instalaciones informáticas

Asturias quiere dar nueva vida a viejas minas abandonados. Y quiere hacerlo además cambiando totalmente de tercio, con un enfoque que sonaría a ciencia ficción a los operarios que pululaban por sus galerías hace décadas entre picos, carretas cargadas de carbón y faroles. El Gobierno del Principado aspira a un polo tecnológico propio y ha visto en instalaciones en desuso del Caudal, como el pozo Santiago , espacios ideales para acoger infraestructuras informáticas . A finales de junio responsables de la Consejería de Ciencia asturiana y del Centro Nacional de Supercomputación visitaron Mieres y Aller, en la comarca de Caudal, donde estudiaron sobre el terreno las galerías del pozo Santiago. Luego se trasladaron al Centro de Innovación de la Universidad de Oviedo, clave también en los planes de la comunidad autónoma. "El Principado plantea la puesta en marcha de un polo tecnológico vinculado al ámbito de la computación en la cuenca del Caudal —explicaba poco después el Gobierno

Hay dos marcas chinas arrasando en tablets. El mercado empieza a mostrar signos de recuperación

Tras dos años en caída libre , el mercado de las tablets empieza a mostrar signos de recuperación. Según IDC , se registró un incremento del 0,5% en los envíos globales en el primer trimestre de 2024, con un total de 30,8 millones de unidades. Es la primera vez desde 2021 en la que se muestran signos de mejoría, poniendo sobre la mesa IDC que los datos coinciden con el inicio de un ciclo de actualización. Apple sufrió bastante en 2024 en lo que respecta a crecimiento interanual. La compañía sigue siendo la que más tablets vende en el mundo gracias a la popularidad del iPad , pero el crecimiento interanual disminuyó en un 8,5%. Pese a ello, lograron enviar 9,9 millones de unidades, lo cual supone una cuota de mercado del 32%. Le sigue Samsung, con una cuota de mercado del 21,7% y una caída en el interanual del 5,8%. La compañía se ha mantenido discreta en lanzamientos durante finales de 2023 y comienzos de este año. Con estas dos grandes firmas en caída, las marcas chinas se