Ir al contenido principal

Le he dado a Gemini 1.5 un vídeo mío haciendo ejercicio. Es capaz de convertirse en todo un entrenador personal

Le he dado a Gemini 1.5 un vídeo mío haciendo ejercicio. Es capaz de convertirse en todo un entrenador personal

La introducción hace unos días de Gemini 1.5 pasó de puntillas por la actualidad tecnológica, pero puede que este modelo de IA de Google sea mucho más interesante de lo que podría pensarse a priori. Sobre todo, por su capacidad de análisis de vídeo, una de las características que demuestran que los chatbots multimodales —que aceptan vídeo, texto o imágenes como entrada—son una evolución prometedora de los ChatGPT del mundo.

Gemini, mira cómo hago ejercicio. Mckay Wrigley, un desarrollador de soluciones de IA, explicaba en Twitter cómo se grabó un vídeo de unos 21 minutos levantando pesas y luego cargó ese vídeo en Gemini para que lo analizara. El resultado fue sorprendente.

Mi entrenador personal es una IA. Este desarrollador le pidió a Gemini 1.5 que creara un fichero JSON con el nombre de cada ejercicio, el número de series, las repeticiones por ejercicio, el peso y, sobre todo, que generase una serie de recomendaciones basadas en el vídeo. Tras setenta segundos, lo hizo a la perfección. En su opinión, la idea funcionó de forma excepcional, y era una validación de que un sistema como este podría servir como un entrenador personal basado en IA.

Y se podría combinar con otros datos. De hecho según Wrigley a esa información se le podría añadir otra como algunos datos médicos, registros de nuestra dieta, fotos con el progreso y hacer así que este chatbot se adaptase perfectamente a este ámbito para crear un entrenador personal y dietista aún más interesante.

Un buen caso de uso para la GPT Store. Este tipo de aplicación da una idea de por dónde pueden acabar yendo los tiros en la GPT Store de OpenAI. Con ChatGPT Plus se tiene acceso a esa creación de chatbots personalizados, y uno podría desde luego analizar nuestros entrenamientos físicos para luego darnos consejos tanto a la hora de perfeccionar esos ejercicios como para ir variándolos y mejorar esas rutinas.

Los chatbots multimodales prometen. La introducción de Gemini 1.5 demostró que este tipo de opción multimodal puede ser muy relevante. El modelo puede además recibir como entrada cerca de 700.000 palabras de una vez (unas 30.000 líneas de código), además de hasta 11 horas de audio y una hora de vídeo para luego analizarlas. A partir de ahí las opciones son realmente amplias tanto a la hora de analizar esas entradas como de trabajar con ellas.

Analiza y resúmeme este vídeo. Esa capacidad se demuestra fácilmente en Gemini 1.5 al pedirle que analice cualquier vídeo de YouTube para que nos lo resuma en unos cuantos puntos clave. Nosotros lo intentamos con un vídeo de nuestro canal de Xataka, pero el español de momento no está soportado, así que probamos con uno de los últimos vídeos de MKBHD. En apenas 10 segundos hizo un resumen notable del contenido. 

Imagen | John Arano

En Xataka | Hemos pedido a dos nutricionistas que evalúen a ciegas un menú semanal creado con GPT-4. Ha salido muy bien parado

-
La noticia Le he dado a Gemini 1.5 un vídeo mío haciendo ejercicio. Es capaz de convertirse en todo un entrenador personal fue publicada originalmente en Xataka por Javier Pastor .



from Xataka https://ift.tt/Al3O28m
via IFTTT

Comentarios

Entradas populares de este blog

Cómo y dónde ver online todo el fútbol 2017-18: comparativa de precios y canales

¿Ya está aquí el fútbol? Sí, ya está aquí el fútbol . El 18 de agosto comienza oficialmente en España LaLiga Santander (o la Liga de Primera División) y la Liga 1|2|3 (Segunda División). A ambas competiciones hay que sumar otras ligas europeas, que también han comenzado ya estos días, y a otras competiciones, que harán lo propio durante las próximas semanas. A continuación recopilamos cómo se distribuyen los derechos de emisión de las principales competiciones de esta temporada, así como las distintas formas de ver el fútbol online desde España . Y ya os damos una pista: por desgracia, no hay demasiadas alternativas... y cada vez son menos. Resumen de canales y derechos para la temporada 2017-2018 Canales de pago: Entre el vaivén de derechos de emisión, exclusividades y distintos canales, el ver al inicio de cada temporada quién emitirá cada competición puede complicarse en exceso. Por eso hemos simplificado al máximo para hacer un resumen de los principales canales y qué ofrecer

Asturias tiene un plan para recuperar viejas minas en desuso: que acojan instalaciones informáticas

Asturias quiere dar nueva vida a viejas minas abandonados. Y quiere hacerlo además cambiando totalmente de tercio, con un enfoque que sonaría a ciencia ficción a los operarios que pululaban por sus galerías hace décadas entre picos, carretas cargadas de carbón y faroles. El Gobierno del Principado aspira a un polo tecnológico propio y ha visto en instalaciones en desuso del Caudal, como el pozo Santiago , espacios ideales para acoger infraestructuras informáticas . A finales de junio responsables de la Consejería de Ciencia asturiana y del Centro Nacional de Supercomputación visitaron Mieres y Aller, en la comarca de Caudal, donde estudiaron sobre el terreno las galerías del pozo Santiago. Luego se trasladaron al Centro de Innovación de la Universidad de Oviedo, clave también en los planes de la comunidad autónoma. "El Principado plantea la puesta en marcha de un polo tecnológico vinculado al ámbito de la computación en la cuenca del Caudal —explicaba poco después el Gobierno

Hay dos marcas chinas arrasando en tablets. El mercado empieza a mostrar signos de recuperación

Tras dos años en caída libre , el mercado de las tablets empieza a mostrar signos de recuperación. Según IDC , se registró un incremento del 0,5% en los envíos globales en el primer trimestre de 2024, con un total de 30,8 millones de unidades. Es la primera vez desde 2021 en la que se muestran signos de mejoría, poniendo sobre la mesa IDC que los datos coinciden con el inicio de un ciclo de actualización. Apple sufrió bastante en 2024 en lo que respecta a crecimiento interanual. La compañía sigue siendo la que más tablets vende en el mundo gracias a la popularidad del iPad , pero el crecimiento interanual disminuyó en un 8,5%. Pese a ello, lograron enviar 9,9 millones de unidades, lo cual supone una cuota de mercado del 32%. Le sigue Samsung, con una cuota de mercado del 21,7% y una caída en el interanual del 5,8%. La compañía se ha mantenido discreta en lanzamientos durante finales de 2023 y comienzos de este año. Con estas dos grandes firmas en caída, las marcas chinas se