Ir al contenido principal

Code Llama 70B es el nuevo modelo de IA de Meta para programar. Está a un paso de superar a GPT-4

Code Llama 70B es el nuevo modelo de IA de Meta para programar. Está a un paso de superar a GPT-4

Programar jamás fue tan fácil. Los modelos de IA generativa que actúan como asistentes de los desarrolladores siguen avanzando sin parar, y tras la aparición de plataformas como GitHub Copilot han empezado a surgir más y más alternativas. La última, desarrollada por Meta, es especialmente prometedora por un factor clave: su licencia Open Source —más o menos— permite usarla gratuitamente.

Code Llama 70B. En Meta siguen avanzando en el desarrollo de modelos de IA generativa. El último de ellos es Code Llama 70B, que según ellos es su modelo de IA generadora de código "más grande y que mejor se comporta". Es una evolución del modelo que apareció en agosto de 2023.

Tú pides, él programa. Este gran modelo de lenguaje (LLM) permite que mediante prompts de texto podamos generar código de todo tipo. Según los responsables de Meta, "Code Llama tiene el potencial para ser usado como una herramienta educativa y de productividad para ayudar a los programadores a escribir software más robusto y bien documentado".

Entrenamiento específico. El modelo es una versión especializada de Llama 2 (que compite con GPT-3.5 y GPT-4) que se creó entrenando este último modelo de forma específica con repositorios de código. Code Llama 70B puede generar tanto código como lenguaje natural sobre el código —por ejemplo, para explicar qué hace cierta función— y puede ser utilizado tanto para completar el desarrollo de nuestro código como para depurarlo.

Tokens a gogó. Entre los lenguajes soportados están Python, C++, Java, PHP, Typescript (Javascript), C# y Bash. El modelo está disponible en cuatro tamaños distintos: 7B (pensado para funcionar en local, basta una GPU), 13B, 34B y 70B, y cada uno de estos modelos está entrenado con 500.000 millones de tokens de código, salvo el modelo 70B, que ha sido entrenado con un billón de parámetros.

Punt El comportamiento del modelo Code Llama 70B ha sido fantástico en las pruebas.

Contexto gigante. Estos modelos también aceptan una ventana de contexto enorme de hasta 100.000 tokens. Un token equivale normalmente a una palabra o pequeño grupo de palabras, así que este sistema es capaz de aceptar una gran cantidad de código para luego trabajar sobre él.

Modelos especializados. En Meta indican que además del modelo genérico, Code Llama 70B, han añadido "Code Llama - Python" especializado en código en este lenguaje, y también "Code Llama - Instruct", más orientado a continuar el proceso de entrenamiento del modelo para entender mejor los prompts y lo que el usuario necesita.

Resultados fantásticos. Las pruebas que permiten evaluar el rendimiento de Code Llama 70B en el ámbito de la programación demuestran que este modelo se comporta de forma notable. Han usado tanto HumanEval como Mostly Basic Python Programming, y en ambos el modelo de Meta supera a GPT-3.5 y se acerca al rendimiento de GPT-4, el modelo más capaz de OpenAI.

Disponible ya mismo. Como sucede con Llama 2, este modelo también está disponible tanto en plataformas que facilitan su uso directo —Hugging Face es una de las destacadas— como vía su repositorio en GitHub. Su uso es gratuito y libre tanto con fines personales como comerciales, algo que desde luego plantea una alternativa muy interesante a herramientas de pago similares.

En Xataka | "Nos equivocamos": la IA de OpenAI era demasiado abierta, así que en GPT-4 impera el secretismo absoluto

-
La noticia Code Llama 70B es el nuevo modelo de IA de Meta para programar. Está a un paso de superar a GPT-4 fue publicada originalmente en Xataka por Javier Pastor .



from Xataka https://ift.tt/ohMX143
via IFTTT

Comentarios

Entradas populares de este blog

Cómo y dónde ver online todo el fútbol 2017-18: comparativa de precios y canales

¿Ya está aquí el fútbol? Sí, ya está aquí el fútbol . El 18 de agosto comienza oficialmente en España LaLiga Santander (o la Liga de Primera División) y la Liga 1|2|3 (Segunda División). A ambas competiciones hay que sumar otras ligas europeas, que también han comenzado ya estos días, y a otras competiciones, que harán lo propio durante las próximas semanas. A continuación recopilamos cómo se distribuyen los derechos de emisión de las principales competiciones de esta temporada, así como las distintas formas de ver el fútbol online desde España . Y ya os damos una pista: por desgracia, no hay demasiadas alternativas... y cada vez son menos. Resumen de canales y derechos para la temporada 2017-2018 Canales de pago: Entre el vaivén de derechos de emisión, exclusividades y distintos canales, el ver al inicio de cada temporada quién emitirá cada competición puede complicarse en exceso. Por eso hemos simplificado al máximo para hacer un resumen de los principales canales y qué ofrecer

Asturias tiene un plan para recuperar viejas minas en desuso: que acojan instalaciones informáticas

Asturias quiere dar nueva vida a viejas minas abandonados. Y quiere hacerlo además cambiando totalmente de tercio, con un enfoque que sonaría a ciencia ficción a los operarios que pululaban por sus galerías hace décadas entre picos, carretas cargadas de carbón y faroles. El Gobierno del Principado aspira a un polo tecnológico propio y ha visto en instalaciones en desuso del Caudal, como el pozo Santiago , espacios ideales para acoger infraestructuras informáticas . A finales de junio responsables de la Consejería de Ciencia asturiana y del Centro Nacional de Supercomputación visitaron Mieres y Aller, en la comarca de Caudal, donde estudiaron sobre el terreno las galerías del pozo Santiago. Luego se trasladaron al Centro de Innovación de la Universidad de Oviedo, clave también en los planes de la comunidad autónoma. "El Principado plantea la puesta en marcha de un polo tecnológico vinculado al ámbito de la computación en la cuenca del Caudal —explicaba poco después el Gobierno

Hay dos marcas chinas arrasando en tablets. El mercado empieza a mostrar signos de recuperación

Tras dos años en caída libre , el mercado de las tablets empieza a mostrar signos de recuperación. Según IDC , se registró un incremento del 0,5% en los envíos globales en el primer trimestre de 2024, con un total de 30,8 millones de unidades. Es la primera vez desde 2021 en la que se muestran signos de mejoría, poniendo sobre la mesa IDC que los datos coinciden con el inicio de un ciclo de actualización. Apple sufrió bastante en 2024 en lo que respecta a crecimiento interanual. La compañía sigue siendo la que más tablets vende en el mundo gracias a la popularidad del iPad , pero el crecimiento interanual disminuyó en un 8,5%. Pese a ello, lograron enviar 9,9 millones de unidades, lo cual supone una cuota de mercado del 32%. Le sigue Samsung, con una cuota de mercado del 21,7% y una caída en el interanual del 5,8%. La compañía se ha mantenido discreta en lanzamientos durante finales de 2023 y comienzos de este año. Con estas dos grandes firmas en caída, las marcas chinas se