InicioTecnologíaMeta presentó su modelo de IA Llama 3 más grande: ganancias significativas...

Meta presentó su modelo de IA Llama 3 más grande: ganancias significativas en procesamiento del lenguaje y capacidades matemáticas

-


Metaplataformas ha lanzado su versión más avanzada de los modelos de inteligencia artificial Llama 3, enfatizando sus capacidades multilingües superiores y sus impresionantes métricas de rendimiento, rivalizando con los modelos pagos de competidores como AbiertoAI.

Meta presentó su modelo de IA Llama 3 más grande: ganancias significativas en procesamiento del lenguaje y capacidades matemáticasMeta presentó su modelo de IA Llama 3 más grande: ganancias significativas en procesamiento del lenguaje y capacidades matemáticas
Inteligencia artificial – interpretación artística. Crédito de la imagen: Tara Winstead a través de pexels.com, licencia gratuita

El nuevo modelo Llama 3 sobresale en ocho idiomas, produce código informático de mayor calidad y resuelve problemas matemáticos más complejos que sus predecesores, como lo detalla Meta en sus publicaciones de blog y en el artículo de investigación que acompaña al lanzamiento.

Con la impresionante cifra de 405 mil millones de parámetros, el modelo Llama 3 supera significativamente a su versión anterior. lanzado el año pasado, aunque todavía está por debajo de los modelos líderes de la competencia. A modo de comparación, el GPT-4 de OpenAI cuenta con alrededor de un billón de parámetros, mientras que Amazon está desarrollando un modelo con la asombrosa cifra de dos billones de parámetros.

Aunque el progreso del desarrollo de la IA es notoriamente difícil de cuantificar, los resultados de las pruebas de Meta sugieren que su modelo Llama 3 más grande está casi a la par, y en ocasiones supera, al Claude 3.5 Sonnet de Anthropic y al GPT-4o de OpenAI, ambos considerados modelos de vanguardia.

Por ejemplo, en el punto de referencia MATH para problemas matemáticos escritos a nivel de competencia, el modelo de Meta obtuvo una puntuación de 73,8, muy por detrás del 76,6 de GPT-4o y superó el 71,1 de Claude 3.5 Sonnet. En el punto de referencia MMLU, que cubre una amplia gama de materias que incluyen matemáticas, ciencias y humanidades, Llama 3 logró una puntuación de 88,6, casi igualando el 88,7 de GPT-4o y ligeramente por delante del 88,3 de Claude 3.5 Sonnet.

Este lanzamiento es parte de la carrera en curso entre los gigantes tecnológicos para demostrar que sus modelos de lenguajes grandes, cada vez más sofisticados y que requieren muchos recursos, pueden ofrecer mejoras sustanciales en áreas como el razonamiento avanzado, lo que justifica las enormes inversiones invertidas en su desarrollo.

Además de su modelo insignia de 405 mil millones de parámetros, Meta también está actualizando sus modelos Llama 3 más livianos de 8 mil millones y 70 mil millones de parámetros, presentados por primera vez en la primavera. Estos nuevos modelos, todos multilingües, pueden manejar solicitudes de usuarios más extensas a través de una «ventana contextual» ampliada, que el jefe de IA generativa de Meta, Ahmad Al-Dahle, destacó como particularmente beneficiosa para generar código informático.

Meta ofrece sus modelos Llama predominantemente gratuitos para los desarrolladores, una estrategia que el director ejecutivo, Mark Zuckerberg, cree que generará productos innovadores y una mayor participación en las principales redes sociales de la empresa. Sin embargo, algunos inversores han expresado su preocupación por los costes asociados.

Al ofrecer modelos gratuitos, Meta pretende atraer desarrolladores que, de otro modo, podrían utilizar opciones de pago, lo que podría socavar los modelos de negocio de sus competidores. Meta enfatizó las ganancias en pruebas clave de matemáticas y conocimientos, haciendo que sus modelos sean más atractivos en un sentido competitivo.

Los metainvestigadores también insinuaron las próximas versiones «multimodales» de los modelos, que se esperan para finales de este año, que integrarán capacidades de imagen, video y voz con el modelo de texto central Llama 3. Las primeras pruebas indican que estos modelos pueden competir eficazmente con otros modelos multimodales como Géminis de Google 1.5 y el Soneto Claude 3.5 de Anthropic.

Escrito por Alius Noreika

!function(f,b,e,v,n,t,s){if(f.fbq)return;n=f.fbq=function(){n.callMethod?
n.callMethod.apply(n,arguments):n.queue.push(arguments)};if(!f._fbq)f._fbq=n;
n.push=n;n.loaded=!0;n.version=’2.0′;n.queue=[];t=b.createElement(e);t.async=!0;
t.src=v;s=b.getElementsByTagName(e)[0];s.parentNode.insertBefore(t,s)}(window,
document,’script’,’https://connect.facebook.net/en_US/fbevents.js’);
fbq(‘init’, ‘1254095111342376’);
fbq(‘track’, ‘PageView’);



Source link

- Publicidad -spot_img

Selección