MetaPlataformas el jueves lanzó las primeras versiones de su último modelo de lenguaje grande, Llama 3, y un generador de imágenes que actualiza las imágenes en tiempo real mientras los usuarios escriben indicaciones, mientras corre para alcanzar al líder del mercado de IA generativa, OpenAI.
Los modelos se integrarán en su asistente virtual Meta AI, que la compañía presenta como el más sofisticado de sus pares de uso gratuito, citando comparaciones de rendimiento en temas como razonamiento, codificación y escritura creativa con ofertas de rivales como Alphabet Google y la startup francesa Mistral AI. El asistente Meta AI actualizado recibirá una facturación más destacada dentro de las aplicaciones de Facebook, Instagram, WhatsApp y Messenger de Meta, así como un nuevo sitio web independiente que lo posiciona para competir más directamente con el respaldado por Microsoft El gran éxito de OpenAI, ChatGPT. Una página de inicio que saluda a los visitantes en ese sitio les insta a intentar que el asistente cree una lista de equipaje para las vacaciones, les reproduzca trivia musical de los años 90, les proporcione ayuda con las tareas y pinte cuadros del horizonte de la ciudad de Nueva York.
Meta ha estado luchando por llevar productos de IA generativa a sus miles de millones de usuarios para desafiar la posición de liderazgo de OpenAI en la tecnología, lo que implica una costosa revisión de la infraestructura informática y la consolidación de equipos de investigación y productos previamente distintos. El gigante de las redes sociales ha estado lanzando abiertamente sus modelos Llama para que los utilicen los desarrolladores que crean aplicaciones de inteligencia artificial como parte de su esfuerzo de ponerse al día, ya que una poderosa opción gratuita podría obstaculizar los planes de sus rivales de obtener ingresos de su tecnología patentada. La estrategia ha suscitado preocupaciones de seguridad por parte de críticos que desconfían de qué actores sin escrúpulos podrían usar el modelo para construir.
Meta equipó a Llama 3 con nuevas capacidades de codificación por computadora y esta vez le alimentó con imágenes y texto durante el entrenamiento, aunque por ahora el modelo solo generará texto, dijo Chris Cox, director de productos de Meta, en una entrevista.
En versiones posteriores seguirán razonamientos más avanzados, como la capacidad de elaborar planes más largos de varios pasos, añadió. Las versiones previstas para su lanzamiento en los próximos meses también serán capaces de «multimodalidad», lo que significa que pueden generar tanto texto como imágenes, dijo Meta en publicaciones de blog.
«En última instancia, el objetivo es ayudarle a quitarse cosas de encima, simplemente ayudarle a hacer su vida más fácil, ya sea interactuando con empresas, escribiendo algo o planificando un viaje», dijo Cox. Cox dijo que la inclusión de imágenes en el entrenamiento de Llama 3 mejoraría una actualización que se implementará este año en las gafas inteligentes Ray-Ban Meta, un producto elaborado con el fabricante de gafas Essilor Luxoticca, lo que permite a Meta AI identificar objetos vistos por el usuario y responder preguntas sobre ellos.
Las acciones de Meta subieron un 1,8% a última hora del jueves. Meta también anunció una asociación con Google para incluir sus resultados de búsqueda en tiempo real en las respuestas del asistente, complementando un acuerdo existente con el motor de búsqueda Bing de Microsoft. El asistente Meta AI se está expandiendo a más de una docena de mercados fuera de EE. UU. con la actualización, incluidos Australia, Canadá, Singapur, Nigeria y Pakistán. Meta «todavía está trabajando en la forma correcta de hacer esto en Europa», dijo Cox, donde las reglas de privacidad son más estrictas y la próxima Ley de IA está preparada para imponer requisitos como la divulgación de los datos de entrenamiento de los modelos. La voraz necesidad de datos de los modelos de IA generativa se ha convertido en una importante fuente de tensión en el desarrollo de la tecnología.
El CEO de Meta, Mark Zuckerberg, saludó la competencia con OpenAI en un video que acompaña al anuncio, en el que llamó a Meta AI «el asistente de IA más inteligente que puedes usar libremente». Zuckerberg dijo que las dos versiones más pequeñas de Llama 3 que se están implementando ahora, con 8 mil millones de parámetros y 70 mil millones de parámetros, obtuvieron puntajes favorables frente a otros modelos gratuitos en los puntos de referencia de rendimiento comúnmente utilizados para evaluar la calidad del modelo. Aún se está entrenando la versión más grande de Llama 3, con 400 mil millones de parámetros, dijo.
Esos resultados fueron «sin duda impresionantes», pero también indicativos de una creciente brecha de rendimiento entre los modelos gratuitos y propietarios, dijo Nathan Benaich, fundador de la firma de riesgo centrada en IA Air Street Capital. Los desarrolladores se han quejado de que la versión anterior del modelo Llama 2 no entendía el contexto básico, confundiendo consultas sobre cómo «matar» un programa de computadora con solicitudes de instrucciones sobre cómo cometer un asesinato. Su rival Google se ha topado con problemas similares y recientemente suspendió el uso de su herramienta de generación de imágenes Gemini AI después de que recibió críticas por producir representaciones inexactas de personajes históricos. Meta dijo que redujo esos problemas en Llama 3 mediante el uso de «datos de alta calidad» para que el modelo reconozca los matices. No dio más detalles sobre los conjuntos de datos utilizados, aunque dijo que ingresó siete veces más datos en Llama 3 que los que utilizó para Llama 2.
Información de Katie Paul en Nueva York Información adicional de Jeffrey Dastin en San Francisco Edición de Nick Zieminski y Matthew Lewis
Fuente: reuters