‘Gemini’ es la nueva IA de Google y es la gran amenaza para OpenAI

Compartir
La compañía presenta su nuevo modelo con el aval de haber superado a sus rivales en prácticamente todas las pruebas. Es la primera vez en un año que alguien demuestra poder superar las capacidades de la empresa de Sam Altman.
LMN

Una vez que la crisis de OpenAI parece haber sido cerrada con el regreso y la victoria de Altman, la inteligencia artificial vuelve a dar que hablar: por la carrera armamentística que se vive desde hace meses por ver qué empresa es la que consigue llevarse el gato al agua y liderar esta tecnología.

La última en mover pieza ha sido Google. La empresa dirigida por Sundar Pichai tiene una nueva IA llamada Gemini, la más poderosa y capaz que han desarrollado en los cuarteles generales del buscador, que ha sido presentada el pasado miércoles. Todo esto pretende ser un punto de inflexión en la competición que mantiene la multinacional con Microsoft y OpenAI, ya que este lanzamiento llega con el aval de haber superado a todos sus rivales en la mayoría de las pruebas que se realizan para analizar las capacidades de los modelos de lenguaje que luego dan vida a todas estas IA.

La compañía ha presentado a “Gemini” como una inteligencia artificial multimodal. Esto significa que este sistema es capaz de «trabajar, combinar y entender distintos tipos y distintos formatos de información«, desde texto o imágenes hasta trabajar con audio, video o lenguajes de código.

¿En qué se traduce esa multimodalidad? Por ejemplo, que si la inteligencia artificial ve una foto de tomates y pasta, nos puede ofrecer una receta para cocinarlos, si ve una foto de dos ovillos de lana, puede darnos consejos para hacer ganchillo y mientras analiza un video puede darnos canciones que pegan con esas imágenes. Que sea capaz de hacerlo, no significa que lo vaya a hacer desde el primer momento. Google vuelve a optar por la prudencia y en esta primera fase, “Gemini” solo responderá con texto o código.

El desarrollo, que ha estado liderado por el equipo de DeepMind, así como el de Google Research, está preparado para funcionar en cualquier dispositivo, desde un smartphone hasta un centro de datos. Para lograr esa flexibilidad y esa omnipresencia, la primera versión de Gemini llegará en tres tamaños diferentes, bautizados, de menor a mayor, como Nano, Pro y Ultra.

El primero está pensado para poder ejecutarse directamente en un teléfono móvil, mientras que los otros dos escalan en capacidades y potencia, pero necesitan una infraestructura mayor. El más poderoso, Gemini Ultra, no se empezará a desplegar hasta enero.

«Cuando llegamos a la fase final de su entrenamiento, empezamos a ver que era superior a cualquier otro modelo en los benchmarks«, dice Demis Hassabis, CEO de DeepMind, en el video de presentación. El ejecutivo, además, asegura, que en el medio centenar de materias (historia, medicina, …) en las que se ha probado, “Gemini” ha demostrado ser «tan buena» como los «mejores expertos humanos» en dichas materias.

La prueba que mide esto se llama MMLU (comprensión masiva del lenguaje multitarea), un examen que ha superado con el 90,04% de la nota. GPT-4 consiguió un 86%. En GSM8K, un examen matemático de un nivel similar al escolar, ha obtenido un 94,4% frente al 92% del modelo de OpenAI. MATH, un test matemático que exige tener capacidades avanzadas de geometría o álgebra, se les ha atragantado un poco más.

La versión Ultra ha mejorado los resultados y ha superado a todos sus rivales en 30 de las 32 pruebas de referencia. Cuando se habla de todos los rivales, se habla también de GPT-4, el desarrollo más avanzado que OpenAI ha puesto en circulación hasta la fecha. También hay que señalar que el modelo intermedio obtiene calificaciones más bajas, más en línea con las logradas por GPT-3.5. Ahora toca refrendar estas buenas cifras en entornos y usos reales, más allá de estos test de estrés.

Ahora habrá que esperar para ver si Gemini es capaz de cambiar el escenario. De momento, es la primera vez desde el lanzamiento de ChatGPT, algo que ocurrió hace poco más de un año, que alguien demuestra poder superar las capacidades de los productos de OpenAI.