El futuro de los modelos de IA ligeros: ¿está Gemma 3 marcando el camino a seguir?

0
10

Google ha lanzado Gemma 3, la última incorporación a su familia de modelos abiertos ligeros diseñados para ejecutarse directamente en teléfonos, portátiles y otros dispositivos.

La serie de modelos Gemma 3 está impulsada por la misma investigación y tecnología que alimenta los modelos Gemini 2.0 de Google, según un comunicado publicado recientemente en el blog de la compañía. «Esto le ayuda a crear experiencias de usuario atractivas que pueden caber en un solo host GPU o TPU», afirmó Google.

Los modelos Gemma 3 son capaces de procesar entradas de texto y visuales, pero solo pueden generar salidas de texto. Los modelos están disponibles en tamaños de mil millones, cuatro mil millones, doce mil millones y veintisiete mil millones de parámetros, lo que permite a los desarrolladores elegir el modelo más adecuado para ejecutar sus aplicaciones de IA.

«El modelo de 27B fue entrenado con 14 billones de tokens, el modelo de 12B fue entrenado con 12 billones de tokens, el modelo de 4B con 4 billones de tokens y el de 1B con 2 billones de tokens», según la página de Gemma 3 en Hugging Face.

Aunque Gemma 3 ha sido entrenado con un conjunto de datos de texto, Google no especificó las fuentes de datos. También reveló que los pesos de Gemma 3 son de código abierto y pueden ser utilizados por los desarrolladores para construir variantes pre-entrenadas y variantes ajustadas por instrucciones del modelo de lenguaje pequeño (SLM).

Google también afirmó que Gemma 3 viene con una ventana de contexto de 128k tokens que permite al modelo comprender mayores cantidades de información.

¿Cómo se compara Gemma 3 con otros modelos de IA?
Google ha afirmado que Gemma 3 logró una mejor puntuación de referencia que el modelo Llama-405B de Meta, así como o3-mini de OpenAI y DeepSeek-V3, en evaluaciones preliminares de preferencias humanas en LMArena, una plataforma abierta desarrollada por investigadores de UC Berkeley para la evaluación comparativa de IA de origen colectivo.

Gemma 3 se puede utilizar para construir aplicaciones de IA que analicen imágenes, texto y videos cortos. También puede manejar tareas lingüísticas, ya que Gemma 3 admite más de 35 idiomas, con soporte pre-entrenado para más de 140 idiomas. Además, los desarrolladores pueden usar Gemma 3 para construir herramientas de IA que automaticen tareas y ofrezcan capacidades basadas en agentes de IA debido a sus salidas estructuradas y soporte de llamadas de función.

Gemma 3 está disponible para su descarga a través de plataformas como Kaggle y Hugging Face. También es accesible a través de Google Studio.

«Gemma 3 ofrece múltiples opciones de implementación, incluyendo Vertex AI, Cloud Run, la API de Google GenAI, entornos locales y otras plataformas, brindándole la flexibilidad de elegir la mejor opción para su aplicación e infraestructura», dijo la compañía.

La serie de modelos se puede entrenar y ajustar aún más utilizando plataformas como Google Colab, Vertex AI e incluso en GPU para juegos, según la compañía. «Gemma 3 se envía con una base de código renovada que incluye recetas para el ajuste fino y la inferencia eficientes», agregó.

¿Qué es ShieldGemma 2?
Junto con el lanzamiento de Gemma 3, Google anunció el despliegue de su herramienta de seguridad de IA de cuatro mil millones de parámetros llamada ShieldGemma 2.

ShieldGemma 2 se puede utilizar para adjuntar etiquetas como contenido peligroso, sexualmente explícito y violencia a las imágenes generadas por IA. Google afirmó que ShieldGemma 2 se puede integrar con cualquier otra herramienta utilizada por los desarrolladores, con opciones para una mayor personalización disponibles.

Fuente WEB | Editado por CambioDigital Online

Custom Text
Artículo anteriorMeta: Producción de chip de IA en 5nm de diseño propio programada para 2026 en TSMC
Artículo siguienteAtaques cibernéticos a móviles superan los 33 millones en 2024