DeepSeek, la compañía tecnológica china, ha presentado su más reciente innovación en inteligencia artificial: el modelo de lenguaje de gran tamaño DeepSeek V3-0324.
Esta actualización, que ya se posiciona entre los diez mejores modelos en la plataforma Chatbot Arena de la Universidad de California, destaca por su eficiencia y accesibilidad.
Características Clave:
- Disponibilidad y Licencia:
- El modelo está disponible en la plataforma Hugging Face.
- Gracias a su licencia MIT, DeepSeek ofrece un uso comercial completamente gratuito.
- Rendimiento y Eficiencia:
- DeepSeek-V3-0324 ha demostrado ser capaz de funcionar en computadoras comerciales, incluyendo el Mac Studio de Apple con chip M3 Ultra.
- Supera a modelos de la competencia como Claude Sonnet 3.5 de Anthropic, con velocidades de procesamiento que exceden los 20 tokens por segundo.
- Su entrenamiento requirió una inversión de poco más de US$5 millones, una cifra significativamente menor en comparación con las estimaciones de hasta US$100 millones de otras grandes empresas de IA.
- En las pruebas, DeepSeek V3 demostró ser tres veces más rápido que su versión anterior.
- Arquitectura Avanzada:
- El modelo se basa en una arquitectura de Mezcla de Expertos (MoE), lo que permite un uso selectivo de aproximadamente 37.000 millones de los 685.000 millones de parámetros para cada tarea. Esto optimiza la eficiencia al reducir los requisitos computacionales sin sacrificar el rendimiento.
- Seguridad y Pruebas:
- DeepSeek ha sometido su IA a rigurosas pruebas por parte de expertos, con especial atención en el ámbito de la seguridad, abordando las preocupaciones sobre el posible uso de datos por parte del gobierno chino.
Fuente: Web. Editado por CambioDigital OnLine









































