AWS refuerza su herramienta de aprendizaje de máquina SageMaker

0
24

Amazon Web Services (AWS) ha ampliado las capacidades de su conjunto de herramientas de aprendizaje de máquinas SageMaker de Amazon para abordar una serie de desafíos que las empresas enfrentan cuando intentan operacionalizar el aprendizaje de máquinas, desde la organización del modelo, la capacitación y la optimización, hasta la supervisión del rendimiento de los modelos en producción.

Lanzado en la conferencia re:invent de Amazon en el 2017, SageMaker tiene como objetivo simplificar la adopción del aprendizaje automático para los clientes, al reunir un entorno alojado para los portátiles Jupyter con gestión de modelos integrada, creación automática de entornos de formación en Amazon S3 y puntos finales HTTPS para capacidades de alojamiento mediante instancias EC2.

Tal y como lo presenta el CEO, Andy Jassy, los rivales de AWS, como Google Cloud y Microsoft Azure, quieren convertirse en el entorno de servicio completo líder para que los científicos de datos, los ingenieros de datos y los desarrolladores no especializados, puedan ejecutar todas sus cargas de trabajo de aprendizaje de máquinas.

Para AWS, esto significa una pila de servicios de tres capas, comenzando con los bloques de construcción básicos utilizados por profesionales técnicos experimentados que quieren ser capaces de ajustar cada parte de su proceso de modelado, ya sea con TensorFlow, PyTorch, MXNet u otro marco de aprendizaje de máquina. SageMaker promete simplificar elementos clave del proceso, complementados con servicios cognitivos listos para usar como Traducir, Transcribir, reconocimiento de imágenes y reconocimiento de voz.

Presentación de SageMaker Studio
Ahora Amazon está expandiendo esta sandbox con lo que denomina SageMaker Studio, ofreciendo finalmente a los clientes un entorno de desarrollo integrado (IDE) para almacenar y recopilar todo el código fuente, los portátiles, la documentación, los conjuntos de datos y las carpetas de proyectos necesarios para ejecutar y gestionar modelos de aprendizaje de máquinas a escala empresarial, incluidas las capacidades de colaboración.

Muchas de estas capacidades ya se pueden encontrar en la plataforma Azure Machine Learning de Microsoft y en el AI Hub de Google Cloud, mientras que las ofertas de data science «workbench» también son proporcionadas por empresas como Domino Data Lab y Dataiku.

Experimentos SageMaker y Model Monitor
Entre las nuevas capacidades que AWS ha anunciado, comencemos con los portátiles. AWS quiere simplificar el aprovisionamiento de cómputo al girar un portátil Jupyter con un solo clic, así como automatizar el delicado proceso de transferencia de contenidos entre portátiles.

El siguiente en la lista de anuncios fue SageMaker Experiments, una nueva característica que permite a los desarrolladores ver y administrar todas las diferentes iteraciones de sus modelos. Para ello, recopila métricas clave como los parámetros de entrada, la configuración y los resultados de salida, de modo que los usuarios puedan comparar y contrastar el rendimiento de varios modelos, tanto de modelos nuevos como de experimentos anteriores.

Amazon también ha añadido una herramienta de depuración nativa, que permite a los usuarios depurar y perfilar modelos durante la formación, un proceso que tradicionalmente ha demostrado ser opaco. El depurador marcará cuando los modelos se desvíen de los indicadores de precisión y rendimiento, y ofrecerá consejos de reparación.

Por último, Amazon también anunció el SageMaker Model Monitor, que ayuda a los clientes a detectar mejor la «deriva del concepto», en la que los datos utilizados por un modelo en producción comienzan a desviarse de los utilizados para entrenar el modelo. Con SageMaker Model Monitor, los clientes de AWS serán alertados cuando ocurran desviaciones en los datos basados en un nivel de línea de base que ellos configuren, alimentando una muestra de sus datos a SageMaker. Model Monitor inspeccionará los datos y la calidad de las predicciones en un programa establecido, e incluso proporcionará métricas por función a Amazon CloudWatch.

Scott Carey, InfoWorld.com