5 startups de inteligencia artificial que lideran MLops

0
15
Custom Text

Junto con la enorme y creciente demanda de aplicaciones de inteligencia artificial, existe una necesidad complementaria de infraestructura y software de apoyo que hacen posibles las aplicaciones de inteligencia artificial. Desde la preparación de datos y la capacitación hasta la implementación y mucho más, varias empresas emergentes han llegado a la escena para guiarle a través del naciente mundo de MLops. A continuación, presentamos algunas de las más interesantes, capaces de lograr que sus iniciativas de inteligencia artificial sean más exitosas.

Weights & Biases
Weights & Biases se está convirtiendo en una presencia importante en el campo del aprendizaje automático, especialmente entre los científicos de datos que desean un servicio de seguimiento de experimentos completo y bien diseñado. En primer lugar, W&B tiene una integración inmediata con casi todas las bibliotecas populares de aprendizaje automático (además, es bastante fácil agregar métricas personalizadas).

En segundo lugar, puede usar tanto W&B según lo necesite -como una versión turboalimentada de TensorBoard, o también como una forma de controlar e informar sobre el ajuste de hiperparámetros, o también como un centro de colaboración donde todos los miembros de su equipo de ciencia de datos pueden ver resultados o reproducir experimentos realizados por otros miembros del equipo. Para la empresa, W&B incluso se puede utilizar como una plataforma de gobernanza y procedencia, proporcionando una pista de auditoría de qué inputs, transformaciones y experimentos se utilizaron para construir un modelo, a medida que el modelo pasa del desarrollo a la producción.

Ciertamente, sus científicos de datos ya conocen W&B, y si no lo están usando dentro de la empresa, es casi seguro que querrán hacerlo. Si OpenAI, GitHub, Salesforce y Nvidia están usando W&B, ¿por qué usted no?

Seldon
Seldon es otra empresa con una oferta de núcleo abierto que ofrece funciones empresariales adicionales. El componente de código abierto es Seldon Core, una forma nativa de la nube de implementar modelos con características avanzadas como cadenas arbitrarias de modelos para inferencia, implementaciones canary, pruebas A/B y bandidos multibrazo, y soporte para marcos de trabajo como TensorFlow, Scikit-learn y XGBoost listo para ser usados desde el inicio. Seldon también ofrece la biblioteca Alibi de código abierto para el aprendizaje automático de inspección de modelo y de explicación, que contiene una variedad de métodos para obtener conocimientos sobre cómo se forman las predicciones del modelo.

Una característica interesante de Seldon Core es que es increíblemente flexible en cómo encaja con su stack de tecnología. Puede usar Seldon Core por sí solo o colocarlo en una implementación de Kubeflow. Puede implementar modelos que se han creado a través de MLFlow, o puede usar el servidor de inferencia Triton de Nvidia, lo que da como resultado varias formas diferentes en las que puede aprovechar Seldon para aprovecharlo al máximo.

Para la empresa, está Seldon Deploy, que proporciona un conjunto completo de herramientas para la gobernanza de modelos, incluidos cuadros de mando, flujos de trabajo auditados y supervisión del rendimiento. Esta oferta está dirigida a científicos de datos, SRE, así como a gerentes y auditores. No se sorprenderá del todo al descubrir que el enfoque de Seldon en la auditoría y la explicación ha hecho que esta startup, con sede en el Reino Unido, sea un éxito entre los bancos; Barclays y Capital One utilizan sus servicios.

Si bien existen numerosos competidores en el campo de la implementación de modelos, Seldon proporciona un conjunto completo de características y un enfoque sumamente importante en la implementación de Kubernetes en su oferta principal, junto con adiciones empresariales útiles para empresas que desean una solución más integral.

Pinecone / Zilliz
La búsqueda de vectores está al rojo vivo en este momento. Gracias a los avances recientes en el aprendizaje automático en campos como el texto, las imágenes y el audio, la búsqueda vectorial puede tener un efecto transformador en la búsqueda. Por ejemplo, una búsqueda de «Kleenex” puede devolver la selección de tejidos de un minorista sin la necesidad de reglas personalizadas de reemplazo de sinónimos, como el modelo de lenguaje utilizado para generar un vector incrustado, colocará la consulta de búsqueda en la misma área del espacio vectorial. Y se puede utilizar exactamente el mismo proceso para localizar sonidos o realizar reconocimiento facial.

Aunque el software actual del motor de búsqueda no suele estar optimizado para realizar búsquedas vectoriales, el trabajo continúa en Elastic y Apache Lucene, y se ofrecen una gran cantidad de alternativas de código abierto con capacidad para buscar vectores a alta velocidad y escala (por ejemplo, NMSLibFAISSAnnoy). Además, han surgido muchas nuevas empresas para aliviar parte de la carga de configurar y mantener los motores de búsqueda vectoriales de su deficiente departamento de operaciones. Pinecone y Zilliz son dos de esas nuevas empresas que brindan búsqueda vectorial para las empresas.

Pinecone es una oferta pura de SaaS, donde uno carga las incorporaciones producidas por sus modelos de aprendizaje automático en sus servidores y envía consultas a través de su API. Todos los aspectos del alojamiento, incluida la seguridad, el crecimiento y escala, la velocidad y otras preocupaciones operativas, son manejados por el equipo de Pinecone, lo que significa que puede estar en funcionamiento con un motor de búsqueda de similitudes en cuestión de horas.

Aunque Zilliz próximamente va a lanzar una solución gestionada para la nube, en la forma de Zillow Cloud, la compañía adopta el enfoque de núcleo abierto con una biblioteca de código abierto llamada Milvus. Milvus está compuesto por bibliotecas de uso común como NMSLib y FAISS, proporcionando una implementación simple de un motor de búsqueda vectorial con una API expresiva y fácil de usar, que los desarrolladores pueden utilizar para construir y mantener sus propios índices vectoriales.

Grid.ai
Grid.ai es una creación de las personas detrás de PyTorch Lightning, un popular marco, de alto nivel y construido en PyTorch, que abstrae gran parte del texto estándar de PyTorch y facilita el entrenamiento en uno o mil GPUs con un par de switches de parámetros. Grid.ai toma la simplificación que trae PyTorch Lightning y se ejecuta con ella, lo que permite a los científicos de datos entrenar sus modelos utilizando recursos de GPU transitorios, tan fácilmente como ejecutar código localmente.

¿Quiere ejecutar un barrido de hiperparámetros en 200 GPUs a la vez? Grid.ai le permitirá hacer eso, administrando todo el abastecimiento (y desmantelamiento) de los recursos de infraestructura de fondo, asegurándose de que sus conjuntos de datos estén optimizados para su uso a escala y proporcionando informes de métricas, todo incluido con una sencilla interfaz de usuario web. También puede usar Grid.ai para poner en marcha instancias para el desarrollo interactivo, ya sea en la consola o adjunto a un Jupyter Notebook.

Los esfuerzos de Grid.ai, para simplificar el entrenamiento de modelos a escala, serán útiles para las empresas que necesitan desarrollar sesiones de entrenamiento que ocupen 100 o más GPUs a la vez, pero queda por ver cuántos de esos clientes hay. Aún así, si necesita una línea de capacitación optimizada para sus científicos de datos que minimice los costos de la nube, definitivamente debe examinar de cerca a Grid.ai.

DataRobot
DataRobot le gustaría ser dueño del ciclo de vida de la inteligencia artificial de su empresa desde la preparación de los datos hasta la implementación de la producción, y la empresa ofrece una buena propuesta. El pipeline de la preparación de datos de DataRobot tiene toda la parafernalia, en términos de interfaz de usuario web, que esperaría que hiciera que el enriquecimiento de datos fuera muy sencillo, además de que incluye instalaciones para ayudar a los usuarios (novatos o expertos) mediante la creación automática de perfiles, agrupamientos y limpieza de datos antes de ser introducidos en un modelo.

DataRobot tiene una función de aprendizaje automático automatizado que entrenará modelos según sus objetivos, lo que le permitirá seleccionar el modelo generado con mejor rendimiento, o uno de los suyos subido a la plataforma. Cuando se trata de implementación, el módulo MLops integrado de la plataforma rastrea todo, desde el tiempo de actividad hasta la deriva de datos, a medida que pasa el tiempo, para que siempre pueda ver el rendimiento de sus modelos de un vistazo. También hay una función llamada Humble AI, que le permite poner barreras adicionales en sus modelos en caso de que ocurran eventos de baja probabilidad en el momento de la predicción y, por supuesto, estos también se pueden rastrear a través del módulo MLops.

Diferenciándose ligeramente de la mayoría de las otras empresas emergentes en esta lista, DataRobot se instalará, sin sistema operativo, dentro de sus propios centros de datos y clústeresde Hadoop, y también se implementará en productos de nube privada y administrada, lo que demuestra que está decidida a competir, en todos los ámbitos, en las batallas que vendrán dentro de la plataforma de inteligencia artificial empresarial en el futuro, atendiendo a clientes desde startups hasta la empresas establecidas de Fortune 500.

MLops es una de las áreas más candentes de la inteligencia artificial en este momento, y la necesidad de aceleradores, plataformas y administración, así como de monitoreo, solo aumentará a medida que más empresas ingresen al campo de la inteligencia artificial. Si se está uniendo a la fiebre del oro de la inteligencia artificial, ¡puede recurrir a estas cinco nuevas empresas para que le proporcionen sus picos y hachas!

Ian Pointer InfoWorld.com

Artículo anteriorESET descubre la última versión de Gelsemium: grupo de cibersespionaje contra el gobierno y otros objetivos en Asia
Artículo siguienteFacebook alcanza el billón de dólares de capitalización bursátil tras rechazar un juez estadounidense las demandas antimonopolio