8 Lecciones que Hemos Aprendido al Construir una Plataforma de Machine Learning

julio 21, 2021

Reading Time: 6 minutes

Al hablar con grandes empresas de la industria del automóvil aparece una pregunta frecuente y justa: ¿Qué nos impide construir nuestra propia plataforma?.

 

 

Las grandes empresas de automoción y transporte tienen sus propios ingenieros de investigación y ciencia de datos, y algunas deciden crear su propia plataforma de machine learning para utilizar la enorme cantidad de datos de los vehículos que se recogen continuamente para automatizar la detección de anomalías y fallos.

Hemos visto, y a menudo muy grandes, intentar esto y fracasar. A menudo se subestima la complejidad de un proyecto de machine learning, lo que da lugar a que los proyectos tengan dificultades para avanzar debido a la lentitud del progreso y a los resultados inferiores.

En este artículo, vamos a compartir con usted las lecciones que hemos aprendido durante el desarrollo de nuestra plataforma de aprendizaje automático, diseñada específicamente para el sector de la automoción.

 

Lección #1: Se necesita algo más que el acceso a los datos del vehículo para construir grandes modelos

 

El primer elemento que permite un sistema de aprendizaje automático es, efectivamente, una cantidad masiva de datos. Los Datos son la salvación de cualquier producto de machine learning.

Pero no sólo es importante la cantidad de datos, sino también su relevancia, diversidad, limpieza y actualización.

Datos del vehículo

Tan importantes como los datos son las etiquetas que se utilizan para entrenar estos modelos . Conseguir estas etiquetas suele ser un intento manual que requiere mucho tiempo. Mejoramos nuestros conjuntos de datos con nueva información relativa a los datos de los vehículos aprovechando nuestro módulo de alertas y comentarios de los usuarios, lo que convierte el modelo de cada cliente en un sistema vivo que mejora con el tiempo.

No sólo proporcionamos a nuestros clientes del sector del transporte una verdadera ventaja en los lentos y a menudo costosos pasos del etiquetado de datos, sino que también automatizamos este proceso crítico para ellos.

 

Lección #2: El conjunto debe ser más que la suma de las partes

 

Aprovechamos cientos de componentes de código abierto, pero nuestra plataforma también integra varios sistemas propios para coordinarlos. No somos diferentes de los fabricantes de automóviles, que tienen acceso a las mismas piezas.

Es posible integrar las piezas de forma que funcionen como un todo, lo cual es bastante difícil, pero aunque todas las empresas tengan acceso a los mismos componentes, no todas hacen los mejores vehículos. Y al igual que la fiabilidad de un vehículo es fundamental porque se espera que funcione siempre sin fallos, una plataforma de machine learning para la detección de anomalías también es fiable o no sirve para nada.

Otra similitud reside en los requisitos que permiten la escalabilidad. Al igual que fabricar y entregar pequeños lotes no es prueba de que se pueda desarrollar, enviar y dar soporte a millones de vehículos, escalar una plataforma de machine learning desde un entorno de I+D a un escenario del mundo real es una tarea compleja.

 

Lección #3: La infraestructura actual probablemente no estará a la altura

 

La verdad es que construir Inteligencia Artificial es difícil. La infraestructura necesaria para manejar grandes cantidades de datos, concretamente en las cargas de trabajo analíticas, tiene unos requisitos muy diferentes a los que la mayoría de las Infraestructuras Informáticas están preparadas.

Las bases de datos NoSQL, los marcos informáticos distribuidos y los clústeres de servidores son habituales a la hora de implementar un proyecto de este tipo, y el amplio ecosistema de herramientas para gestionar estos problemas es a la vez una bendición y una maldición para el arquitecto de sistemas.

La creación de esta infraestructura puede convertirse rápidamente en un abismo de servicios incompatibles y problemas de configuración. Un equipo no sólo debe tener una profunda experiencia en los mecanismos centrales de la tecnología, sino que también debe ser capaz de desarrollar a través de tecnologías que ofrezcan toda la seguridad y escalabilidad necesarias que requieren las empresas de hoy en día.

 

Lección #4: Su plataforma debe ser una solución completa

 

Garantizar una solución completa no es sencillo. La creación de un producto de machine learning requiere una serie de acciones diversas que deben funcionar conjuntamente para pasar de los datos a la información:

Producto de machine learning

Este proceso suele ser muy recurrente, y cada tarea puede requerir mucho tiempo. Una integración estable de estas tareas, junto con herramientas que automatizan gran parte de este trabajo, acelera enormemente el ritmo de desarrollo y validación de los modelos.

Nuestra solución es una completa caja de herramientas de machine learning, desarrollada específicamente para la industria de la automoción, diseñada para acelerar el desarrollo de sistemas de detección de anomalías personalizados para nuestros clientes.

 

Lección #5: No subestimes el tiempo que puede llevar construir

 

Es muy común que los equipos que empiezan trabajen en un modelo durante meses en I+D, para luego descubrir que el modelo no funciona bien en producción. Esto suele ocurrir porque los modelos se construyen utilizando muestras estáticas de datos, mientras que los entornos de producción proporcionan un flujo continuo de información.

Modelos

Cruzar la línea entre la I+D y la producción es algo serio para un producto de aprendizaje automático. El resultado de un modelo puede ser adecuado cuando se evalúa manualmente su rendimiento frente a un conjunto de datos estático, bien definido y seleccionado.

Este escenario es muy diferente al de un entorno de producción, donde el modelo tendrá que hacer frente a un flujo continuo de datos procedentes de múltiples fuentes. Por eso, los primeros indicios de éxito no son sinónimo de éxito, y puede tardar mucho tiempo en tener éxito para luego fracasar una vez trasladado a la producción. El tiempo importa.

 

Lección #6: los Modelos de Machine Learning se degradan fácilmente

 

El mundo en el que vivimos no es un lugar estático. Hay tendencias subyacentes que afectan a todo lo que nos rodea.

Las alteraciones de las carreteras, los cambios en el tráfico y las variaciones meteorológicas, entre otros factores, provocarán nuevas pautas de conducción. Esto significa que las suposiciones hechas por los modelos en el momento de la formación no se mantienen durante mucho tiempo y, en última instancia, los resultados del modelo se deteriorarán con el tiempo.

Para tener en cuenta esto, supervisamos continuamente el rendimiento de los modelos para ofrecer a nuestros clientes del sector del transporte, como transportistas u operadores de autobuses urbanos, la posibilidad de realizar un seguimiento de los modelos individuales para mejorar nuestras alertas de mantenimiento predictivo a lo largo del tiempo. Aprovechamos el bucle de feedback del cliente para reentrenar continuamente nuestros modelos, convirtiéndolos en sistemas vivos que evolucionan y se adaptan a su entorno.

Con todo, la mayoría de los clientes no disponen por sí mismos de datos amplios, diversos y especialmente etiquetados para apoyar el aprendizaje de los modelos. Hemos creado un consorcio de datos integrado en el que las empresas pueden optar por compartir de forma segura los datos de sus vehículos y aprovechar los modelos mejorados.

 

Lección #7: Invierta en el proveedor adecuado, evite la dependencia de un proveedor

 

Si invierte en un producto y más tarde decide desarrollar los Modelos de Inteligencia Artificial internamente y no puede hacerlo sin renunciar a su inversión anterior, entonces ha tomado una mala decisión al seleccionar el proveedor.

Estamos creando las capacidades para ampliar nuestra plataforma con sus modelos. Esto significa que podrás construir modelos en cualquier lenguaje, utilizando cualquier biblioteca y en cualquier plataforma y luego importar estos enfoques a una plataforma que fue construida desde cero, para manejar la detección de anomalías y fallas.

No creemos en el bloqueo de proveedores. Creemos en el rendimiento y el ritmo como criterios para una relación exitosa y a largo plazo con los clientes. El mismo rendimiento y ritmo son esenciales para cumplir nuestra misión de apoyar a los pioneros de la industria que impulsan un futuro sin tiempos de inactividad.

 

Lección # 8: Trabaje siempre con soluciones a prueba de futuro

 

La misión de Stratio es proporcionar una automatización integral a las empresas de transporte, creando unfuturo sin tiempo de inactividad. Para poder automatizar los procesos que implican grandes cantidades de datos, se necesita una plataforma de machine learning para apoyar su producto. Stratio, la Plataforma de Inteligencia Artificial para Automatización de Flotas, se ha construido bajo un conjunto de creencias clave:

Creemos que en el futuro ninguna empresa de transporte tendrá éxito a menos que esté completamente automatizada.

Creemos que un día todos los vehículos formarán parte de una flota.

Creemos que los datos de los vehículos y el poder de la inteligencia artificial darán lugar a la transformación digital necesaria para la automatización total.

Creemos que la automatización conducirá a la industria del transporte hacia un futuro sin tiempos de inactividad.

Creemos que las empresas de transporte totalmente automatizadas servirán a más clientes, mejor y a menor coste.

You May Also Like…