Data Science project lifecycle

La gestión de proyectos, que hemos hablado por aquí bastante, no es cosa fácil… pero lo es todavía menos cuando tenemos frente a nosotros proyectos de “Data Science”. Por ello hemos desarrollado un pequeño framework para poder afrontar, con éxito, nuestro proyecto “Data Science”, veamos:

Data Science Project Lifecycle

Definition of Project

El Sprint 0. ¿Cuántas veces nuestras expectativas vs lo entregado coinciden?. Aunque se esté trabajando con Metodología Agile, por ejemplo, no quiere decir que planifiquemos bien, que pensemos bien, etc… y es por eso de la importancia de trabajar cuanto antes y lo mejor posible nuestro Sprint 0.

Seguidamente deberemos afrontar la comprensión de los objetivos del proyecto, para poder convertir este conocimiento de los datos en la definición de un problema de minería de datos y en un plan preliminar diseñado para alcanzar los objetivos.

Things to Check

Un punto más que importante es el validar que podemos llevar a puerto el proyecto. Por ejemplo revisando el nivel de seguridad, de privacidad de la información, de UX, etc…. Sería un gran error, al final del proyecto, encontrarnos con que no podíamos utilizar ese data source, que la GDPR nos dice que… o que, la experiencia de usuario no es la deseada.

Data Preparation & Modelling

El Análisis de datos entendido como la selección de características para su posterior modelado. Estamos frente a una Fase de preparación de datos que cubre aquellas actividades necesarias para poder construir el conjunto final de datos sea o no a partir de los datos en bruto iniciales como, también, la selección de técnicas de modelado pertinentes al problema y al calibre.

Evaluation

La Fase de evaluación es, una más, vital para nuestro proyecto ya que evalua lo que se ha construído, sean uno o varios modelos y revisa que se ha alcanzado el nivel de calidad suficiente desde la perspectiva de análisis de datos, para así, antes de proceder al despliegue final del modelo poder revisar todos los pasos ejecutados.

Deployment & Service Delivery

La entrega del “paquete” básicamente, aunque tiene más complejidad y es que estamos hablando del proceso de Deployment, por ejemplo de Continuous Delivery y Continuous Integration como también del Service Management una vez está nuestro “paquete” en Producción y requiere, quizás, de nuevas features, etc…