1. Definición del proyecto: En este paso se define exactamente cuál será el proyecto, se define cual es el problema a estudiar y cuáles son los tipos de resultados que se esperan obtener. También se definen los objetivos, el alcance y los datos que se van a utilizar.
2. Recolecta de datos: Se recopilan todos los datos que tengan relación con nuestro proyecto. Lo ideal es que estos datos sean puestos en una fuente accesible para el modelo.
3. Analizar la información obtenida: Los datos son analizados, estudiados y ajustados para poder extraer la mayor cantidad de información útil. Es importante que los datos sean bien analizados, puesto que, la calidad de nuestro modelo va a depender de la calidad de nuestros datos.
4. Análisis estadístico: En este paso hacemos una primera aproximación a los resultados utilizando métodos estadísticos estándar.
5. Creación de modelo: Aquí se crea el modelo predictivo o múltiples modelos predictivos y se compara su efectividad, esto con el fin de, ver cual se comporta mejor según las necesidades de nuestro proyecto.
6. Despliegue del modelo: Hacemos que el modelo comience a procesar los datos nuevos y a arrojar las predicciones que haya creado.
7. Monitoreo del modelo: Se revisa el desempeño del modelo creado y se asegura que los datos arrojados sean los esperados.
Estos pasos son cíclicos, un paso va a depender del otro, por tanto, este proceso debe estar en constante revisión. Si en uno de los pasos se observa que no se obtuvo lo que se esperaba, se debe retroceder o incluso volver a iniciar al primer paso.