menu icon
close

Limpieza de datos históricos

Por Bernard Milian
Wiping a cloudy environment to reveal a beautiful sunset

Limpiar el historico de demanda es una disciplina clásica para cualquier planificador. Cuando se genera una previsión estadística, primero hay que asegurarse de que los datos históricos se han limpiado de valores atípicos. De lo contrario, ¡cuidado con GIGO! (basura dentro, basura fuera).

Esta limpieza histórica se lleva a cabo generalmente mensualmente, a veces cada semana. A menudo se utiliza para establecer previsiones, omitiendo otros efectos secundarios de un historial en bruto.

Por ejemplo, el historial se limpia para que el módulo de previsión estadística no se deje llevar, pero en un rincón oscuro del sistema ERP utilizamos una fórmula estadística de stock de seguridad, que utiliza todo el consumo histórico, incluidos los valores atípicos…

Datos limpios también son un requisito previo para ejecutar algoritmos de inteligencia artificial. Es lo que se conoce como «limpieza de datos».

Veamos el impacto de un historial sin limpiar en un ejemplo sencillo.

Seleccionamos un artículo en el que hemos detectado tres valores atípicos.

Screenshot depicting three outliers in the demand history

Este artículo se consume con mucha frecuencia: tuvimos 267 días de consumo en el último año. Echemos un vistazo más de cerca al historial de esta demanda… ¿ve estos tres valores atípicos?

Screenshot of the application history showing three noticeable spikes

¿Se ha dado cuenta también de que, en lugar de explorar una vista mensual o semanal, exploramos el consumo diario? Si quiere dimensionar correctamente un stock, por ejemplo, lo que cuenta son estas demandas diarias, en lugar de promedios que enmascaran la realidad de las señales de demanda reales.

Ajustaremos cada uno de estos valores atípicos hacia abajo con un simple arrastrar y soltar:

Screenshot showing how to adjust the outliers using a drag and drop in the software

Eso es más razonable:

Screenshot showing a wider view of demand history showing only one noticeable large spike

Escucho objeciones desde el fondo de la sala: ¡esto ya no es la demanda real!

Es cierto, es una demanda corregida para puntos que parecían estadísticamente atípicos. La pregunta es: ¿hay que dimensionar el stock de este artículo para satisfacer toda la demanda real con disponibilidad inmediata, o hay que satisfacer la demanda recurrente a partir del stock y adoptar otra táctica para las peticiones excepcionales, como «estimado cliente, se trata de una petición excepcional, le rogamos que nos avise con antelación, hay un ligero retraso…»?

Veamos el impacto en este artículo:

Antes de la corrección histórica, la zona roja era de 68,150 euros.

Screenshot showing the red zone level was 68,153.02 before the historical correction

Después de la corrección:

Screenshot showing that there are no outliers after the correction
  • Ya no hay valores atípicos (se han corregido)
  • El consumo medio diario bajó de 6.327 a 5.278 (-17%)
  • El CoV – coeficiente de variabilidad (desviación típica / demanda media diaria) se ha desplomado de 167 a 51: ahora reconocemos que este artículo es en realidad muy estable.
  • La zona roja ha caído a 42.600
Screenshot showing that the red zone level has lowered to 42,595.64

Un pequeño barrido del historial de datos y nuestra inversión en stock para lograr aproximadamente el mismo servicio cae en torno a un 35%, así que merece la pena hacer un poco de limpieza, ¿no?

Limpiar los datos históricos, detectar e interpretar los valores atípicos es una disciplina importante que merece estar dotada de herramientas adecuadas para:

  • Detectar de elementos que requieren análisis.
  • Determinar un proceso de limpieza adecuado: automático, o con la intervención de inteligencia humana para comprender la naturaleza de los valores atípicos, y las tácticas de respuesta apropiadas.
  • Reflejar adecuadamente el impacto de la limpieza en el dimensionamiento del stock, las previsiones, el mecanismo de detección de picos, el proceso de compromiso de entrega, etc.

Si desea profundizar en el tema utilizando sus propios datos, no dude en ponerse en contacto con nosotros…

Póngase en contacto con nosotros

Comparta esta historia, elija su plataforma

Facebook
Twitter
LinkedIn

Blogs recientes

Suscríbase a nuestra newsletter

También puede interesarle

A row of pipes releasing streams of water into a reservoir, illustrating a water filtration or supply system.

Optimizar el Flow, no los inventarios

Existen numerosas soluciones informáticas para optimizar los inventarios de productos. Basta con buscar en Google «optimización de stock» … En realidad, el stock no puede

Person in a suit sitting at a poker table with their head in their hands appearing frustrated.

Adicción a las previsiones

Durante los Juegos Olímpicos de París 2024 se hicieron todo tipo de predicciones sobre las posibilidades de medalla de los distintos países. Algunos incluso desarrollaron

A vibrant, multicolored 3D wave-like graph with peaks and valleys, representing data points on a grid with a dark gradient background. The colors range from yellow, green, blue, to red, creating a dynamic, abstract visualization.

La ley de los grandes números

En matemáticas, la ley de los grandes números es un principio fundamental de la teoría de la probabilidad, que establece que cuando un experimento aleatorio