El data mining engloba el proceso computacional de identificar tendencias, reglas, patrones ocultos u otra información valiosa a partir del análisis de grandes conjuntos de datos. Conocida también bajo las siglas KDD ―knowledge discovery in data―, la relevancia de la minería de datos se ha precipitado en los últimos años debido al crecimiento de las tecnologías de almacenamiento de datos (big data), la inteligencia artificial y la automatización robótica de procesos.
El término minería de datos suele confundirse, entre los no expertos, con la tecnología de big data. Ambos términos se refieren a conceptos relacionados entre sí, pero distintos al fin y al cabo. El big data hace referencia a conjuntos de datos tan ingentes y complejos que precisan de aplicaciones informáticas para procesarlos. La minería de datos va un paso más allá: atañe a la actividad de revisar ese extensísimo volumen de datos para detectar reglas o patrones ocultos a simple vista.
Para entender cómo funciona la minería de datos es imprescindible comprender la relación existente entre este método de análisis y tecnologías como la inteligencia artificial o el machine learning. Los sistemas de inteligencia artificial y de aprendizaje automático emplean técnicas de minería de datos para interpretar el comportamiento de las máquinas y crear soluciones a partir de los patrones y reglas identificados en los datos. De hecho, como apunta la publicación de la consultora norteamericana Deloitte, Algorithm insights, la minería de datos se circunscribe a la categoría de tecnologías cognitivas, es decir, aquellas tecnologías que facilitan la implementación de sistemas de inteligencia artificial (donde se incluye el machine learning).
La minería de datos engloba el proceso de analizar y extraer conocimiento oculto y procesable de grandes fuentes de datos almacenados en distintos formatos. Como define el profesor emérito de ciencia computacional Ian Witten en su libro Data mining, practical machine learning tools and techniques, “la minería de datos es la extracción de información implícita, previamente desconocida y potencialmente útil de los datos. La idea es diseñar programas informáticos que analicen automáticamente las bases de datos, buscando regularidades o patrones. Los patrones, si se encuentran, probablemente se generalizarán para hacer predicciones precisas sobre datos futuros”.
La minería de datos posibilita la mejora en la toma de decisiones en todos los campos de actuación de una organización. Los métodos automáticos de extracción de datos permiten organizar y filtrar la información para transformarla en conocimiento relevante que ayude en ciertos ámbitos a detectar fraudes (finanzas), a predecir la demanda (comercial y marketing) o a identificar cuellos de botella (industria y logística), entre otras muchas aplicaciones.
La aplicación de la minería de datos en logística
La logística podría ser una de las grandes beneficiadas de la consolidación del data mining. La detección automática de patrones en operativas como la recepción, la preparación o la devolución de pedidos podría contribuir a una previsión de demanda de stock o al control sobre el inventario.
El catedrático de Supply Chain Management and Analytics de la Universidad de Nebraska, David L.Olson, señala en su artículo académico A review of supply chain data mining publications que la minería de datos ya es una realidad en la cadena de suministro: “Las operaciones de la cadena de suministro se han apoyado en los análisis más habituales de minería de datos de predicción y clasificación (para incluir la elaboración de perfiles de clientes y la detección de fraudes) en el ámbito empresarial. Esto implica el uso de las metodologías de minería de datos como, por ejemplo, la regresión logística, los árboles de decisión y las redes neuronales».
Según el autor, la minería de datos tendrá un impacto creciente en la logística: “La aplicación de esta tecnología informática para medir aspectos importantes de las cadenas de suministro y analizar estos datos para tomar mejores decisiones seguirá una tendencia creciente”.
Más allá de la toma de decisiones en la gestión del inventario, la minería de datos podría incrementar el rendimiento en etapas logísticas como la consolidación de la carga. Así lo indican los investigadores de la École Polytechnique de Montréal (Canadá), Bruno Agard y Zineb Aboutalib. En su análisis Improvement of freight consolidation with a data mining technique, los autores afirman: “La aplicación de reglas de asociación en el desarrollo de estrategias de consolidación permite disminuir el número de entregas. A su vez, este método también podría aumentar el número de pedidos entregados por el mismo vehículo o en el mismo destino, reduciendo así los costes de transporte y la huella de carbono”.
Minería de datos, búsqueda de la eficiencia logística
El control, procesamiento y gestión de datos es clave para identificar errores e ineficiencias en un almacén o centro de producción. Las técnicas de minería de datos facilitan el tratamiento de los miles de datos que se producen en un almacén inteligente, identificando tendencias ocultas a simple vista. Esta información posibilita que el responsable logístico pueda tomar decisiones más informadas y precisas, basadas en el rendimiento real del almacén.