Todo gerente de operaciones ha experimentado la frustración de un sistema de optimización de rutas que devuelve inviable: no se encontró solución. Las ventanas de tiempo del cliente son demasiado ajustadas, la capacidad del vehículo se excede, la duración máxima de la ruta se viola, o los requisitos de habilidad del conductor no se pueden satisfacer. En teoría, todas estas son restricciones válidas. En la práctica, violar algunas de ellas no solo es aceptable sino necesario para mantener el negocio funcionando.
Aquí es donde la distinción entre restricciones rígidas y flexibles se vuelve crítica. Una restricción rígida es aquella que nunca debe violarse bajo ninguna circunstancia. Una restricción flexible es aquella que debe respetarse pero puede relajarse con un costo cuantificable. Hacer bien esta clasificación es la diferencia entre un sistema de optimización de rutas que produce planes útiles y uno que produce perfección teórica o nada en absoluto.
Las restricciones rígidas en la distribución de bienes de consumo masivo son relativamente pocas. La capacidad máxima de peso del vehículo es una restricción rígida porque la sobrecarga es ilegal y peligrosa. Las horas totales de trabajo del conductor ordenadas por la legislación laboral no pueden excederse. Los tipos de vehículo prohibidos para ciertas categorías de caminos (un camión pesado no puede tomar una calle residencial con límites de peso) son restricciones rígidas. Estas restricciones son binarias: la solución es factible o no lo es.
Todo lo demás es candidato para tratamiento de restricción flexible. Las ventanas de tiempo del cliente son el ejemplo más común. Una tienda podría preferir entregas entre las 9 AM y las 12 PM, pero aceptará una entrega a las 12:30 PM. Si la optimización trata esto como una restricción rígida, podría necesitar un vehículo adicional para cumplir esa ventana, costando mucho más que la menor inconveniencia de un retraso de 30 minutos. Como restricción flexible con una penalización de costo, el sistema puede evaluar si el costo de la entrega tardía es menor que el costo del vehículo adicional y tomar la decisión económicamente racional.
Las penalizaciones de costo son cómo se cuantifican las restricciones flexibles. Cada violación de restricción flexible tiene una función de costo que convierte la magnitud de la violación en un equivalente monetario. Para las violaciones de ventana de tiempo, esto podría ser una penalización lineal: cada minuto fuera de la ventana cuesta una cantidad configurable. Para el desequilibrio de carga de trabajo, la penalización podría ser cuadrática: los pequeños desequilibrios son casi gratuitos, pero los grandes desequilibrios se vuelven progresivamente más costosos. Estas funciones de costo son configurables por tipo de restricción y pueden incluso variar por cliente o vehículo.
El marco matemático combina la función objetivo (minimizar el costo total de la ruta incluyendo tiempo de viaje, combustible y salarios del conductor) con los términos de penalización para todas las violaciones de restricciones flexibles. El optimizador busca la solución que minimiza el costo total incluyendo penalizaciones. Esto naturalmente produce planes que respetan las restricciones flexibles cuando es posible y las violan solo cuando el costo de la violación es menor que la alternativa (vehículos adicionales, rutas más largas, clientes no atendidos).
Un ejemplo concreto ilustra los compromisos. Considere una ruta de entrega con 15 paradas. La parada 8 tiene una ventana de tiempo rígida de 10 AM a 11 AM porque la tienda tiene un protocolo de recepción de productos perecederos. Las paradas 5 a 7 tienen ventanas de tiempo flexibles que prefieren la entrega por la mañana. Si el optimizador trata todas las ventanas como rígidas, podría necesitar dividir la ruta en dos vehículos. Con restricciones flexibles, descubre que entregar a las paradas 5 a 7 ligeramente fuera de sus ventanas preferidas (llegando a la 1 PM en lugar de las 12 PM) permite que toda la ruta sea atendida por un solo vehículo, ahorrando el costo del despliegue de un segundo vehículo mientras se incurre solo en penalizaciones menores de preferencia de entrega.
La coincidencia de habilidades del conductor es otra área donde las restricciones flexibles agregan valor. Algunas entregas requieren capacidades específicas: operación de vehículo refrigerado, certificación de montacargas, o habilidades lingüísticas para ciertas áreas de mercado. Tratar todos los requisitos de habilidad como restricciones rígidas reduce la flexibilidad de programación. Como restricciones flexibles, el sistema puede asignar un conductor menos que ideal cuando el costo de la falta de coincidencia de habilidades (quizás requiriendo que el cliente ayude con la descarga) es menor que el costo de despachar a un conductor calificado desde un depósito distante.
La duración máxima de ruta frecuentemente se modela mejor como una restricción flexible. Las regulaciones laborales definen límites rígidos en las horas totales de trabajo, pero una extensión de 15 minutos más allá de la duración de ruta planificada podría prevenir que un cliente se pierda su entrega completamente. La penalización por un costo menor de horas extra es casi siempre menor que el costo de reprogramar una entrega para el día siguiente, lo cual desperdicia un espacio de entrega y decepciona al cliente.
El desafío con las restricciones flexibles es calibrar las penalizaciones de costo. Si las penalizaciones son demasiado bajas, el optimizador violará las restricciones libremente, produciendo planes que técnicamente minimizan el costo pero crean caos operativo. Si las penalizaciones son demasiado altas, efectivamente se convierten en restricciones rígidas y se pierde el beneficio de la flexibilidad. La calibración correcta requiere conocimiento operativo: ¿cuánto cuesta realmente al negocio cuando una entrega llega 30 minutos tarde? ¿Cuál es el impacto real de un desequilibrio de carga de trabajo del 10% entre conductores?
La calibración iterativa es el enfoque práctico. Comience con penalizaciones estimadas basadas en la experiencia operativa. Ejecute el optimizador con datos históricos y compare sus decisiones con lo que realmente sucedió. Ajuste las penalizaciones según dónde el optimizador toma decisiones con las que los gerentes de operaciones no están de acuerdo. Con el tiempo, la estructura de penalizaciones converge para reflejar las verdaderas preferencias de costo de la organización.
La transparencia en el manejo de restricciones es esencial para la adopción operativa. Cuando el optimizador produce un plan de ruta, debe indicar claramente qué restricciones flexibles se violaron, en qué medida, y con qué costo de penalización. El gerente de operaciones puede entonces revisar los compromisos y aprobarlos o anularlos. Un plan que muestra una violación de ventana de tiempo de 15 minutos que ahorra dos rutas completas de vehículos es una aprobación fácil. Un plan que viola 10 ventanas de tiempo para ahorrar 5 minutos de tiempo total de viaje será cuestionado con razón.
La lección más amplia es que los problemas de optimización del mundo real son inherentemente desordenados. Los clientes tienen preferencias, no demandas rígidas. Las políticas operativas tienen espíritu y letra, y el espíritu generalmente es más importante. Los horarios de vehículos tienen metas y límites. Modelar esta realidad desordenada con restricciones flexibles y penalizaciones de costo produce resultados de optimización que los equipos de operaciones realmente usan, en lugar de óptimos teóricos que se anulan en el terreno. La meta no es la ruta matemáticamente perfecta. Es la ruta que mejor equilibra todas las consideraciones de negocio y se gana la confianza de las personas que la ejecutan cada día.