Dynamische Lieferzeit-Preisgestaltung in variantenreicher Produktion
Ein adaptiver Ansatz mithilfe von Reinforcement Learning
Florian Stamer
Das Wertschöpfungsnetzwerk ist heute zur dominierenden Wertschöpfungsstruktur im Bereich der Produktion geworden. Für produzierende Unternehmen in solchen Netzwerken ist das Auftragsmanagement eine zentrale Aufgabe, die sich in einem Umfeld wachsender Herausforderungen befindet. Zum einen setzen kürzere Produktlebenszyklen und zunehmende Individualisierung die Unternehmen unter Druck. In diesem Zusammenhang hat die variantenreiche Produktion an Bedeutung gewonnen. Andererseits steigen die Wahrscheinlichkeit und die Auswirkungen von Störungen, insbesondere in Netzwerken, was die Leistungsfähigkeit von Produktionssystemen herausfordert. Ein aussichtsreicher Ansatz in diesem Kontext könnte der Einsatz einer dynamischen Lieferzeit-Preisgestaltung über eine kontinuierliche Lieferzeit-Preis-Funktion sein. Durch eine solche dynamische Lieferzeit-Preisgestaltung wäre es möglich die Bedarfe im Netzwerk mit den Möglichkeiten der Produktion am Standort in Einklang zu bringen. Die Idee ist, Nachfragespitzen zu verschieben und Kunden nach ihren Präferenzen zu separieren. Im Ergebnis soll dadurch eine wachsende Volatilität mit einer gleichbleibenden Kapazität abgebildet werden. Aus dieser Darlegung ergibt sich das Ziel dieser Arbeit, eine Methodik zur dynamischen Lieferzeit-Preisgestaltung zu entwickeln, um die beschriebenen Effekte zu erzielen. Als Lösungsverfahren wird auf ein Actor Critic Reinforcement Learning zurückgegriffen, welches in der Lage ist, mit komplexen Optimierungsproblemen in annehmbarer Rechenzeit umzugehen. Die Ergebnisse aus zwei Anwendungsfällen zeigen, dass der Ansatz in der Lage ist, mit gleicher Kapazität signifikant höhere Gewinne zu erzielen und die Nachfrage bis zu einem gewissen Grad zu glätten.