Optimizing Product Assortments with Unknown Historical Transaction Data Using Nonparametric Choice Modeling and Random Forest Classification
Autor: | Lou, Yuxiang, Matz, Filip |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2019 |
Předmět: | |
Druh dokumentu: | Text |
Popis: | Assortment optimization is a crucial problem for many firms who need to make decisions on which products to stock in their stores in order to maximize revenues. Optimizing assortments usually entails fitting choice models to historical data. To a large extent, this becomes a problem of understanding consumer behavior. In this paper, a two-step method is proposed for optimizing assortments for stores where there was no known sales data. First, training data was generated by optimizing assortments, using a non parametric choice model, on similar stores for which data is available. Then this training data isused to develop a series of random forest models which given parameters for a store can generate an optimal assortment. The features used in the random forest models were chosen based on consumer behavior theory and consisted of geographical and financial features as well as features regarding the composition of the stores. The data used in this report was provided by a major Swedish print distributor with over 1000 stores and 2500 products. The results presented in this paper show that this method outperforms the baseline in all cases studied. Furthermore, it was determined that geographic features are the essential type of features for the models to determine the optimal assortments for stores. Produktsortimentsoptimering är ett centralt problem för många företag som måste ta beslut om vilka produkter de ska lagerhålla för att maximera sin vinst. Att optimera produktsortiment brukar ofta innebära att träna valmodeller på historisk data. Detta blir ofta en fråga om att förstå konsumenters beteende. I denna uppsats presenteras en tvåstegs metod för att optimiera produktsortiment utan historisk data. I det första steget optimeras sortimentet med hjälp av en icke-parametrisk valmodell på liknande butiker där data finns tillgängligt. Sedan utvecklas Random Forest modellermed de optimerade sortimenten som träningsdata. Givna en rad parameterar kan dessa modeller generera optimala sortiment. Parametrarna som användes i Random Forest modellerna valdes baserat på konsumentteori and bestod av geografiska och finansiella parametrar så väl som parameterar som beskrev butikernas sammansättning. Datan som användes tillhandahölls av ett svenskt företag inom tryckbranschen som har över 1000 butiker och 2500 produkter i sitt sortiment. Resultaten som presenterades i denna uppsats visar att metoden presterar bättre än baslinjen i alla fall som studerades. Utöver detta, så beslutas det att geografiska parametrar är de viktigaste parametrarna för modelerna att ta beslut angående de optimala sortimenten. |
Databáze: | Networked Digital Library of Theses & Dissertations |
Externí odkaz: |