Popis: |
This thesis examines how recent advances in debaised machine learning can be used for estimating price elasticities of demand within the automotive insurance field. Traditional methods such as generalized linear model (GLM) to estimate demand has no way of ensuring there are no biases in the underlying data selection, especially when the confounding variables are many. These approaches instead rely on the user’s experience to remove biases in the data. Advances, in the crossing fields between economics and machine learning have however found new approaches to debias datasets automatically through the double machine learning approach (DML). Using a large data set of insurance offers and sales from a Swedish insurance company, the double machine learning approach first described by Chernozhukov et al. (2016) is used to estimate the price elasticity of demand for individual customers. The price elasticities are then grouped on variables of importance and combined with the loss ratio of the segment in order to optimize the existing insurance tariff. In terms of model performance, the importance of the first stage classifier and regressor proved to be important for the final results. In alignment with expectations of the results, higher premium cars such as BMW and Mercedes proved to be more price sensitive. However, these brands also had higher loss ratios which resulted in a lower potential for lowering prices. Aligning the price elasticity with the loss ratios and the company’s strategy was found to be an important aspect. On average, the automotive insurance industry was shown to be price sensitive with few segments of inelastic characteristics. I denna rapport undersöks hur de senaste framstegen inom maskininlärning kan användas för att uppskatta priselasticiteten hos efterfrågan inom bilförsäkringar. Traditionella metoder som generalized linear model (GLM) för att uppskatta efterfrågan har inget sätt att säkerställa att det inte finns några biaser i det underliggande dataurvalet, särskilt inte när det finns många variabler som kan påverka. Dessa metoder förlitar sig i stället på användarens erfarenhet för att ta bort bias i variablerna. Inom området där ekonomi och maskininlärning korsas har man däremot funnit nya metoder för att automatiskt ta bort bias i dataset genom dubbel maskininlärning (DML). Med hjälp av en stor datamängd av försäkringsofferter och försäljningsresultat från ett svenskt försäkringsbolag används den dubbla maskininlärningsmetoden som först beskrevs av Chernozhukov et al. (2016) för att uppskatta priselasticiteten hos individuella kunder. Priselasticiteterna grupperas sedan på variabler av intresse och kombineras med segmentets skadefrekvens för att optimera den befintliga försäkringstariffen. När det gäller modellens prestanda visade sig betydelsen av det första stegets klassificerare och regressorer vara viktiga för slutresultaten. I linje med förväntningarna på slutresultatet visade sig bilar med högre premier, som BMW och Mercedes, vara mer priskänsliga. Dessa märken hade dock också högre skadefrekvenser, vilket resulterade i en lägre potential för prissänkningar. En viktig slutsats från resultat var vikten av att justera och anpassa prisoptimeringen efter segmentets skadefrekvens och företagets strategi. I genomsnitt visade sig bilförsäkringsbranschen vara priskänslig med få segment med oelastiska egenskaper. |