Popis: |
Denne bacheloroppgaven utforsker bruk av klyngeanalyse på det nordiske aksjemarkedet med fokus på de fundamentale nøkkeltallene til aksjer. Målet er å undersøke om det kan identifiseres en metode som kan føre til meravkastning, kun ved bruk av klyngeresultater. Utgangspunktet til oppgaven baserer seg på datasett av fundamentale nøkkeltall hentet fra datakilden Thompson Reuters Eikon. Aksjene som er med i utvalget har antall analytikere på mer enn 1, i tillegg til at den daglig omsetningen er på over 10 millioner NOK. Oppgaven tar for seg hele prosessen fra behandling av datasett til analyse av resultater. Det blir diskutert forskjellige metoder og teorier som kan være nyttige for å håndtere problemene og utfordringene klyngeanalyse bringer med seg. Det har blant annet blitt et stort fokus på preprosessering av datasettene, da dette er en kritisk prosess for at en klyngeanalyse er gjennomførbar. Litteratur på klyngeanalyse fokuserer på viktigheten av preprosessering av datasett og hvor stor påvirkning dette kan ha på analysen. Oppgaven introduserer flere teorier og metoder knyttet til dette: Boksdiagram for identifisering av ekstremverdier, MICE-funksjon som en moderne imputeringsmetode for estimering av manglende verdier, normal standardisering for skalering av datasettet og flere R-pakker for effektivisering av arbeidet. For å svare på problemstillingene er oppgaven delt inn i to eksperimenter med en del likhetstrekk. Det første eksperimentet baserer seg på ett forsøk i tidsperioden 2018-2019. Det andre eksperimentet ser på hvordan den samme klyngeanalysen hadde prestert fra med ulike intervaller fra 2002-2017. Med både eksperiment 1 og 2 kan resultatdelen vise til en vellykket klynging med interessante resultater. Avslutningsvis identifiseres det fire metoder for å kunne velge klynge for best avkastning basert på plassering av klyngesentrum i de forskjellige analysene. Disse forskjellige klyngevalgene viser seg å prestere bedre enn en snittindeks av de nordiske børsene i Norge, Sverige, Danmark og Finland. Det kan være flere grunner til at klyngevalgene prestere bedre enn snittindeksen, og oppgaven konkluderer med at metodene for valg av klynge ikke kunne presentere grunnlag der de ulike metodene viser til signifikant meravkastning. Av den grunn er analytikerkravet og likviditetskravet logiske forklaring til at alle metodene presterte bedre enn snittindeksen. The aim of this bachelor thesis is to study the usage of cluster analysis on fundamental key figures of stocks in Nordic markets. The task is based on data obtained from the source Thompson Reuters Eikon. Stocks that are included in the analysis is required to have a daily turnover higher than 10 million NOK and have more than one analyst in the respective period. This resulted in a stock selection that varies between 180-300 stocks in a 1 year period from 2002 to 2018. Throughout the thesis, there are discussed different methods and theories that could be useful for dealing with problems and challenges that a cluster analysis brings. One of the challenges and one has been of major focus was the pre-processing of the different datasets, as this is a critical process for successful cluster analysis. The literature on cluster analysis focuses on the importance of pre-processing of datasets and how much of an impact this can have on the analysis. The thesis suggests several theories and methods related to this: Boxplot for identifying extreme values, MICE function as a modern imputation method for dealing with missing values, normal standardization for scaling the dataset and different R-packages for automating the processes. The results chapter refers to different successful cluster experiments with interesting results. However, the Dunn index which is used for validation of the analysis indicates that the clusters are not well separated. This is due to the stock market not being naturally clustered, but must be taken into consideration. The historical cluster results show a number of clusters between two and five, with different returns for each cluster. After the experiments were conducted the goal was to find a method for identifying the best cluster to pick for superior return. The analysis identifies four methods for selecting the cluster for the best return based on the location of each cluster center. Finally, it is found that the different methods for cluster selection all beat an average index of the Nordic markets. This, however, might be due to other factors and it was found that the methods did not have any significant results compared to the overall returns of the clusters. Therefore factors such as the liquidity requirements and the number of analysts, which was a big part of defining the stock universe used in the analysis, would logically be the reason as to why the methods performed better than the average index. |