Finding patterns in procurements and tenders using a graph database

Autor: Swords, Michael
Jazyk: angličtina
Rok vydání: 2019
Předmět:
Druh dokumentu: Text
Popis: Graph databases are becoming more and more prominent as a result of the increasing amount of connected data. Storing data in a graph database allows for greater insight into the relationships between the data and not just the data itself.An area that has a large focus on relationship is the area of public procurements. Relationships such as who created which procurement and who was the winner. The procurement data today can be very unstructured or inaccessible which means that there is a low amount of analysis available in the area. To make it easier to analyse the procurement market there is a need for a proficient way of storing the data. This thesis provides a proof of concept of the combination of public procurements and graph databases. A comparison is made between two models of different granularity, measuring both query speed and storage size. There has also been an exploration of what interesting patterns that can be extrapolated from the public procurement data using centrality and community detection.The result of the model comparison shows a distinct increase in query speed at the cost of storage size. The result of the exploration is several examples of interesting patterns retrieved using a graph database with public procurement data, which show the potential of graph databases.
Grafdatabaser blir mer och mer populära till följd av ökningen av väldigt sammankopplad data. Lagring av data i en grafdatabas möjliggör större insikt i förhållanden mellan data och inte bara uppgifterna i sig.Ett område som har fokus på relationer är offentliga upphandlingar. Relationer såsom vem som skapade en upphandling och vem som vann den. Det finns för närvarande ingen bästa praxis och ingen lättillgänglig analys i området. För att göra det enklare att analysera upphandlingsmarknaden behöver vi ett effektivt sätt att lagra uppgifterna. Det här arbetet har gjort ett koncepttest av hur man kan kombinera offentliga upphandlingar och grafdatabaser. Två databasmodeller med olika granularitet har jämförts, gällade frågehastighet och lagringsstorlek. Examensarbetet har även gjort en undersökning av vilka intressanta mönster som går att extrapolera från upphandlingsdata med hjälp av grafalgoritmer som detekterar centralitet och gemenskap mellan noder.Resultaten från modelljämförelsen visar en tydlig ökning av frågehastighet till kostnad av lagringsstorlek. Resultaten från utforskningen av sambanden är flera exempel på intressant extraktioner av mönster från en grafdatabas med offentlig upphandlings data
Databáze: Networked Digital Library of Theses & Dissertations