Data Retrieval Strategy for Modern Database Models in a Serverless Architecture
Autor: | Jonsson, Therese |
---|---|
Jazyk: | angličtina |
Rok vydání: | 2020 |
Předmět: | |
Druh dokumentu: | Text |
Popis: | The arising presence of social media platforms shapes modern system architectures to handle performance and scale. As user volumes increase, the need to keep data consistent and available at storage locations across the world adds complexity in distributed systems. The startup Leader Island has developed a communication platform for companies and organizations, using Amazon Web Services (AWS) as cloud provider to overcome operational concerns. Within their platform, users share various content and interact with each other. Data retrieval is an essential component in the platform, as the users should get various feeds and be able to search for specific content. For this functionality, Leader Island uses a combination of AWS Elasticsearch Service for data retrieval and Amazon DynamoDB for persistent storage. However, this setup has posed challenges within data models, mappings, and retrieval strategies. This project aims to find best practices for data models and mappings within both instances and to investigate in new data retrieval strategies to optimize the latencies of data retrieval. For this, three designs were configured with op- posing models and mappings. The results of each design were collected and measured against each other. Mainly, a design where data retrieval was distributed over both Elasticsearch and DynamoDB, incorporating DynamoDB best practices and a reduced data volume propagated to Elasticsearch, out-performed the initial platform design by a factor of 1.9 concerning platform latencies. Den stigande närvaron av sociala medier formar de moderna systemarkitekturerna för att hantera prestanda och skala. I takt med att användarvolymer ökar växer också behovet av att hålla data konsistent och tillgängligt i datacenter över hela världen, vilket adderar komplexitet i distribuerade system. Startupen Leader Island har utvecklat en kommunikationsplattform för företag och organisationer, nyttjandes Amazon Web Services (AWS) som molnleverantör för att reducera operativa utmaningar. På plattformen delar användarna innehåll och interagerar med varandra. Att hämta data är en viktig komponent i platt- formen, eftersom användarna laddar in olika flöden och ska kunna söka efter specifikt innehåll. För denna funktionalitet använder Leader Island en kom- bination av AWS Elasticsearch Service för datainsamling och Amazon DynamoDB för permanent lagring. Denna konstellation har inneburit utmaningar inom data-modeller, data-mappning och hämtningsstrategier. Det här projektet syftar till att hitta bästa praxis för data-modeller och data-mappningar i båda instanser, samt undersöka nya strategier gällande datainsamling för att optimera prestandan. För detta konfigurerades tre designer med motsatta data- modeller och data-mappningar. Resultaten av varje design samlades in och mättes mot varandra. I huvudsak visade en design fördel, där datainsamlingen distribuerades över både Elasticsearch och DynamoDB. DynamoDB modellerades där enligt bästa praxis, och en reducerad datavolym propagerades till Elasticsearch, vilket resulterade i en 1.9 gånger bättre prestanda än i den initiala designen. |
Databáze: | Networked Digital Library of Theses & Dissertations |
Externí odkaz: |