Popis: |
Tvrtka Pacific Bioscience 2019. godine predstavila je novu tehnologiju sekvenciranja visoko pouzdanih fragmenata koja kombinira koncepte korištene za sekvenciranje tradicionalnih kratkih i dugačkih očitanja s greškama. Visoko pouzdani fragmenti karakterizirani su velikom duljinom i visokom točnosnu. Činjenica da podatci imaju jako mali broj grešaka može se koristiti za osmišljavanje algoritama koji su manje osjetljivi na pogreške. U ovom radu predstavit ćemo algoritam za mapiranje visoko pouzdanih fragmenata. Algoritam koristi sufiksno polje i seed-chain-align proceduru. Analizirat ćemo performanse i točnost razvijenog alata i usporediti ga sa suvremenim algoritmima za mapiranje. In 2019, Pacific Bioscience introduced highly accurate long-read sequencing (HiFi sequencing), a paradigm that combines concepts from traditional short and long error-prone reads technologies. Long lengths and high base-level resolution characterize the HiFi fragments. These characteristics can be utilized to design algorithms that are less sensitive to errors. In this article, we present the novel algorithm for HiFi reads mapping. The algorithm is based on suffix arrays and a standard seed-chain-align procedure. We will analyze the performance and accuracy of the developed tool and compare it to state-of-the-art algorithms. |