Popis: |
De-novo sastavljanje genoma proces je temeljen na preklapanju i analizi kratkih genetskih očitanja. Uslijed raznolikih tehničkih izazova, određene vrste lažnih očitanja i preklapanja mogu također biti sintetizirane, što uvelike otežava is- pravno sastavljanje originalne sekvence. Jedna od metoda za otkrivanje takvih preklapanja je i pretvorba istih u 1D-signal, pomoću kojih se onda može jed- nostavnije zaključiti koji tip preklapanja predstavlja. U okviru ovog rada, pred- stavljeno je nekoliko metoda duboko učenja za klasifikaciju ovih signala, točnije 1D-konvolucijske mreže, povratne mreže, kao i primjena autoenkodera. Dodatno, prikazana je i njihova primjena na stvarnim podacima, kao i usporedba usp- ješnosti. The de novo genome assembly process is based on overlapping and analyzing short reads of genetic information. Due to various technical challenges, certain types of false overlaps can also be generated, which greatly impedes successful reconstruction. One of the methods for detecting such overlaps is by generating a 1D-signal for each read, which can then be used to determine its exact overlap type. This thesis proposes several deep learning methods for classifying these signals, including 1D-convolutional & recurrent networks, as well as autoencoders. A detailed comparison of their application on real-world data is also included. |