Development of an bioinformatics software-tool for the analysis of molecular biological data of Fungal analysis

Autor: Stinzl, Rainer
Jazyk: němčina
Rok vydání: 2014
Předmět:
Popis: Diese Arbeit hatte zum Ziel ein Software-Tool zu entwickeln, mit dessen Hilfe die Auswertung molekularbiologischer Untersuchungen von Schimmelpilzen vereinfacht werden kann. Schimmelpilze sind der Domäne der Eukaryoten zuzurechnen und gehören zum Reich der Pilze (Fungi). Die Sammelbezeichnung Schimmelpilze fasst - historisch gewachsen - Arten verschiedener Familien zusammen, welche mit "pelzigem", meist farbigem Bewuchs Lebensmittel verderben. Schimmelpilze werden einerseits technologisch in der Lebensmittel- und Pharmaindustrie, der Land-, Abfall-, Umwelt- und der Energiewirtschaft genutzt und lösen andererseits schwere Allergien aus beziehungsweise verursachen manchmal bis zum Tode führende Mykosen. Die klassischen mikrobiologischen Bestimmungsmethoden werden in jüngster Zeit durch molekularbiologische Methoden, welche eine Identifizierung über die DNA-Sequenz verfolgen, ergänzt oder abgelöst, weil letztere zuverlässiger und schneller sind. Bei der molekularbiologischen Identifizierung wird ausgehend von einer Einzelkultur die DNA extrahiert. Anschließend werden geeignete DNA Abschnitte mit Primern(Oligonukleotide) markiert und in der Polymerase-Kettenreaktion (PCR) vervielfacht. Die DNA-Sequenz der erhaltenen PCR-Produkte wird über eine Sanger-Sequenzierung bestimmt. Diese Methode weist aber zu Beginn und am Ende des Kapillarelektrophorese-Laufes ungenügende Qualitäten auf. Die Zuordnung der entsprechenden Nukleotide aus dem Elektropherogramm ist in diesen Bereichen fehlerbelastet und muss durch manuelle Kürzung der Sequenz anhand der Qualitätswerte (Phred-Quality) korrigiert werden. Als letzter Schritt wird mittels Online BLAST-Suche im Web-Portal des NCBI (National Center for Biotechnology Information) gegen eine BLAST-Nukleotid-Datenbank gesucht und anhand der erhaltenen Trefferliste eine Identifizierung durchgeführt. Die zeitaufwendige Fehlerkorrektur und die Online-Suche sollten durch das bei dieser Arbeit entwickelte Software-Tool, welches RAST (Rainers Analyse Software Tool) benannt wurde, standardisiert und automatisiert werden. Unter Berücksichtigung der Prinzipien, Methoden und Modelle der Softwaretechnik wurde bei der Entwicklung des Tools mit der Definition der Vision, Ziele, Nichtziele, Anforderungen und Rahmenbedingungen im Prozess des "Requirements Engineering" begonnen. Die wichtigsten Ziele sind: Das Tool soll betriebssystemunabhängig sein (wurde mit Java erfüllt), über ein graphisches User Interface gesteuert werden, die Sequenzdaten einlesen können, eine automatische Qualitätsfilterung entweder in drei Stufen (Low, Normal, High) oder nach individuellen Vorgaben durchführen können, eine Online BLAST-Suche ausführen und das Ergebnis im Textformat ausweisen. Aus diesen erarbeiteten Definitionen konnten die Anwendungsfälle (Use Cases) abgeleitet werden, diese stellen das System aus der Anwendersicht dar und dienen als Basis für das nachfolgend erstelle dynamische und statische Modell. Das im letzten Schritt erstellte Programm konnte alle Forderungen zu 100 % erfüllen. The aim of this study was to create a Software-Tool that simplify the evaluation of molecular biological investigations of moulds. Moulds are classified to the domain of eukaryotes and belong to the kingdom fungi. The name mould, a historical developed collective term for a diverse number of fungal species of different families which taint food with furry, usually coloured vegetation. On the one hand moulds are used in the technological field of food industry, pharmaceutical industry, agriculture, waste industry, environmental economics and energy economics. On the other hand they can cause allergies and sometimes death leading mycoses. The conventional microbiological identification methods are recently extended or replaced by molecular biological methods. Molecular biological methods means the identification by DNA-sequence analysis. These methods are more reliable and faster than conventional methods. A normal workflow is as follows: separating a single colony  DNA extraction  select target DNA-region by primer (oligo-nucleotide) amplification  multiple copy of target DNA-region by Polymerase chain reaction (PCR)  Sanger-sequencing of PCR products. At the beginning and the end of the capillary electrophoresis run of Sanger-sequencing, the quality isn't as good as it should be for acceptable results. Therefore manual DNA-sequence trimming at these regions is necessary by using quality values (Phred-quality). The last step of identification is an online-BLAST-search at NCBI (National Center for Biotechnology Information)-Web-Service against the BLAST-nucleotide-database. The received hit-list can be used for identification. The time-consuming error correction and the online search should be standardized and automated by the developed software tool, which is named RAST (Rainers analysis software tool). Considering the principles, methods and models of software engineering, the tool developing started with the definition of the vision, goals, non-goals, requirements and general conditions in the process of requirements engineering. The most important goals are: operating system independent usage (complied by using Java), controlled via a graphical user interface, able to import sequence data, automatic quality filtering either in three levels (low, normal, high) or according to individual user specifications, able to execute an online-Blast-search and export the results in text format. From the above well defined specifications, use cases could be derived which represent the system from the user point of view. At this point the dynamic and static models could be designed. The last step was testing the program. The designed program could fulfill all requirements to 100 %. vorgelegt von: Rainer Stinzl Masterarbeit Wien, FH Campus Wien 2014
Databáze: OpenAIRE
načítá se...