University of Ulm , Faculty of Engineering and Computer Sciences, Institute of Theoretical Computer Science, Theoretical Bioinformatics Group

Entwicklung eines Software-Systems zum multiplen Genomvergleich

Projekt im DFG-Schwerpunkt

Informatikmethoden zur Analyse und Interpretation großer genomischer Datenmengen

Projektleiter

Prof. Dr. Enno Ohlebusch

Mitarbeiter

M.Sc. Eng. Mohamed Ibrahim Abouelhoda
Dipl.-Inf. Kathrin Hockel

Zuammenfassung

Die Kernmethode der vergleichenden Genomanalyse (comparative genomics) besteht aus dem Vergleich des Genoms eines Organismus mit dem eines oder mehrerer anderer Organismen (paarweiser bzw. multipler Vergleich). Durch Genomvergleiche versucht man u.a. herauszufinden, warum bestimmte Stämme eines Bakteriums resistent gegen Antibiotika oder pathogen sind, andere hingegen nicht. Diese Vergleiche werden erschwert durch die Größe der Datenmengen und die im Laufe der Evolution stattgefundenen Umstrukturierungen der Genome (genome rearrangements). Alle derzeit zur Verfügung stehenden Software-Werkzeuge zum Genomvergleich haben den Nachteil, dass sie auf den paarweisen Vergleich beschränkt sind und/oder nur einzelne Aufgaben unterstützen. Daher soll ein Software-System entwickelt werden, das mehrere eng verwandte Aufgaben eines multiplen Genomvergleichs effizient unterstützt. Als erstes sollen DNA bzw. Proteinsequenzen, die in allen Genomen konserviert wurden, schneller als bisher möglich identifiziert werden. Die gefundenen konservierten Regionen sollen dann die Grundlage zur Vorhersage von Genomumstrukturierungen, Genen und regulatorischen Elementen bilden. Dazu ist es notwendig, multiple Alignments dieser Regionen effizient berechnen zu können. Die u.U. sehr komplexe Ausgabe des Systems soll durch eine Visualisierungskomponente für den Anwender nutzbar gemacht werden.