Titel

Vorhersage einer Genmutation aus DNA-Methylierungsprofilen

Beschreibung

Atypische teratoide/rhabdoide Tumoren (AT / RT) sind äußerst bösartige Hirntumoren, die vor allem bei Säuglingen und Kleinkindern auftreten. Die Ursachen für die Entstehung dieser Tumoren sind noch nicht vollständig geklärt. Bekannt ist jedoch, dass fast alle AT / RT eine Veränderung im SMARCB1-Gen‎ auf Chromosom‎ 22 aufweisen. Meist ist das veränderte SMARCB1-Gen nur in den Tumorzellen selbst nachweisbar, hervorgerufen durch eine spontane Mutation in einer Körperzelle. In bis zu 30 % aller Patienten sind allerdings auch die Zellen der Keimbahn‎ (Keimzellen‎) und somit alle Zellen des Körpers betroffen (Keimbahnmutation). Die rasche Detektion einer Keimbahnmutation ist für die weitere Behandlung der Patienten und genetische Beratung der Angehörigen äußerst relevant. Im Rahmen der neuropathologischen Diagnostik werden genom-weite DNA-Methylierungsprofile eingesetzt, mit deren Hilfe die Tumoren in 3 Subgruppen eingeteilt werden. Ziel des Projekts ist es, das Vorhandensein einer Keimbahnmutation anhand des DNA-Methylierungsprofils vorherzusagen.

Konkret liegt die Aufgabe im Bereich der Klassifikation. Clustering-Verfahren als unüberwachte Lernverfahren sind bereits ausgetestet worden und haben kein vielversprechendes Ergebnis geliefert. Der vorliegende Datensatz ist aber auch entsprechend annotiert. Damit besteht die Möglichkeit überwachte Lernverfahren einzusetzen.

Ziel der Abschlussarbeit ist es daher verschiedene Standard-Verfahren zum Lernen eines Klassifikators anzuwenden und auszuwerten. Darunter fallen die Verfahren Support Vector Machine, Regressions- / Entscheidungsbaum, Naive Bayes Classifier, und einfache neuronale Netze für eine Abschlussarbeit auf BA Level. Für eine Masterarbeit sollen aufwendigere Verfahren, die z.B. komplexere Netzstrukturen lernen, untersucht werden. Eine weitere Herausforderung ist, dass der Datensatz relativ klein, aber sehr hochdimensional ist. Eine Dimensionsreduktion in irgendeiner Form wird also auch eine Rolle spielen.

Die Arbeit wird am Institut für Informatik in Zusammenarbeit mit dem Institut für Neuropathologie am Universitätsklinikum Münster durchgeführt.

Vorkenntnisse

Grundkenntnisse in gängigen, einfachen ML-Verfahren sind hilfreich ebenso wie Programmierkenntnisse in Python.

Bearbeitung

  • Michael Bucks: einfache ML-Modelle (BA)
  • Thomas Tenberge: komplexere NN-Architekturen (MA)

Kontakt

Tanya Braun, tanya.braun@uni-muenster.de
Christian Thomas, christian.thomas@ukmuenster.de
Martin Hasselblatt, martin.hasselblatt@ukmuenster.de